-
通义千问推出新一代语音识别模型 Qwen3-ASR-Flash
2015年9月8日,阿里旗下通义千问团队正式发布最新语音识别模型 Qwen3-ASR-Flash。该模型基于 Qwen3 底座训练,结合千万小时级别的多模态与 ASR 数据,主打高精度与高鲁棒性,支持 11 种语言及多种方言,并在中英文及多语种基准测试中取得领先成绩。 Qwen3-ASR-Flash 最大亮点在于 支持上下文定制与歌声识别。用户可输入关键词、段落或整篇文档作为背景提示,模型将智能匹…- 719
- 0
-
Qwen3-ASR-Flash:阿里通义千问最新推出的语音识别模型
Qwen3-ASR-Flash 是通义千问系列最新语音识别模型,基于 Qwen3 底座与千万小时级 ASR 训练,支持 11 种语言与多方言,提供上下文定制与歌声识别,具备语种识别、非人声拒识与强鲁棒性,适配多噪声与长难句场景。- 947
- 0
-
声动视界:AI视频工具,支持视频翻译、视频配音和文本转语音等
声动视界面向带货短视频,支持视频翻译、文本转语音、视频配音功能,有大量高品质适合带货口播的音频,支持100+语言翻译,AI让你快速找到全世界的买家。- 2.7k
- 0
-