全部标签

语音识别

通义千问推出新一代语音识别模型 Qwen3-ASR-Flash

2015年9月8日，阿里旗下通义千问团队正式发布最新语音识别模型 Qwen3-ASR-Flash。该模型基于 Qwen3 底座训练，结合千万小时级别的多模态与 ASR 数据，主打高精度与高鲁棒性，支持 11 种语言及多种方言，并在中英文及多语种基准测试中取得领先成绩。 Qwen3-ASR-Flash 最大亮点在于支持上下文定制与歌声识别。用户可输入关键词、段落或整篇文档作为背景提示，模型将智能匹…
AI资讯
- 5.6k
- 0
AIHub25年9月9日
Qwen3-ASR-Flash：阿里通义千问最新推出的语音识别模型

Qwen3-ASR-Flash 是通义千问系列最新语音识别模型，基于 Qwen3 底座与千万小时级 ASR 训练，支持 11 种语言与多方言，提供上下文定制与歌声识别，具备语种识别、非人声拒识与强鲁棒性，适配多噪声与长难句场景。
AI模型
- 4.2k
- 0
AIHub25年9月9日
声动视界：AI视频工具，支持视频翻译、视频配音和文本转语音等

声动视界面向带货短视频，支持视频翻译、文本转语音、视频配音功能，有大量高品质适合带货口播的音频，支持100+语言翻译，AI让你快速找到全世界的买家。
AI视频工具
- 4.7k
- 0
康24年11月13日
Notta：高效智能的音频转文字工具

Notta是一个功能强大的文字转写工具，旨在帮助用户节省时间，提高工作效率，并确保信息的准确性和完整性。
AI音频
- 17.4k
- 0
AIHub23年12月12日