-
Qwen3.5-LiveTranslate - 阿里通义千问推出的多语言实时同传模型
Qwen3.5-LiveTranslate-Flash 是阿里云通义千问团队发布的新一代多语言实时音视频同声传译模型,基于 Qwen3.5-Omni Thinker-Talker 架构。相比前代 Qwen3-LiveTranslate-Flash 实现全面升级:输入语种从 18 种提升至 60 种,输出音频语种从 10 种提升至 29 种,端到端字均延迟降至 2.8 秒。新增实时音色克隆(翻译后保…- 1.2k
- 0
-
Step-Audio-2-mini:阶跃星辰开源的端到端语音大模型
Step-Audio 2 mini 是阶跃星辰发布的开源端到端语音大模型,采用统一架构实现语音理解、推理与生成,支持语音识别、跨语种翻译、情感解析与自然对话。- 2.4k
- 0
-





