全部标签

语音翻译

Gemini 3.5 Live Translate：Google 发布的新一代实时语音互译模型，支持 70 多种语言

Gemini 3.5 Live Translate 是 Google 发布的新一代实时语音互译模型，主打低延迟语音到语音翻译。该模型可自动识别 70 多种语言，在说话者持续讲话时同步生成翻译语音，并尽量保留原说话者的语调、语速和音高。它已开始接入 Google Translate、Gemini Live API、Google AI Studio 和 Google Meet 等产品，适合跨语言通话、…
AI模型
- 988
- 0
AIHub6月10日
谷歌发布 Gemini 3.5 Live Translate，支持 70 多种语言实时语音互译

谷歌发布实时语音互译模型 Gemini 3.5 Live Translate，支持 70 多种语言，可在说话过程中连续生成自然翻译语音，并接入 Google Translate、Gemini Live API 和 Google Meet。
AI资讯
- 1.9k
- 0
AIHub6月10日
Qwen3.5-LiveTranslate - 阿里通义千问推出的多语言实时同传模型

Qwen3.5-LiveTranslate-Flash 是阿里云通义千问团队发布的新一代多语言实时音视频同声传译模型，基于 Qwen3.5-Omni Thinker-Talker 架构。相比前代 Qwen3-LiveTranslate-Flash 实现全面升级：输入语种从 18 种提升至 60 种，输出音频语种从 10 种提升至 29 种，端到端字均延迟降至 2.8 秒。新增实时音色克隆（翻译后保…
AI模型
- 2.9k
- 0
AIHub5月20日
Step-Audio-2-mini：阶跃星辰开源的端到端语音大模型

Step-Audio 2 mini 是阶跃星辰发布的开源端到端语音大模型，采用统一架构实现语音理解、推理与生成，支持语音识别、跨语种翻译、情感解析与自然对话。
AI模型
- 2.7k
- 0
AIHub25年9月1日
米可智能 - 音视频语音翻译AI工具

由人工智能驱动的音视频语音翻译、音色定制的服务软件
AI视频工具
- 12.2k
- 0
米可智能24年1月24日