即梦AI视频
当前位置:首页>AI资讯>谷歌发布 Gemini 3.5 Live Translate,支持 70 多种语言实时语音互译

谷歌发布 Gemini 3.5 Live Translate,支持 70 多种语言实时语音互译

2026 年 6 月 9 日,谷歌正式发布实时语音互译模型 Gemini 3.5 Live Translate,面向跨语言对话、会议、课程、直播和通话等场景提供近实时语音到语音翻译能力。

谷歌发布 Gemini 3.5 Live Translate,支持 70 多种语言实时语音互译

据谷歌介绍,Gemini 3.5 Live Translate 可自动识别 70 多种语言,并生成自然流畅的翻译语音,同时尽量保留原说话者的语调、语速和音高。不同于传统“说完一句再翻译一句”的轮流式翻译系统,该模型可以在语音流输入过程中连续生成翻译内容,在等待上下文提升翻译质量和尽快输出以跟上说话节奏之间取得平衡,使翻译音频通常只比原始语音慢几秒。

Gemini 3.5 Live Translate 已开始接入谷歌多款产品。开发者可通过 Gemini Live API 和 Google AI Studio 使用公开预览版,企业用户可在 Google Meet 中体验私有预览版,普通用户则可通过 Android 和 iOS 版 Google Translate 使用相关实时翻译功能。

在实际应用上,该模型可用于多语言电话、在线会议、课堂教学、直播转播、广播内容和旅行交流等场景。谷歌还表示,Gemini 3.5 Live Translate 具备一定抗噪能力,能够适应更复杂的真实声音环境。对于 Android 用户,谷歌还将推出新的“聆听模式”,用户可像接电话一样把手机贴近耳边,通过听筒收听翻译语音。

值得注意的是,谷歌表示该模型生成的音频会嵌入 SynthID 水印,用于帮助识别 AI 生成音频。随着实时语音模型进入翻译、会议和通话场景,跨语言交流正在从“文本翻译”进一步走向更自然的“实时语音同传”体验。

豆包AI助手
©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。