谷歌发布 Gemini 3.5 Live Translate，支持 70 多种语言实时语音互译

2026 年 6 月 9 日，谷歌正式发布实时语音互译模型 Gemini 3.5 Live Translate，面向跨语言对话、会议、课程、直播和通话等场景提供近实时语音到语音翻译能力。

据谷歌介绍，Gemini 3.5 Live Translate 可自动识别 70 多种语言，并生成自然流畅的翻译语音，同时尽量保留原说话者的语调、语速和音高。不同于传统“说完一句再翻译一句”的轮流式翻译系统，该模型可以在语音流输入过程中连续生成翻译内容，在等待上下文提升翻译质量和尽快输出以跟上说话节奏之间取得平衡，使翻译音频通常只比原始语音慢几秒。

Gemini 3.5 Live Translate 已开始接入谷歌多款产品。开发者可通过 Gemini Live API 和 Google AI Studio 使用公开预览版，企业用户可在 Google Meet 中体验私有预览版，普通用户则可通过 Android 和 iOS 版 Google Translate 使用相关实时翻译功能。

在实际应用上，该模型可用于多语言电话、在线会议、课堂教学、直播转播、广播内容和旅行交流等场景。谷歌还表示，Gemini 3.5 Live Translate 具备一定抗噪能力，能够适应更复杂的真实声音环境。对于 Android 用户，谷歌还将推出新的“聆听模式”，用户可像接电话一样把手机贴近耳边，通过听筒收听翻译语音。

值得注意的是，谷歌表示该模型生成的音频会嵌入 SynthID 水印，用于帮助识别 AI 生成音频。随着实时语音模型进入翻译、会议和通话场景，跨语言交流正在从“文本翻译”进一步走向更自然的“实时语音同传”体验。

谷歌发布 Gemini 3.5 Live Translate，支持 70 多种语言实时语音互译

豆包 - 字节跳动旗下免费AI智能助手

Updream - B站推出的专业级 AI 视频创作平台

千问 - 阿里旗下 AI 智能助手

LibTV - LiblibAI 推出的 AI 视频创作平台，剧本分镜成片一站式完成

TRAE编程 - 字节跳动推出的AI代码助手

笔灵AI论文写作 - 专业AI论文写作平台

Claude Opus 5 - Anthropic 推出的新一代 Opus 旗舰模型

Qwen-Image-3.0：通义千问推出的第三代图像生成基础模型

Qwen-Audio-3.0-TTS：阿里推出的新一代实时语音合成大模型

切问学术 - 复旦出品的学术版 Codex，从找 idea 到跑实验，一句话全自动

Kimi K3 - 月之暗面推出的2.8万亿参数开源多模态旗舰模型

小橡皮 - 内容去AI味与发布风险检测工具

Gemini 3.5 Live Translate：Google 发布的新一代实时语音互译模型，支持 70 多种语言

谷歌即将发布对话式人工智能软件Gemini 挑战OpenAI的GPT-4

谷歌推出新 AI 工具 Imagen Editor，一句话对图片二次创作

腾讯推出 QClaw，全能电脑 AI 助手开启内测