2025 年 11 月 20 日,Google DeepMind 正式推出其新一代图像生成与编辑模型——Nano Banana Pro(也被标识为 Gemini 3 Pro Image),旨在将用户的创意直接转化为“工作室级别”的视觉资产。
这一版本承接此前爆红的 Nano Banana 系列(Gemini 2.5 Flash Image),但向前迈出了关键一步:融合更强的 “世界知识理解”、清晰可读的多语言文本渲染、最高达 4K 的分辨率输出,以及多图融合与一致性维持功能。

亮点功能
- 将文本直接、准确地融入图像中,多语言支持,适用于海报、包装、招贴等场景。
- 支持多达 14 张参考图片融合、最多 5 个角色一致性保持,便于品牌、角色设定及多元素聚合场景。
- 可根据实时网络数据(如天气、体育、流程图数据)生成结构化视觉内容,提升“知识型”图像的准确性。
- 输出最高支持 4K 及多种长宽比格式,涵盖专业广告、UX 布局、影视分镜等生产级场景。
- 内置透明化机制:生成图像附带 C2PA 元数据与 SynthID 水印,增强原创性与责任归属。
推出方式与适用对象
Nano Banana Pro 已整合至 Gemini App(用户端)、Google Slides/Vids 与 NotebookLM 等工具,并通过 Vertex AI 和 Google AI Studio 向企业与开发者开放。
免费试用已在多个国家/地区推出,付费订阅用户可获得更高额度与商业授权支持。
行业意义
这一版本不仅加强了创意输出的“美感”,更强调了“内容可用性”。例如,品牌可快速生成多语言、本地化视觉素材;教育、科研机构可将复杂数据直接转化为图解;设计师/广告团队亦可在短时间内批量产出高质量视觉资产。业内分析认为,AI 图像工具正从娱乐/尝鲜阶段进入“生产级”阶段。
©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。



