全部标签

Gemini Omni

Google 发布 Gemini Omni：从“理解世界”走向“生成世界”的全新多模态模型

Google 在 I/O 2026 上发布 Gemini Omni 多模态模型家族，首发版本 Omni Flash 支持文本、图片、视频和音频输入生成视频内容，并已接入 Gemini App、Google Flow 和 YouTube Shorts，代表 AI 视频模型向全模态生成方向演进。
AI资讯
- 1.3k
- 0
AIHub5月20日
Gemini Omni - Google 推出的统一多模态 AI 模型，任意输入生成视频并支持对话式编辑

Gemini Omni 是 Google DeepMind 于 Google I/O 2026 发布的统一多模态模型系列，核心能力是从任意输入（文本、图像、音频、视频）创造任意输出，首发方向为视频生成与对话式视频编辑。该模型将 Gemini 的推理智能与生成媒体模型结合，能模拟真实物理世界、理解历史文化科学背景，并通过自然语言对话实现多轮视频编辑（背景替换、风格迁移、角色调整等），每次编辑在前一次…
AI模型
- 4k
- 0
AIHub5月20日