-
Gemini Omni - Google 推出的统一多模态 AI 模型,任意输入生成视频并支持对话式编辑
Gemini Omni 是 Google DeepMind 于 Google I/O 2026 发布的统一多模态模型系列,核心能力是从任意输入(文本、图像、音频、视频)创造任意输出,首发方向为视频生成与对话式视频编辑。该模型将 Gemini 的推理智能与生成媒体模型结合,能模拟真实物理世界、理解历史文化科学背景,并通过自然语言对话实现多轮视频编辑(背景替换、风格迁移、角色调整等),每次编辑在前一次…- 24
- 0
-
Gemini 3.5 Flash - Google 发布的高速前沿模型,编程与 Agent 能力超越上代 Pro
Gemini 3.5 Flash 是 Google 发布的 Gemini 3.5 家族首发模型,编程与 Agent benchmark 超越 3.1 Pro,4 倍速度,100 万 token 上下文,已全线上线。在 AIHub 了解更多。- 244
- 0



