-
Xiaomi MiMo-V2-Omni:小米全模态 Agent 基座模型,图像视频音频文本统一理解
Xiaomi MiMo-V2-Omni 是小米 MiMo 团队发布的全模态 Agent 基座模型,将图像、视频、音频编码器融合进统一骨干网络,原生支持结构化工具调用、函数执行与 UI 定位。音频理解超越 Gemini 3 Pro,图像理解超越 Claude Opus 4.6,多模态 Agent 评测超越 Gemini 3 Pro 和 GPT-5.2,支持超过 10 小时连续音频理解,现已开放 AP…- 409
- 0
-
小米 MiMo-V2-Pro 正式发布:Agent 场景超越 Sonnet 4.6,API 定价仅为同级 1/5
2026年3月18日,小米正式发布旗舰 Agent 基座模型 Xiaomi MiMo-V2-Pro,总参数量超过 1T(激活参数 42B),支持 1M 超长上下文,采用创新 Hybrid Attention 混合注意力架构(比例 7:1),较上代 MiMo-V2-Flash 参数规模扩大约 3 倍。 在 Artificial Analysis 全球综合智能排行榜上,MiMo-V2-Pro 位列全球…- 1.2k
- 0
-
Xiaomi MiMo-V2-Pro:小米发布的最新旗舰 Agent 基座模型
Xiaomi MiMo-V2-Pro 是小米面向 Agent 时代发布的旗舰基座模型,总参数量超 1T(激活参数 42B),支持 1M 超长上下文,在 Artificial Analysis 全球综合智能榜单位列第八、国内第二。在 OpenClaw、Claude Code 等 Agent 框架中端到端任务完成能力整体超越 Sonnet 4.6,逼近 Opus 4.6,API 定价仅为同级的 1/5…- 3.8k
- 0
-
百川智能发布Baichuan2 Turbo系列API,或将替代行业大模型
12月19日,百川智能宣布开放基于搜索增强的Baichuan2-Turbo系列API,包含Baichuan2-Turbo-192K及Baichuan2-Turbo。在支持192K超长上下文窗口的基础上,还增加了搜索增强知识库的能力。- 2.2k
- 0
-
-
工作数字人WorkChat
工作数字人WorkChat,是成都明途科技公司自主开发的一个智能对话平台。提供包括:文档理解、知识问答、AI写作、图形绘制、行业报告等能力或服务,辅助政企、个人提高工作效率。- 4.6k
- 0
-
360 周鸿祎:大模型不是「原子弹」,而是「AK47」
7 月 23 日,在极客公园主办的 AGIPlayground 大会上,360 集团创始人,也是通过自研通用大模型「360 智脑」亲自下场,参与了本场大模型创业浪潮的周鸿祎给出了自己的答案。- 1.3k
- 0
-
CM3leon:可生成文本和图像的多模态大模型
CM3leon是Meta AI开发的一种大型语言模型,可生成文本和图像。它是一种自回归模型,这意味着它可以一次生成一个文本或图像的令牌或像素。这使它比其他仅以特定方式生成文本或图像的生成模型更具通用性。- 4.8k
- 0









