MiMo-V2.5-Pro是什么
MiMo-V2.5-Pro 是小米 Xiaomi MiMo 团队于 2026 年 4 月 27 日发布的开源 Agent 旗舰大模型,被官方描述为"在 agentic 能力与长程连贯性上的一次跃迁",是 MiMo 团队迄今为止最强的模型。模型采用 1.02T 总参 / 42B 激活的稀疏 MoE 架构,预训练消耗 27T tokens 的 FP8 混合精度算力,原生 32K 序列长度后扩展至 1M tokens 上下文。架构上继承 MiMo-V2-Flash 的混合注意力(局部 SWA 与全局 GA 以 6:1 比例交错,128 滑动窗口)与 3 层 Multi-Token Prediction(MTP)模块。专为复杂软件工程与长程任务而设计,可稳定支撑单次超过千轮的工具调用,在多项 Agent 基准上以显著更低的 token 成本逼近 Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro 等顶级闭源模型。

Xiaomi MiMo-V2.5-Pro 的模型特性
- 旗舰级 Agent 能力:面向复杂智能体任务优化,强调长程规划、多步骤执行和工具调用一致性。
- 复杂软件工程能力:适合代码生成、项目构建、Bug 修复、代码审查、工程重构和自动化开发任务。
- 超长任务执行:可支持长时间、多轮次、多工具调用的复杂任务,在长上下文中保持较强连贯性。
- 1.02T MoE 架构:采用 1.02T 总参数、42B 激活参数的混合专家架构,面向高难度推理和工程任务。
- 1M 上下文窗口:支持最高 100 万 tokens 上下文,适合大型代码库、长文档和复杂 Agent 轨迹。
- 开发工具链适配:可与 Claude Code、OpenCode、Kilo 等开发与 Agent 工具链结合,用于构建更复杂的自动化工作流。
- 开放模型资源:模型权重、tokenizer 和模型卡已开放,方便研究者和开发者部署、评估与二次开发。
MiMo-V2.5-Pro的应用场景
- 复杂软件工程: 编译器开发、大型代码库重构、多语言编程、调试与性能优化等长程编程任务,可独立完成数天乃至数周量级的工程交付。
- 长程 Agent 与 Harness 协同: 适合搭配 Claude Code、OpenCode、Kilo 等支持 OpenAI 兼容协议的 Agent harness,承载千轮级工具调用任务。
- 专业领域闭环验证: 在带模拟器/编译器的闭环 harness 环境中自主完成科研工程任务,如模拟电路 EDA(FVF-LDO 等 LDO 设计)、编译器构建等。
- 企业级 Coding 助手: 内嵌到 IDE 或代码托管平台,提供 repo 级理解、项目构建、代码 review、SWE 任务执行。
- 企业 API 接入: 通过 Xiaomi MiMo API 开放平台对接业务系统,OpenAI 兼容协议接入。
- 集群级私有化部署: 基于开源权重在企业算力集群部署,原生支持 SGLang、vLLM 推理框架。
MiMo-V2.5-Pro的产品定价
通过 Xiaomi MiMo API 开放平台付费调用,定价于 2026 年 5 月 27 日起永久下调,新定价相比原 API 价格最高降幅 99%,且不再区分上下文窗口长度。
| 计费模式 | 说明 |
|---|---|
| 按量计费(API) | 永久降价后按 token 实际消耗计费,具体单价以官网为准 |
| Token Plan 订阅 | 1 Token = 2 Credits(2x),不再区分上下文窗口 |
| 夜间优惠 | 北京时间 00:00–08:00 Credits 消耗速率 0.8 倍 |
| 连续包月 / 包年 | 支持自动续费,年付 88 折 |
| 开源版本 | 从 HuggingFace 免费下载权重,自行部署无 API 费用,MIT 协议商用 |
具体单价以 Xiaomi MiMo API 开放平台 公布的最新价目为准。
如何使用MiMo-V2.5-Pro
- Web 端体验: 访问 https://aistudio.xiaomimimo.com 注册登录,模型选择 MiMo-V2.5-Pro 即可对话。
- API 接入: 访问 https://platform.xiaomimimo.com 注册开发者账号,创建 API Key,调用接口兼容 OpenAI 格式,模型 ID 填
mimo-v2.5-pro。 - 私有化部署: 从 https://huggingface.co/XiaomiMiMo/MiMo-V2.5-Pro 下载开源权重,按官方推荐使用 SGLang 或 vLLM 推理引擎启动服务(企业级集群环境)。
- Token Plan 订阅: 在 API 开放平台购买月度或年度 Token Plan 订阅,按 Credits 计费消耗,1 Token = 2 Credits。
- Agent Harness 集成: 在 Claude Code、OpenCode、Kilo 等支持 OpenAI 兼容协议的 Agent harness 中将 endpoint 切到 MiMo 平台,V2.5-Pro 在 harness 协同场景下表现最佳。
常见问题
Q:MiMo-V2.5-Pro 是开源的吗?可以商用吗?
A:是。MiMo-V2.5-Pro 与对应的 Base 版本均已在 HuggingFace 全量开源,采用 MIT 协议,允许商业使用、修改与再分发。
Q:MiMo-V2.5-Pro 和 MiMo-V2.5 是什么关系?
A:两款是同系列下面向不同任务的两条独立线,不是同一模型的大小档。MiMo-V2.5-Pro 是纯文本/代码的长程 Agent 旗舰,没有原生多模态能力,但在千轮级工具调用与软件工程任务上能力更强;MiMo-V2.5 主打原生全模态能力,单模型即支持文本、图像、视频、音频,token 效率更高。重度长程 Agent 与复杂软件工程 → V2.5-Pro;需要看图听音的多模态业务 → V2.5。
Q:MiMo-V2.5-Pro 是多模态模型吗?
A:不是。MiMo-V2.5-Pro 是纯文本/代码 Agent 旗舰,没有原生视觉、音频理解能力。如果业务需要多模态,请使用同系列的 MiMo-V2.5。
Q:和 Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro 等顶级闭源 Agent 模型相比怎么样?
A:按官方公布的 ClawEval 测试结果,MiMo-V2.5-Pro 在 64% Pass^3 水平上每条 trajectory 约消耗 70K tokens,相比上述三款顶级闭源模型在同等能力上少消耗 40–60% token,性价比优势显著。同时具备 MIT 协议开源、可商用与私有化部署的核心差异化。
Q:和 DeepSeek-V4 系列、Kimi K2 等其他国产开源大模型相比有什么差异?
A:在 SWE-Bench Pro、Terminal-Bench 2.0、GraphWalks 1M 等 Agent 与长上下文专项基准上 MiMo-V2.5-Pro 有明显领先。此外 token 效率与 1M 长上下文下的实际可用性也是核心差异点。
Q:国内可以直接使用吗?
A:可以。Xiaomi MiMo API 开放平台与 MiMo Studio 在国内直接可用,无需额外网络环境,国产主流芯片首日深度适配。
Q:本地部署需要什么硬件?
A:MiMo-V2.5-Pro 总参 1.02T、激活 42B,对显存与算力要求很高,更适合企业级 GPU 集群环境。具体硬件配置参考官方 SGLang / vLLM 部署文档。
AIHub点评
Xiaomi MiMo-V2.5-Pro 是小米 MiMo 系列中更偏旗舰定位的一款 Agent 与软件工程模型。它的亮点不只是参数规模更大,而是将能力重点放在复杂工程任务、长程工具调用和高一致性任务执行上。对于普通用户来说,MiMo-V2.5-Pro 可能不是最经济的日常对话选择;但对于开发者、研发团队和 Agent 应用构建者来说,它更适合作为高难度代码任务和长周期自动化任务的模型底座。与 MiMo-V2.5 形成互补后,小米 MiMo-V2.5 系列已经具备较完整的“多模态理解 + 复杂 Agent 执行”组合能力。
©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。

