扣子Coze
当前位置:首页>AI模型>MiniMax M2.7 - MiniMax 最新发布的旗舰大语言模型,具备自我进化能力

MiniMax M2.7 - MiniMax 最新发布的旗舰大语言模型,具备自我进化能力

MiniMax M2.7 是什么

MiniMax M2.7 是 MiniMax 最新发布的旗舰大语言模型,也是首个深度参与自身迭代过程的 MiniMax 模型。M2.7 能够自行构建复杂 Agent Harness,通过自主迭代循环优化自身表现。在三大核心方向上达到国际一线水准:软件工程 SWE-Pro 得分 56.22%,接近 Opus 最佳水平;专业办公 GDPval-AA ELO 得分 1500,为开源最高;OpenClaw 生态适配 MM-Claw 得分 62.7%,接近 Sonnet 4.6。现已通过 MiniMax Agent 产品端与 API 开放平台全量上线,面向开发者和企业用户开放调用。

MiniMax M2.7

MiniMax M2.7 的模型特性

  • 模型自我进化: 首个深度参与自身迭代的 MiniMax 模型,可自主构建 Agent Harness,驱动强化学习循环,在内部评测集上自主迭代超过 100 轮,效果提升 30%
  • 软件工程全链路: 覆盖日志分析与 Bug 定位、代码重构、代码安全、机器学习、安卓开发等方向;支持生产环境故障三分钟内恢复;原生支持 Agent Teams 多智能体协作开发
  • 专业办公交付: 对 Word、Excel、PPT 复杂编辑能力显著提升,支持基于模板和 Skills 直接生成文件,也支持多轮交互对已有文件进行高保真编辑,输出可直接进入工作流的成果物
  • OpenClaw 生态深度适配: 在 40 个复杂 Skills(单个超过 2000 Token)的测试中保持 97% 的遵循率;MM-Claw 评测得分 62.7%,相比上代 M2.5 有显著提升
  • 人设保持与互动娱乐: 具备稳定的角色身份锚定能力,可在复杂状态机中主动决策、挑战对话逻辑;配套开源互动框架 OpenRoom(openroom.ai),支持实时视觉反馈与场景交互

MiniMax M2.7 的应用场景

  • AI 编程助手与研发工具: 接入 IDE 或研发平台,承担代码生成、Bug 定位、日志分析、代码安全审查等任务,覆盖从单函数补全到端到端完整项目交付的全链路,在生产环境故障排查场景下可将恢复时间压缩至三分钟内
  • 复杂 Agent 应用开发: 作为 Agent 框架的底层模型,处理多步骤任务规划、长程指令遵循和复杂 Skills 调用,在超过 2000 Token 的复杂 Skill 场景下仍保持 97% 的遵循率,适合构建需要稳定执行复杂工作流的 Agent 产品
  • 多智能体系统(Agent Teams): 利用原生 Agent Teams 能力构建多角色协作系统,不同 Agent 分别承担产品、研发、测试等职能,适合需要多 Agent 并行分工、相互校验的复杂业务场景
  • 办公文档自动化处理: 接入企业办公系统,基于模板和 Skills 自动生成或多轮编辑 Word、Excel、PPT 文件,输出可直接进入下游工作流的成果物,适合报告生成、数据整理、演示文稿制作等高频办公场景
  • 金融与专业知识密集型应用: 构建需要跨文档信息整合、专业推理和结构化输出的垂直行业应用,如研报分析、营收建模、投资摘要生成等,M2.7 在 GDPval-AA 专业办公评测中 ELO 得分 1500,为开源最高
  • 互动娱乐与 AI 角色产品: 利用 M2.7 强化的人设保持和情商能力,开发具有稳定人格、主动性和场景感知能力的 AI 角色产品,结合开源框架 OpenRoom 构建实时可视化互动体验

MiniMax M2.7 的产品定价

  • MiniMax Agent: 通过 agent.minimaxi.com 直接使用,具体套餐以官网为准
  • API 服务: 通过 platform.minimaxi.com 调用,按 Token 计费,具体价格以开放平台为准
  • Coding Plan 订阅: platform.minimaxi.com/subscribe/coding-plan,面向软件工程场景的专项订阅方案

如何使用 MiniMax M2.7

  1. 产品端体验: 访问 agent.minimaxi.com,注册登录后即可直接与 M2.7 对话,体验 Agent 任务交付、多智能体协作和专业办公能力
  2. API 调用: 在 platform.minimaxi.com 注册开发者账号,获取 API Key 后按文档接入,适合开发者和企业自建 AI 应用
  3. OpenClaw 接入: 在 OpenClaw 等 Agent 平台的模型设置中选择 MiniMax M2.7 作为底层模型,即可享受其高 Skills 遵循率和复杂任务处理能力
  4. OpenRoom 体验: 访问 openroom.ai 体验互动娱乐框架,或前往 github.com/MiniMax-AI/OpenRoom 获取开源代码自行部署

常见问题

Q:M2.7 和上一代 M2.5 相比有哪些核心提升?

A:三个方向提升最为显著:一是 OpenClaw 生态适配,MM-Claw 评测得分从 M2.5 有显著提升,接近 Sonnet 4.6;二是专业办公,对 Word/Excel/PPT 的复杂编辑和多轮高保真修改能力大幅增强;三是新增模型自我进化能力,M2.7 是首个能深度参与自身迭代循环的 MiniMax 模型。

Q:M2.7 在 OpenClaw 里用起来效果怎么样?

A:官方基于 OpenClaw 常用任务构建了专项评测集 MM-Claw,M2.7 得分 62.7%,接近 Sonnet 4.6 水平。在 40 个复杂 Skills 测试中保持 97% 的遵循率,对长上下文、多步骤任务的稳定性表现较好。

Q:M2.7 适合用来写代码吗?

A:适合,且不只是代码生成。M2.7 在真实软件工程场景(SWE-Pro 56.22%、VIBE-Pro 55.6%)表现接近 Opus,覆盖从代码生成、Bug 排查到完整项目交付的全链路,尤其擅长生产环境故障调试和日志分析。

Q:OpenRoom 是什么?

A:OpenRoom 是 MiniMax 配套发布的互动娱乐开源框架,将 AI 互动置入可视化 Web GUI 空间,支持实时场景交互和角色主动行为,已开源在 github.com/MiniMax-AI/OpenRoom,可访问 openroom.ai 直接体验。

产品点评

亮点: M2.7 最值得关注的是"模型自我进化"这一设计——让模型深度参与自身迭代循环,在内部测试中自主运行超过 100 轮后效果提升 30%,这在国内大模型中尚属首次公开披露的实践。软件工程能力接近 Opus 水平、专业办公 GDPval-AA 开源最高、OpenClaw 生态 97% Skills 遵循率,三个维度的基准数据均有具体支撑,可信度较高。对 OpenClaw 用户来说,M2.7 是目前国内模型里适配最好的选项之一。

©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。 豆包AI助手