2025年6月17日,中国人工智能公司 MiniMax(稀宇科技)今日正式发布开源推理大模型 MiniMax-M1,号称为“全球首个开源大规模混合架构推理模型”,具备高性价比与强大性能,向生产力复杂场景全面进军。
M1 模型拥有高达 4560亿参数(456B),支持 最长100万 Token 的上下文输入,并实现了 业内最长的 8 万 Token 推理输出,效率远超国内外多个同类模型。其基于创新的“闪电注意力机制”及自研强化学习算法 CISPO,使训练效率提升一倍,仅用512块 H800 GPU、历时3周便完成训练,总成本不到54万美元。
在17项主流评测中,M1 在软件工程、长文本理解与工具使用等生产力任务中表现尤为出色,部分能力甚至超越 OpenAI o3 与 Claude 4 Opus,仅次于 Gemini 2.5 Pro。

同时,MiniMax 官方宣布该模型现已通过 Hugging Face 和 GitHub 完整开源,且在 MiniMax App/Web 端及 API 平台提供极具竞争力的免费与低价访问政策,进一步推动大模型普惠化落地。
