豆包AI
当前位置:首页>AI工具>AI训练模型>Kimi K2:月之暗面开源的万亿参数 MoE 架构基础模型

Kimi K2:月之暗面开源的万亿参数 MoE 架构基础模型

Kimi K2是什么?

Kimi K2 是月之暗面 Moonshot AI 推出的开源大型语言模型,采用 Mixture-of-Experts 架构,拥有总参数量达 1 万亿、32 B 激活参数,支持最长 128K 上下文长度,原生设计以实现“agentic intelligence”(自主任务执行与工具调用)。通过自研 MuonClip 优化器完成 15.5 T Token 的稳定训练,兼顾效率与性能,并在编程、推理、数学等多项 benchmark 上取得开源最高或接近领先商业模型的成绩,适用于构建具备推理和操作能力的智能 Agent 系统。

Kimi K2:月之暗面开源的万亿参数 MoE 架构基础模型

Kimi K2的主要特性

  • 超大规模 MoE 架构:采用1万亿参数的Mixture-of-Experts架构,单次激活参数达32B,实现高效推理与扩展性。
  • MuonClip 优化器:引入自研的 MuonClip 优化器,有效缓解大模型训练中的不稳定问题。
  • 原生工具调用能力:内建工具调用机制,支持代码执行、API交互等复杂任务的自主决策与执行。
  • 强化学习调优机制:通过仿真环境和RLHF训练优化工具使用效果,增强agent自主性与稳健性。
  • 强悍的任务表现:在编程、数学、推理等多个benchmark上超越同类开源模型,接近GPT-4水平。
  • 双模型版本支持:提供基础版(Base)和指令微调版(Instruct),满足研究与应用的不同需求。
  • 多样部署与兼容性:支持vLLM、TensorRT-LLM等主流推理引擎,并兼容OpenAI/Anthropic格式API调用。
  • 开源透明可控:以MIT变体协议开源权重和代码,支持社区参与和本地私有化部署。

Kimi K2的模型评测

在 SWE Bench Verified、Tau2、AceBench 等基准性能测试中,Kimi K2 均取得开源模型中的 SOTA 成绩,展现出在代码、Agent、数学推理任务上的领先能力。

Kimi K2:月之暗面开源的万亿参数 MoE 架构基础模型

如何使用Kimi K2 ?

1、开发者:Kimi K2 的 API 服务现已全面上线,支持最长 128K 上下文,具备更强的通用性与工具调用能力。计费方案如下:

  • 每百万输入 tokens:4 元
  • 每百万输出 tokens:16 元

Kimi K2 兼容 OpenAI 和 Anthropic 两种 API 格式,也可以与各类框架良好兼容。此外,全新升级的 ToolCall 能力,可以严格保障格式正确性,适用于复杂 Agent 任务。

2、普通用户:前往 kimi.com 或下载 Kimi App,立即与 Kimi K2 模型开启对话。

Kimi K2:月之暗面开源的万亿参数 MoE 架构基础模型
©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。 Trae