当前位置:首页>AI工具>AI大模型>abab 6.5-MiniMax稀宇科技发布的万亿参数MoE大 模型

abab 6.5-MiniMax稀宇科技发布的万亿参数MoE大 模型

abab 6.5是什么?

abab 6.5是国内 AI 初创企业 MiniMax 稀宇科技今日正式推出的 MoE 混合专家模型架构的系列大模型,核心能力开始接近 GPT-4、 Claude-3、 Gemini-1.5。

abab 6.5 系列包含两个模型:

  • abab 6.5:包含万亿参数,支持 200k tokens 的上下文长度;
  • abab 6.5s:与 abab 6.5 使用了同样的训练技术和数据,但是更高效,支持 200k tokens 的上下文长度,可以 1 秒内处理近 3 万字的文本。
abab 6.5

abab 6.5的核心能力测试

性能对比:在知识、推理、数学、编程、指令遵从等维度上,abab 6.5开始接近GPT-4、Claude-3、Gemini-1.5等世界上最领先的大语言模型。

大海捞针测试:在200k token内进行的测试中,模型需要在长文本中识别并准确回答一个无关的句子(针)。在891次测试中,abab 6.5均能正确回答。

如何使用abab 6.5?

abab 6.5 和 abab 6.5s 会滚动更新到 MiniMax 旗下的产品中,包括生产力产品海螺 AIMiniMax 开放平台上。如果有兴趣,大家可以去试试。

©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。
0 条回复
    暂无讨论,说说你的看法吧
error: