讯飞智文
当前位置:首页>AI工具>AI训练模型>Qwen3:阿里巴巴最新开源的混合推理大模型

Qwen3:阿里巴巴最新开源的混合推理大模型

Qwen3是什么?

Qwen3 是阿里巴巴推出的新一代混合推理大模型,支持119种语言,具备强大的推理、编码和智能体能力。它引入了“思考模式”和“快速响应模式”双模式切换,能根据任务灵活调节推理深度。Qwen3发布了多种规模的开源模型,旗舰版Qwen3-235B-A22B在多个领域性能达到业界顶尖,广泛应用于自然语言理解、复杂推理、代码生成等场景。

Qwen3:阿里巴巴最新开源的混合推理大模型

Qwen3的主要特点

  • 混合推理模型
    • 2款混合专家(MoE)模型:包含 30B(3B激活)和 235B(22B激活)。
    • 6款稠密模型(Dense):包含 0.6B、1.7B、4B、8B、14B 和 32B 。
  • 多种思考模式:
    • 思考模式:在这种模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法非常适合需要深入思考的复杂问题。
    • 非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。
  • 多语言支持:Qwen3支持119种语言和方言,相比Qwen2的29种语言,语言能力大幅提升。
  • 增强的 Agent 能力:强化了代码生成、调用外部工具(MCP协议)等能力,提升智能体交互与决策水平。
  • 显著增强的推理能力:在数学、代码生成和常识逻辑推理方面超越了之前的 QwQ(在思考模式下)和 Qwen2.5 指令模型(在非思考模式下)。
  • 卓越的人类偏好对齐,在创意写作、角色扮演、多轮对话和指令跟随方面表现出色,提供更自然、更吸引人和更具沉浸感的对话体验。

Qwen3的性能评测

旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,超过了 671B 的 DeepSeek R1。

Qwen3:阿里巴巴最新开源的混合推理大模型

对于小一点的 MoE 模型:Qwen3-30B-A3B,其激活量只有 QwQ-32B 的 10%,其表现超过 DeepSeek V3/GPT-4o

Qwen3:阿里巴巴最新开源的混合推理大模型

如何使用Qwen3?

Qwen3系列全部模型均开源,遵循 Apache 2.0 协议。

©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。 Trae
0 条回复 A文章作者 M管理员
    暂无评论内容
error: