阿里云发布通义千问2.5，声称性能全面赶超GPT-4 Turbo

5月9日消息，阿里云正式发布了通义千问2.5，模型性能全面赶超GPT-4 Turbo，声称地表最强中文大模型。

据了解，通义千问2.5最新开源的1100亿参数模型在多个基准测评中均取得了最佳成绩，成功超越了Meta的Llama-3-70B模型，成为开源领域的新标杆。

相比通义千问2.1版本，通义千问2.5在上述四项能力上分别提升了9%、16%、19%和10%，其中中文能力更是持续领先业界。

在权威基准OpenCompass上，通义千问2.5的得分追平了GPT-4 Turbo，这是该基准首次有国产大模型取得如此出色的成绩。这一成绩不仅证明了通义千问2.5在中文语境下的卓越性能，也展示了阿里云在人工智能领域的创新能力。

除了通义千问2.5外，阿里云还发布了最新款开源模型Qwen1.5-110B。这款拥有1100亿参数的模型在MMLU、TheoremQA、GPQA等基准测评中均超越了Meta的Llama-3-70B模型，并在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上荣登榜首，进一步巩固了通义开源系列在业界的领先地位。

通义的多模态模型和专有能力模型也展现出了业界顶尖的影响力。其中，通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越了Gemini Ultra和GPT-4V，目前已在多家企业落地应用，为各行各业带来了实质性的帮助。

此外，通义千问代码大模型CodeQwen1.5-7B也是值得一提的亮点。这款模型在HuggingFace代码模型榜单Big Code上位居前列，同时还是国内用户规模第一的智能编码助手通义灵码的底座。

阿里云发布通义千问2.5，声称性能全面赶超GPT-4 Turbo

豆包 - 字节跳动旗下免费AI智能助手

SpeedAI - 专业的AIGC检测、降重降AI平台

千问 - 阿里旗下 AI 智能助手

LibTV - LiblibAI 推出的 AI 视频创作平台，剧本分镜成片一站式完成

星流 - LiblibAI 推出的一站式 AI 设计 Agent

讯飞智文 - 科大讯飞推出的 AI PPT 与文档生成工具

Kimi K3 - 月之暗面推出的2.8万亿参数开源多模态旗舰模型

小橡皮 - 内容去AI味与发布风险检测工具

PixPix - 跨境电商AI商品图与视频创作平台

LibTV Agent - LiblibAI推出的专业AI视频创作智能体

蛙蛙漫剧 - 一站式AI漫剧视频创作工具

GPT-Live：OpenAI 新一代实时语音交互模型

阿里云开源最强中英文70亿参数模型，通义千问7B模型上线魔搭

阿里云通义千问向全社会开放

ChatGPT安卓APP下周推出，现在就可以预约！

ChatGPT 安卓版正式发布，开放美印等国家地区