Qwen3.7-Plus - 阿里巴巴推出的新一代多模态智能体模型

Qwen3.7-Plus 是什么

Qwen3.7-Plus 是阿里通义千问 Qwen3.7 系列的多模态模型，将视觉与语言统一为一体化的智能体基座。它在保持系列文本能力的基础上全面升级视觉-语言能力，可感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代码、端到端操作移动应用，并结合网络知识回答视觉问题，在单一智能体循环中融合 GUI 与 CLI 交互。作为全能型编码智能体与生产力助手，它以全模态输入处理从前端原型到复杂软件工程、再到多步工作流自动化的任务，模型现已通过阿里云百炼提供 API 服务。

👉 访问千问，体验阿里最强大模型

Qwen3.7-Plus的主要特性

Multimodal Agent（多模态智能体）： 统一处理图像、视频、屏幕、网页与文本输入，并在 GUI / CLI / 工具环境中完成任务。
Visual Agent（视觉智能体）： 结合视觉理解、代码解释器与搜索增强，解决视觉谜题、真实世界问答与复杂推理任务，支持单图、多图和视频输入。
Visual Coding（视觉编码）： 从图像或视频生成 SVG、网页与交互式前端，实现"视觉参考到可执行代码"的端到端转化。
GUI Agent： 理解移动端与桌面端界面，完成控件定位、任务规划与多步操作。
Real-world Perception & Reasoning（真实世界感知与推理）： 覆盖真实场景、文档图表、OCR、视频与驾驶场景理解。
混合智能体闭环： 将"看、想、写、做、验"整合进统一工作流，结合环境反馈进行代码生成、应用操作、测试验证与迭代优化。
跨框架泛化与思维保留： 支持 Claude Code、OpenClaw、Qwen Code 等框架部署，并提供 preserve_thinking 以在多轮中保留思维内容，适配智能体任务。

Qwen3.7-Plus的能力边界

不是开源权重模型：从目前官方信息来看，Qwen3.7-Plus 主要通过在线体验和 API 方式提供，未看到公开权重下载信息。
更适合多模态 Agent，而非纯文本极限推理：如果主要需求是超长文本推理、数学、代码或长链路文本任务，Qwen3.7-Max 这类文本旗舰模型可能更适合；Qwen3.7-Plus 的重点在多模态感知与智能体任务。
真实业务效果仍需场景测试：多模态智能体任务涉及视觉识别、界面定位、工具调用和流程执行，实际稳定性会受到任务复杂度、输入质量、工具链设计和调用环境影响。

Qwen3.7-Plus的适用场景

多模态问答与视觉理解：适合处理图片、视频、截图、图表、文档页面等内容，回答与视觉信息相关的问题。
网页/桌面智能体：可用于构建能够理解界面、分析按钮与区域、结合文本指令完成任务的 AI Agent。
代码与开发辅助：适合在 IDE 截图、报错信息、终端输出和代码上下文之间进行联合分析，辅助开发者定位问题。
企业流程自动化：可用于表单处理、后台系统操作、SaaS 界面理解、报表分析等企业级自动化场景。
视觉 RAG 与文档分析：适合对包含图表、截图、流程图、表格和长文档的资料进行检索增强问答。
内容生产与运营分析：可用于分析视频素材、页面截图、广告图、产品界面和运营数据看板，辅助内容创作与决策。

Qwen3.7-Plus的产品定价

模型通过阿里云百炼以 API 形式提供，按 token 调用计费；Qwen Chat 提供体验入口。具体 API 单价、免费额度与商用授权条款以阿里云百炼平台公布为准。

如何使用Qwen3.7-Plus

在 Qwen Chat 体验： 访问 https://chat.qwen.ai ，选择 Qwen3.7 系列对应型号进行多模态对话体验。
通过阿里云百炼调用 API： 在 https://bailian.console.aliyun.com 获取 DASHSCOPE_API_KEY，使用兼容 OpenAI 规范的 chat completions / responses 接口调用；可选区域 base_url 包括北京、新加坡、美国（弗吉尼亚）三个节点。
接入 Agent 框架： 可在 Claude Code、OpenClaw、Qwen Code 等框架中部署，智能体任务建议开启 preserve_thinking 以保留多轮思维内容。
了解模型详细信息： https://qwen.ai/blog?id=qwen3.7-plus

常见问题

Q：Qwen3.7-Plus 和 Qwen3.7-Max 有什么区别？

A：二者同属 Qwen3.7 系列。Max 偏旗舰级文本与高难度逻辑推理，Plus 是多模态智能体型号，侧重视觉理解、视觉编码、GUI 操作与真实世界推理；官方称 Plus 的纯文本能力整体接近 Max 级别。

Q：它支持哪些输入？

A：作为多模态模型，Qwen3.7-Plus 同时接受文本和图像/视频输入，支持单图、多图与视频。

Q：Qwen3.7-Plus 是开源模型吗？

A：它以阿里云百炼 API 形式提供，属闭源商用模型，无法本地部署。是否提供开源版本以官方公告为准。

Q：可以在哪些 Agent 框架里用它？

A：官方说明其具备跨框架泛化能力，可通过 Claude Code、OpenClaw、Qwen Code 等框架部署并保持稳定表现。

AIHub点评

Qwen3.7-Plus 的重点不只是“看图回答问题”，而是面向智能体时代的多模态执行能力。它把视觉理解、语言推理和工具/界面操作连接起来，更适合用于网页智能体、桌面自动化、开发辅助、企业流程处理和视觉 RAG 等场景。对于需要构建多模态 Agent 的开发者来说，Qwen3.7-Plus 值得重点关注；对于普通用户来说，它也代表 Qwen 系列正在从通用聊天模型，继续向“能理解界面、处理视觉信息、协助完成复杂任务”的 AI 助手方向演进。

Qwen3.7-Plus - 阿里巴巴推出的新一代多模态智能体模型

Qwen3.7-Plus 是什么

Qwen3.7-Plus的主要特性

Qwen3.7-Plus的能力边界

Qwen3.7-Plus的适用场景

Qwen3.7-Plus的产品定价

如何使用Qwen3.7-Plus

常见问题

AIHub点评

豆包 - 字节跳动旗下免费AI智能助手

SpeedAI - 专业的AIGC检测、降重降AI平台

千问 - 阿里旗下 AI 智能助手

LibTV - LiblibAI 推出的 AI 视频创作平台，剧本分镜成片一站式完成

星流 - LiblibAI 推出的一站式 AI 设计 Agent

讯飞智文 - 科大讯飞推出的 AI PPT 与文档生成工具

Kimi K3 - 月之暗面推出的2.8万亿参数开源多模态旗舰模型

小橡皮 - 内容去AI味与发布风险检测工具

PixPix - 跨境电商AI商品图与视频创作平台

LibTV Agent - LiblibAI推出的专业AI视频创作智能体

蛙蛙漫剧 - 一站式AI漫剧视频创作工具

GPT-Live：OpenAI 新一代实时语音交互模型

Qwen3.7-Plus 是什么

Qwen3.7-Plus的主要特性

Qwen3.7-Plus的能力边界

Qwen3.7-Plus的适用场景

Qwen3.7-Plus的产品定价

如何使用Qwen3.7-Plus

常见问题

AIHub点评

阿里发布 Qwen3.7-Plus：面向多模态智能体的视觉语言模型

Qwen3.6-Plus - 阿里新一代多模态推理与智能体编程模型

Qwen3.7-Max：阿里发布的新一代千问旗舰模型

Step 3.7 Flash - 阶跃星辰推出的面向真实 Agent 场景的高效率多模态模型

豆包 - 字节跳动旗下免费AI智能助手

SpeedAI - 专业的AIGC检测、降重降AI平台

千问 - 阿里旗下 AI 智能助手

LibTV - LiblibAI 推出的 AI 视频创作平台，剧本分镜成片一站式完成

星流 - LiblibAI 推出的一站式 AI 设计 Agent

讯飞智文 - 科大讯飞推出的 AI PPT 与文档生成工具

Kimi K3 - 月之暗面推出的2.8万亿参数开源多模态旗舰模型

小橡皮 - 内容去AI味与发布风险检测工具

PixPix - 跨境电商AI商品图与视频创作平台

LibTV Agent - LiblibAI推出的专业AI视频创作智能体

蛙蛙漫剧 - 一站式AI漫剧视频创作工具

GPT-Live：OpenAI 新一代实时语音交互模型