百度秒哒
当前位置:首页>AI模型>Qwen3.7-Plus - 阿里巴巴推出的新一代多模态智能体模型

Qwen3.7-Plus - 阿里巴巴推出的新一代多模态智能体模型

Qwen3.7-Plus 是什么

Qwen3.7-Plus 是阿里通义千问 Qwen3.7 系列的多模态模型,将视觉与语言统一为一体化的智能体基座。它在保持系列文本能力的基础上全面升级视觉-语言能力,可感知真实世界场景、读取屏幕并操作 GUI、基于视觉参考生成代码、端到端操作移动应用,并结合网络知识回答视觉问题,在单一智能体循环中融合 GUI 与 CLI 交互。作为全能型编码智能体与生产力助手,它以全模态输入处理从前端原型到复杂软件工程、再到多步工作流自动化的任务,模型现已通过阿里云百炼提供 API 服务。

👉 访问千问,体验阿里最强大模型

Qwen3.7-Plus

Qwen3.7-Plus的主要特性

  • Multimodal Agent(多模态智能体): 统一处理图像、视频、屏幕、网页与文本输入,并在 GUI / CLI / 工具环境中完成任务。
  • Visual Agent(视觉智能体): 结合视觉理解、代码解释器与搜索增强,解决视觉谜题、真实世界问答与复杂推理任务,支持单图、多图和视频输入。
  • Visual Coding(视觉编码): 从图像或视频生成 SVG、网页与交互式前端,实现"视觉参考到可执行代码"的端到端转化。
  • GUI Agent: 理解移动端与桌面端界面,完成控件定位、任务规划与多步操作。
  • Real-world Perception & Reasoning(真实世界感知与推理): 覆盖真实场景、文档图表、OCR、视频与驾驶场景理解。
  • 混合智能体闭环: 将"看、想、写、做、验"整合进统一工作流,结合环境反馈进行代码生成、应用操作、测试验证与迭代优化。
  • 跨框架泛化与思维保留: 支持 Claude CodeOpenClaw、Qwen Code 等框架部署,并提供 preserve_thinking 以在多轮中保留思维内容,适配智能体任务。

Qwen3.7-Plus的能力边界

  • 不是开源权重模型:从目前官方信息来看,Qwen3.7-Plus 主要通过在线体验和 API 方式提供,未看到公开权重下载信息。
  • 更适合多模态 Agent,而非纯文本极限推理:如果主要需求是超长文本推理、数学、代码或长链路文本任务,Qwen3.7-Max 这类文本旗舰模型可能更适合;Qwen3.7-Plus 的重点在多模态感知与智能体任务。
  • 真实业务效果仍需场景测试:多模态智能体任务涉及视觉识别、界面定位、工具调用和流程执行,实际稳定性会受到任务复杂度、输入质量、工具链设计和调用环境影响。

Qwen3.7-Plus的适用场景

  • 多模态问答与视觉理解:适合处理图片、视频、截图、图表、文档页面等内容,回答与视觉信息相关的问题。
  • 网页/桌面智能体:可用于构建能够理解界面、分析按钮与区域、结合文本指令完成任务的 AI Agent。
  • 代码与开发辅助:适合在 IDE 截图、报错信息、终端输出和代码上下文之间进行联合分析,辅助开发者定位问题。
  • 企业流程自动化:可用于表单处理、后台系统操作、SaaS 界面理解、报表分析等企业级自动化场景。
  • 视觉 RAG 与文档分析:适合对包含图表、截图、流程图、表格和长文档的资料进行检索增强问答。
  • 内容生产与运营分析:可用于分析视频素材、页面截图、广告图、产品界面和运营数据看板,辅助内容创作与决策。

Qwen3.7-Plus的产品定价

模型通过阿里云百炼以 API 形式提供,按 token 调用计费;Qwen Chat 提供体验入口。具体 API 单价、免费额度与商用授权条款以阿里云百炼平台公布为准。

如何使用Qwen3.7-Plus

  1. 在 Qwen Chat 体验: 访问 https://chat.qwen.ai ,选择 Qwen3.7 系列对应型号进行多模态对话体验。
  2. 通过阿里云百炼调用 API:https://bailian.console.aliyun.com 获取 DASHSCOPE_API_KEY,使用兼容 OpenAI 规范的 chat completions / responses 接口调用;可选区域 base_url 包括北京、新加坡、美国(弗吉尼亚)三个节点。
  3. 接入 Agent 框架: 可在 Claude Code、OpenClaw、Qwen Code 等框架中部署,智能体任务建议开启 preserve_thinking 以保留多轮思维内容。
  4. 了解模型详细信息: https://qwen.ai/blog?id=qwen3.7-plus

常见问题

Q:Qwen3.7-Plus 和 Qwen3.7-Max 有什么区别?

A:二者同属 Qwen3.7 系列。Max 偏旗舰级文本与高难度逻辑推理,Plus 是多模态智能体型号,侧重视觉理解、视觉编码、GUI 操作与真实世界推理;官方称 Plus 的纯文本能力整体接近 Max 级别。

Q:它支持哪些输入?

A:作为多模态模型,Qwen3.7-Plus 同时接受文本和图像/视频输入,支持单图、多图与视频。

Q:Qwen3.7-Plus 是开源模型吗?

A:它以阿里云百炼 API 形式提供,属闭源商用模型,无法本地部署。是否提供开源版本以官方公告为准。

Q:可以在哪些 Agent 框架里用它?

A:官方说明其具备跨框架泛化能力,可通过 Claude Code、OpenClaw、Qwen Code 等框架部署并保持稳定表现。

AIHub点评

Qwen3.7-Plus 的重点不只是“看图回答问题”,而是面向智能体时代的多模态执行能力。它把视觉理解、语言推理和工具/界面操作连接起来,更适合用于网页智能体、桌面自动化、开发辅助、企业流程处理和视觉 RAG 等场景。对于需要构建多模态 Agent 的开发者来说,Qwen3.7-Plus 值得重点关注;对于普通用户来说,它也代表 Qwen 系列正在从通用聊天模型,继续向“能理解界面、处理视觉信息、协助完成复杂任务”的 AI 助手方向演进。

©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。
豆包AI助手