2026年5月29日,阶跃星辰正式发布 Step 3.7 Flash,这是一款面向真实世界 Agent 场景的新一代高效率 Flash 模型。与传统偏问答的模型不同,Step 3.7 Flash 更强调“理解之后执行”,围绕多模态感知、网页与视觉搜索、工具调用、代码执行和 Agent 工作流进行了系统增强。

Step 3.7 Flash 采用稀疏 MoE 视觉语言模型架构,具备文本、图像、代码、搜索和工具调用等能力。官方介绍显示,该模型支持理解产品界面、文档、图表、自然场景等视觉输入,并可以基于看到的内容生成代码或调用工具完成任务。对于 AI Agent 来说,这意味着模型不只是回答问题,还可以在浏览器、终端、Office 工具、搜索工具等环境中持续执行、观察和迭代。
在智能编程方面,Step 3.7 Flash 针对 Agentic Coding 场景进行了重点优化,可用于代码生成、Bug 修复、多文件项目理解、终端操作和自动化开发任务。官方数据显示,相比 Step 3.5 Flash,Step 3.7 Flash 在 SWE-Bench Pro 和 Terminal-Bench 2.1 等编码相关测试中取得提升,并在多个 Agent 框架下表现更加均衡。
搜索能力也是 Step 3.7 Flash 的重要升级方向。模型强化了搜索规划、证据筛选和信息综合能力,可以处理更复杂的网页搜索、视觉搜索和跨来源信息整合任务。对于需要实时信息、长尾实体识别、资料核验和深度研究的场景,Step 3.7 Flash 更接近一个可主动检索与整理信息的 Agent 模型。
在企业任务方面,Step 3.7 Flash 面向文档、表格、截图、业务资料和专业知识工作进行了优化。它可以处理混合输入,并结合搜索、工具调用和视觉理解完成更长链路的任务,适合用于企业报告分析、数据整理、财务会计辅助、制造工程任务、办公自动化和多工具协作等场景。
Step 3.7 Flash 也强调 Agent 生态兼容性,支持 Claude Code、KiloCode、Hermes Agent、OpenClaw 等主流 Agent 框架和 Skills,便于开发者将其接入现有工作流。部署方面,该模型支持通过阶跃星辰开放平台调用,也可在 Web 端和 App 中体验,并支持 OpenRouter、NVIDIA NIM 等合作平台接入。同时,模型可部署在云端、数据中心和本地高内存设备上,适合不同规模的开发者和企业团队使用。
整体来看,Step 3.7 Flash 的意义不只是一次模型版本升级,而是阶跃星辰将 Flash 模型进一步推向真实 Agent 应用的一次重要尝试。它在多模态理解、搜索增强、工具调用、智能编程和本地部署方面形成了较完整的能力组合,对于正在构建 AI Agent、企业自动化工具和多模态应用的开发者来说,是一款值得关注的国产高效率模型。

