阶跃星辰发布 Step 3.7 Flash：面向真实 Agent 场景的高效率多模态模型

2026年5月29日，阶跃星辰正式发布 Step 3.7 Flash，这是一款面向真实世界 Agent 场景的新一代高效率 Flash 模型。与传统偏问答的模型不同，Step 3.7 Flash 更强调“理解之后执行”，围绕多模态感知、网页与视觉搜索、工具调用、代码执行和 Agent 工作流进行了系统增强。

Step 3.7 Flash 采用稀疏 MoE 视觉语言模型架构，具备文本、图像、代码、搜索和工具调用等能力。官方介绍显示，该模型支持理解产品界面、文档、图表、自然场景等视觉输入，并可以基于看到的内容生成代码或调用工具完成任务。对于 AI Agent 来说，这意味着模型不只是回答问题，还可以在浏览器、终端、Office 工具、搜索工具等环境中持续执行、观察和迭代。

在智能编程方面，Step 3.7 Flash 针对 Agentic Coding 场景进行了重点优化，可用于代码生成、Bug 修复、多文件项目理解、终端操作和自动化开发任务。官方数据显示，相比 Step 3.5 Flash，Step 3.7 Flash 在 SWE-Bench Pro 和 Terminal-Bench 2.1 等编码相关测试中取得提升，并在多个 Agent 框架下表现更加均衡。

搜索能力也是 Step 3.7 Flash 的重要升级方向。模型强化了搜索规划、证据筛选和信息综合能力，可以处理更复杂的网页搜索、视觉搜索和跨来源信息整合任务。对于需要实时信息、长尾实体识别、资料核验和深度研究的场景，Step 3.7 Flash 更接近一个可主动检索与整理信息的 Agent 模型。

在企业任务方面，Step 3.7 Flash 面向文档、表格、截图、业务资料和专业知识工作进行了优化。它可以处理混合输入，并结合搜索、工具调用和视觉理解完成更长链路的任务，适合用于企业报告分析、数据整理、财务会计辅助、制造工程任务、办公自动化和多工具协作等场景。

Step 3.7 Flash 也强调 Agent 生态兼容性，支持 Claude Code、KiloCode、Hermes Agent、OpenClaw 等主流 Agent 框架和 Skills，便于开发者将其接入现有工作流。部署方面，该模型支持通过阶跃星辰开放平台调用，也可在 Web 端和 App 中体验，并支持 OpenRouter、NVIDIA NIM 等合作平台接入。同时，模型可部署在云端、数据中心和本地高内存设备上，适合不同规模的开发者和企业团队使用。

整体来看，Step 3.7 Flash 的意义不只是一次模型版本升级，而是阶跃星辰将 Flash 模型进一步推向真实 Agent 应用的一次重要尝试。它在多模态理解、搜索增强、工具调用、智能编程和本地部署方面形成了较完整的能力组合，对于正在构建 AI Agent、企业自动化工具和多模态应用的开发者来说，是一款值得关注的国产高效率模型。

阶跃星辰发布 Step 3.7 Flash：面向真实 Agent 场景的高效率多模态模型

豆包 - 字节跳动旗下免费AI智能助手

SpeedAI - 专业的AIGC检测、降重降AI平台

千问 - 阿里旗下 AI 智能助手

LibTV - LiblibAI 推出的 AI 视频创作平台，剧本分镜成片一站式完成

星流 - LiblibAI 推出的一站式 AI 设计 Agent

讯飞智文 - 科大讯飞推出的 AI PPT 与文档生成工具

Kimi K3 - 月之暗面推出的2.8万亿参数开源多模态旗舰模型

小橡皮 - 内容去AI味与发布风险检测工具

PixPix - 跨境电商AI商品图与视频创作平台

LibTV Agent - LiblibAI推出的专业AI视频创作智能体

蛙蛙漫剧 - 一站式AI漫剧视频创作工具

GPT-Live：OpenAI 新一代实时语音交互模型

Step 3.7 Flash - 阶跃星辰推出的面向真实 Agent 场景的高效率多模态模型

Anthropic 发布 Claude Opus 4.8：面向复杂编码与长程 Agent 任务的旗舰模型升级

Google 发布 Gemini 3.5 Flash：面向 Agent 与编程任务的新一代高速模型

Skywork AI 发布 SkyClaw-v1.0：面向复杂工具调用的百万上下文 Agent 模型