Step 3.7 Flash是什么
Step 3.7 Flash 是阶跃星辰推出的新一代高效率多模态大模型,主要面向真实世界 Agent 与高频生产级任务。它采用稀疏 MoE 视觉语言模型架构,结合 196B 参数语言主干与 1.8B 参数视觉编码器,支持文本、图像、代码、搜索和工具调用等能力。与传统问答模型不同,Step 3.7 Flash 更强调“理解之后执行”,可在编码、网页搜索、视觉识别、GUI 操作、企业任务和多工具协作中完成更长链路的 Agent 工作流。

Step 3.7 Flash的模型特性
- 原生多模态理解与行动:支持图片、产品界面、文档、图表和自然场景理解,并可基于视觉输入生成代码或调用工具执行任务。
- Agentic Coding 能力增强:面向智能编程与代码 Agent 场景,可用于代码生成、Bug 修复、多文件项目理解、终端操作和自动化开发流程。
- 网页与视觉搜索增强:强化搜索规划、证据筛选和信息综合能力,适合深度搜索、跨来源验证、长尾实体识别和实时信息任务。
- 可靠工具调用与编排:可驱动终端、浏览器、Office 工具、搜索工具等外部能力,减少长任务中的偏移、工具调用错误和执行失败。
- 视觉工具与 GUI 操作能力:支持通过裁剪、缩放、框选、Python 工具和 GUI 操作完成复杂视觉任务,可应用于网页、应用界面和移动端任务执行。
- 主流 Agent 生态兼容:兼容 Claude Code、KiloCode、Hermes Agent、OpenClaw 等主流 Agent 框架和 Skills,降低开发者接入与工作流迁移成本。
- 高效率 MoE 架构:模型总参数约198B,但每 token 激活约11B参数,在保持较强能力的同时兼顾推理效率和生产部署成本。
- 256k 长上下文窗口:适合处理长文档、大型代码库、复杂报告、多轮搜索轨迹和企业级知识任务。
Step 3.7 Flash的适用场景
AI Agent 应用开发
适合构建需要感知、搜索、推理、执行和验证的真实世界 Agent 应用。
- 浏览器 Agent
- 编程 Agent
- 企业办公 Agent
- 数据分析 Agent
- 多工具协作型 Agent
智能编程与软件工程
适合开发者用于代码生成、项目理解、自动修复和多步骤开发任务。
- 代码生成与重构
- Bug 定位与修复
- 多文件代码库理解
- 终端任务执行
- 前端草图转网页
多模态理解与视觉搜索
适合处理截图、图表、文档、产品界面和复杂视觉材料。
- 图片内容识别
- UI 截图理解
- 菜单与文档识别
- 图表分析
- 视觉搜索与验证
企业知识工作
适合企业用户处理长文档、表格、报告、专业资料和跨来源研究任务。
- 企业报告分析
- 财务与会计资料处理
- 制造与工程任务辅助
- 深度搜索与资料整合
- 多工具办公自动化
本地与私有化部署
适合需要数据可控、私有化推理或本地高性能推理的团队使用。
- 企业内网部署
- 数据中心部署
- 高内存工作站运行
- 本地 Agent 工作流
- 混合云推理服务
Step 3.7 Flash的API价格
Step 3.7 Flash 官方仓库公布的 API 价格如下:
- 输入价格(缓存未命中):0.20 美元 / 百万 tokens
- 输入价格(缓存命中):0.04 美元 / 百万 tokens
- 输出价格:1.15 美元 / 百万 tokens
具体计费方式可能会随平台、地区和服务商变化而调整,实际价格以阶跃星辰开放平台、OpenRouter、NVIDIA NIM 等接入渠道的最新说明为准。
如何使用Step 3.7 Flash
- 网页与 App 体验: 通过阶跃星辰官网(https://www.stepfun.com)或其手机 App(iOS / Android)直接对话使用。
- 通过开放平台 API 接入: 在阶跃星辰开放平台(https://platform.stepfun.com)注册并使用模型 ID
step-3.7-flash调用,接口兼容 OpenAI 风格。 - 通过第三方平台接入: 也可通过 OpenRouter、NVIDIA NIM 等合作平台使用。
- 接入 Agent 框架: 原生兼容 Claude Code、KiloCode、Hermes Agent、OpenClaw 等,按对应框架填入 Base URL 与 API Key 即可。
- 本地与私有化部署: 从 GitHub / HuggingFace / ModelScope 获取权重,支持 vLLM、SGLang、Hugging Face Transformers、llama.cpp 等推理框架;本地可运行于 NVIDIA DGX Station、AMD Ryzen AI Max+ 395 系统,以及配备 128GB 以上统一内存的 Mac Studio / Mac Pro 等设备。
常见问题
Q:Step 3.7 Flash 是什么?
A:Step 3.7 Flash 是阶跃星辰发布的高效率多模态大模型,面向真实世界 Agent、智能编程、视觉搜索、工具调用和企业级任务场景。
Q:Step 3.7 Flash 是开源模型吗?
A:Step 3.7 Flash 已在 GitHub、Hugging Face 和 ModelScope 提供模型资源,官方 GitHub 仓库采用 Apache-2.0 License。
Q:Step 3.7 Flash 支持多模态吗?
A:支持。它具备原生图像理解能力,可处理截图、文档、图表、GUI 界面和自然场景等视觉输入。
Q:Step 3.7 Flash 适合做 AI Agent 吗?
A:适合。该模型重点强化了 Agentic Coding、工具调用、搜索增强、多工具编排和 GUI 操作能力,适合用于真实 Agent 工作流。
Q:Step 3.7 Flash 的上下文长度是多少?
A:Step 3.7 Flash 支持 256k tokens 上下文窗口,适合处理长文档、大型代码库和复杂任务轨迹。
Q:Step 3.7 Flash 可以本地部署吗?
A:可以。官方说明其支持云端、数据中心和本地环境部署,本地运行需要高内存设备,例如 NVIDIA DGX Station、AMD Ryzen AI Max+ 395 系统,以及至少 128GB 统一内存的 Mac Studio 或 Mac Pro 等设备。
Q:Step 3.7 Flash 适合哪些用户?
A:适合 AI Agent 开发者、软件工程师、企业技术团队、多模态应用开发者,以及需要处理复杂文档、搜索、工具调用和自动化任务的专业用户。
AIHub点评
Step 3.7 Flash 的核心价值在于把 Flash 级模型从“高效问答”推进到“高效执行”。它不仅关注模型本身的生成能力,更强调在真实 Agent 环境中的感知、搜索、工具调用、代码执行和任务闭环能力。对于开发者来说,它适合用于构建成本可控、响应较快、可接入主流 Agent 生态的应用;对于企业团队来说,它也提供了 API、云端、数据中心和本地部署等多种选择。尤其是在多模态 Agent、智能编程、深度搜索和企业自动化场景中,Step 3.7 Flash 是一款值得重点关注的国产高效率模型。

