GPT-5.4是什么
GPT-5.4 是 OpenAI 发布的最新前沿模型,定位为“为专业工作而设计”。官方将其定义为目前 最强且最高效的专业工作模型,把近阶段在推理、编码和 agentic workflows (智能体工作流)上的进展整合到一个通用模型中,同时推出了面向更高复杂度任务的 GPT-5.4 Pro。
与前代相比,GPT-5.4 不只是继续强化推理,还吸收了 GPT-5.3-Codex 的前沿编码能力,并重点提升了模型在工具、软件环境以及表格、演示文稿、文档等专业任务中的表现。OpenAI 特别强调,它能以更少来回沟通完成更复杂、更接近真实工作的交付。
在产品形态上,GPT-5.4 同时覆盖 ChatGPT、API 和 Codex。ChatGPT 中对应的是 GPT-5.4 Thinking,可在较长、较复杂的问题上先给出思路前言,允许用户在回答过程中调整方向;API 和 Codex 侧则进一步强化了计算机使用、工具搜索和长上下文能力。

GPT-5.4 的主要功能
- 专业知识工作增强: 官方重点优化了表格、演示文稿和文档处理能力。在 GDPval 上,GPT-5.4 达到 83.0%,高于 GPT-5.2 的 70.9%;在内部投行建模任务中达到 87.3%,高于 GPT-5.2 的 68.4%。
- 原生计算机使用能力: GPT-5.4 是 OpenAI 首个具备原生 computer-use 能力的通用主线模型,可基于截图执行鼠标键盘操作,也能通过如 Playwright 之类的库编写代码操控电脑。
- 更强的视觉理解与文档解析: 在 MMMU Pro(无工具)上达到 81.2%,高于 GPT-5.2 的 79.5%;同时引入
original图像输入细节级别,支持最高 10.24M 像素或 6000 像素最大边长。 - 前沿编码与长任务开发: GPT-5.4 融合 GPT-5.3-Codex 的编码能力,在 SWE-Bench Pro(Public)上达到 57.7%,高于 GPT-5.3-Codex 的 56.8% 和 GPT-5.2 的 55.6%。官方还强调它在复杂前端任务上生成结果更美观、更可用。
- 工具搜索与智能体工具调用: 在 API 中新增 tool search,让模型先检索再按需加载工具定义,适合大型 MCP 工具生态;OpenAI 展示称,在 MCP Atlas 的 250 个任务中,这种配置在保持同等准确率的同时把总 token 使用量降低了 47%。
- 更强的网页搜索与多步工作流: 在 BrowseComp 上,GPT-5.4 达到 82.7%,相比 GPT-5.2 的 65.8% 有明显提升;GPT-5.4 Pro 达到 89.3%。官方将其用于更难的深度网络检索与多来源信息整合。
- 更高 token 效率: OpenAI 表示 GPT-5.4 是其“目前 token 效率最高的推理模型”,相较 GPT-5.2 使用显著更少 token 来解决问题,从而带来更低 token 消耗与更快速度。
GPT-5.4 的应用场景
适合需要高质量输出、长任务处理和多工具协作的专业场景,尤其是“真实工作交付”而不只是简单问答。
- 表格建模与数据分析: 适合生成和编辑复杂电子表格、财务建模表、分析文档等专业成果。
- 演示文稿与文档写作: 可用于创建更美观、结构更完整的幻灯片与正式文档,官方特别提到其在 presentations 和 documents 上的提升。
- 开发者智能体与自动化任务: 适合构建能跨网站、软件系统、工具链执行任务的 agents,包括浏览器操作、桌面交互和多步骤流程执行。
- 软件开发与复杂前端生成: 可用于代码生成、复杂前端页面与应用构建、调试和 Playwright 驱动的交互式测试。
- 深度网页研究: 适合需要跨多轮搜索、从大量网页中找出关键信息并进行综合分析的任务。
- 长上下文复杂工作流: 在 Codex 中支持实验性的 1M 上下文窗口,适合更长链条的规划、执行与验证任务。
GPT-5.4 的产品定价
GPT-5.4 已在 API 中提供标准定价。gpt-5.4 的价格为 输入 $2.50 / 百万 tokens、缓存输入 $0.25 / 百万 tokens、输出 $15 / 百万 tokens;gpt-5.4-pro 的价格为 输入 $30 / 百万 tokens、输出 $180 / 百万 tokens。OpenAI 同时说明,Batch 和 Flex 价格为标准 API 价格的一半,Priority processing 为标准价格的两倍。
在 ChatGPT 中,GPT-5.4 Thinking 已向 Plus、Team、Pro 用户开放,GPT-5.4 Pro 面向 Pro 和 Enterprise 计划;Enterprise 与 Edu 可通过管理员设置启用早期访问。
如何使用 GPT-5.4
- 在 ChatGPT 中使用: 付费用户可在 ChatGPT 中使用 GPT-5.4 Thinking;Pro 和 Enterprise 还可使用 GPT-5.4 Pro。
- 在 API 中调用: 开发者可直接通过 API 使用
gpt-5.4,需要更高性能时可选择gpt-5.4-pro。 - 在 Codex 中接入: GPT-5.4 已覆盖 Codex,并支持实验性的 1M 上下文窗口配置。
- 启用工具与计算机使用: 在 API 中可通过更新后的
computer工具和新增的 tool search 构建更复杂的 agent 工作流。 - 用于长任务与专业交付: 更适合表格、文档、PPT、编码、网页研究等复杂任务,而非仅用于简短对话。
常见问题
Q:GPT-5.4 和 GPT-5.2 Thinking 有什么关系?
A:在 ChatGPT 中,GPT-5.4 Thinking 已从 2026 年 3 月 5 日起取代 GPT-5.2 Thinking;GPT-5.2 Thinking 仍会在 Legacy Models 中为付费用户保留三个月,并将在 2026 年 6 月 5 日退役。
Q:GPT-5.4 是否有 Pro 版本?
A:有。OpenAI 同时发布了 GPT-5.4 Pro,面向需要在最复杂任务上获得最高性能的用户,并已在 ChatGPT 和 API 中提供。
Q:GPT-5.4 最大的官方卖点是什么?
A:官方核心卖点是把推理、编码和 agentic workflows 的最新进展整合到一个模型里,并在专业工作、原生计算机使用、工具调用和 token 效率上全面增强。
Q:GPT-5.4 支持多大上下文?
A:OpenAI 表示 GPT-5.4 支持最高 1M tokens 上下文;在 Codex 中这是实验性支持,超出标准 272K 上下文窗口的请求按 2 倍使用量计费。
Q:GPT-5.4 的安全策略有什么变化?
A:OpenAI 表示,GPT-5.4 延续并加强了 GPT-5.3-Codex 的安全防护,将其按 Preparedness Framework 视为 High cyber capability,并配套部署了相应保护措施。


