GPT-5.4 - OpenAI 新一代专业工作模型，擅长知识工作、编码与计算机操作

GPT-5.4是什么

GPT-5.4 是 OpenAI 发布的最新前沿模型，定位为“为专业工作而设计”。官方将其定义为目前 最强且最高效的专业工作模型，把近阶段在推理、编码和 agentic workflows （智能体工作流）上的进展整合到一个通用模型中，同时推出了面向更高复杂度任务的 GPT-5.4 Pro。

与前代相比，GPT-5.4 不只是继续强化推理，还吸收了 GPT-5.3-Codex 的前沿编码能力，并重点提升了模型在工具、软件环境以及表格、演示文稿、文档等专业任务中的表现。OpenAI 特别强调，它能以更少来回沟通完成更复杂、更接近真实工作的交付。

在产品形态上，GPT-5.4 同时覆盖 ChatGPT、API 和 Codex。ChatGPT 中对应的是 GPT-5.4 Thinking，可在较长、较复杂的问题上先给出思路前言，允许用户在回答过程中调整方向；API 和 Codex 侧则进一步强化了计算机使用、工具搜索和长上下文能力。

GPT-5.4 的主要功能

专业知识工作增强： 官方重点优化了表格、演示文稿和文档处理能力。在 GDPval 上，GPT-5.4 达到 83.0%，高于 GPT-5.2 的 70.9%；在内部投行建模任务中达到 87.3%，高于 GPT-5.2 的 68.4%。
原生计算机使用能力： GPT-5.4 是 OpenAI 首个具备原生 computer-use 能力的通用主线模型，可基于截图执行鼠标键盘操作，也能通过如 Playwright 之类的库编写代码操控电脑。
更强的视觉理解与文档解析： 在 MMMU Pro（无工具）上达到 81.2%，高于 GPT-5.2 的 79.5%；同时引入 original 图像输入细节级别，支持最高 10.24M 像素或 6000 像素最大边长。
前沿编码与长任务开发： GPT-5.4 融合 GPT-5.3-Codex 的编码能力，在 SWE-Bench Pro（Public）上达到 57.7%，高于 GPT-5.3-Codex 的 56.8% 和 GPT-5.2 的 55.6%。官方还强调它在复杂前端任务上生成结果更美观、更可用。
工具搜索与智能体工具调用： 在 API 中新增 tool search，让模型先检索再按需加载工具定义，适合大型 MCP 工具生态；OpenAI 展示称，在 MCP Atlas 的 250 个任务中，这种配置在保持同等准确率的同时把总 token 使用量降低了 47%。
更强的网页搜索与多步工作流： 在 BrowseComp 上，GPT-5.4 达到 82.7%，相比 GPT-5.2 的 65.8% 有明显提升；GPT-5.4 Pro 达到 89.3%。官方将其用于更难的深度网络检索与多来源信息整合。
更高 token 效率： OpenAI 表示 GPT-5.4 是其“目前 token 效率最高的推理模型”，相较 GPT-5.2 使用显著更少 token 来解决问题，从而带来更低 token 消耗与更快速度。

GPT-5.4 的应用场景

适合需要高质量输出、长任务处理和多工具协作的专业场景，尤其是“真实工作交付”而不只是简单问答。

表格建模与数据分析： 适合生成和编辑复杂电子表格、财务建模表、分析文档等专业成果。
演示文稿与文档写作： 可用于创建更美观、结构更完整的幻灯片与正式文档，官方特别提到其在 presentations 和 documents 上的提升。
开发者智能体与自动化任务： 适合构建能跨网站、软件系统、工具链执行任务的 agents，包括浏览器操作、桌面交互和多步骤流程执行。
软件开发与复杂前端生成： 可用于代码生成、复杂前端页面与应用构建、调试和 Playwright 驱动的交互式测试。
深度网页研究： 适合需要跨多轮搜索、从大量网页中找出关键信息并进行综合分析的任务。
长上下文复杂工作流： 在 Codex 中支持实验性的 1M 上下文窗口，适合更长链条的规划、执行与验证任务。

GPT-5.4 的产品定价

GPT-5.4 已在 API 中提供标准定价。gpt-5.4 的价格为 输入 $2.50 / 百万 tokens、缓存输入 $0.25 / 百万 tokens、输出 $15 / 百万 tokens；gpt-5.4-pro 的价格为 输入 $30 / 百万 tokens、输出 $180 / 百万 tokens。OpenAI 同时说明，Batch 和 Flex 价格为标准 API 价格的一半，Priority processing 为标准价格的两倍。

在 ChatGPT 中，GPT-5.4 Thinking 已向 Plus、Team、Pro 用户开放，GPT-5.4 Pro 面向 Pro 和 Enterprise 计划；Enterprise 与 Edu 可通过管理员设置启用早期访问。

如何使用 GPT-5.4

在 ChatGPT 中使用： 付费用户可在 ChatGPT 中使用 GPT-5.4 Thinking；Pro 和 Enterprise 还可使用 GPT-5.4 Pro。
在 API 中调用： 开发者可直接通过 API 使用 gpt-5.4，需要更高性能时可选择 gpt-5.4-pro。
在 Codex 中接入： GPT-5.4 已覆盖 Codex，并支持实验性的 1M 上下文窗口配置。
启用工具与计算机使用： 在 API 中可通过更新后的 computer 工具和新增的 tool search 构建更复杂的 agent 工作流。
用于长任务与专业交付： 更适合表格、文档、PPT、编码、网页研究等复杂任务，而非仅用于简短对话。

常见问题

Q：GPT-5.4 和 GPT-5.2 Thinking 有什么关系？

A：在 ChatGPT 中，GPT-5.4 Thinking 已从 2026 年 3 月 5 日起取代 GPT-5.2 Thinking；GPT-5.2 Thinking 仍会在 Legacy Models 中为付费用户保留三个月，并将在 2026 年 6 月 5 日退役。

Q：GPT-5.4 是否有 Pro 版本？

A：有。OpenAI 同时发布了 GPT-5.4 Pro，面向需要在最复杂任务上获得最高性能的用户，并已在 ChatGPT 和 API 中提供。

Q：GPT-5.4 最大的官方卖点是什么？

A：官方核心卖点是把推理、编码和 agentic workflows 的最新进展整合到一个模型里，并在专业工作、原生计算机使用、工具调用和 token 效率上全面增强。

Q：GPT-5.4 支持多大上下文？

A：OpenAI 表示 GPT-5.4 支持最高 1M tokens 上下文；在 Codex 中这是实验性支持，超出标准 272K 上下文窗口的请求按 2 倍使用量计费。

Q：GPT-5.4 的安全策略有什么变化？

A：OpenAI 表示，GPT-5.4 延续并加强了 GPT-5.3-Codex 的安全防护，将其按 Preparedness Framework 视为 High cyber capability，并配套部署了相应保护措施。