豆包AI助手
当前位置:首页>AI资讯>OpenAI 发布 GPT-5.4:面向专业工作,强化表格、文档、编程与智能体能力

OpenAI 发布 GPT-5.4:面向专业工作,强化表格、文档、编程与智能体能力

2026 年 3 月 5 日,OpenAI 正式发布 GPT-5.4,并同步上线 ChatGPT、API 和 Codex。OpenAI 将其定义为“面向专业工作的最强且最高效前沿模型”,同时还推出了更高性能版本 GPT-5.4 Pro,重点服务复杂任务场景。

OpenAI 发布 GPT-5.4:面向专业工作,强化表格、文档、编程与智能体能力

从官方定位来看,GPT-5.4 这次的升级重点非常明确,不只是继续提升推理能力,而是把推理、编程和 agentic workflows(智能体工作流)进一步整合到一个统一模型里。OpenAI 特别强调,GPT-5.4 在表格、演示文稿和文档等专业知识工作上做了明显增强,更贴近真实办公与交付场景。

性能方面,GPT-5.4 在多项官方评测中都有提升。比如在内部投行建模任务中,GPT-5.4 得分达到 87.3%,明显高于 GPT-5.2 的 68.4%;在 GDPval 这一专业工作评测中,GPT-5.4 为 83.0%,也高于 GPT-5.2 的 70.9%。OpenAI 还表示,GPT-5.4 生成的演示文稿在人类评审中有 68.0% 的时间优于 GPT-5.2,主要体现在美观性、视觉多样性和图像生成使用效果上。

除了办公场景,GPT-5.4 也进一步加强了开发与智能体能力。OpenAI 称,这是首个具备原生 computer-use 能力的主线推理模型,既可以基于截图执行鼠标键盘操作,也可以借助代码库来控制电脑。在编码方面,GPT-5.4 还吸收了 GPT-5.3-Codex 的能力,在 SWE-Bench Pro(Public)上达到 57.7%,略高于 GPT-5.3-Codex 的 56.8% 和 GPT-5.2 的 55.6%。

在事实性与可靠性上,OpenAI 也给出了新的说法。官方表示,GPT-5.4 是“目前最真实、最少错误”的模型之一,在一组用户曾标记事实错误的匿名提示词数据上,GPT-5.4 的单条陈述出错概率比 GPT-5.2 低 33%,整段回答包含错误的概率低 18%。

使用层面,GPT-5.4 已经在 ChatGPT 中以 GPT-5.4 Thinking 的形式提供给 Plus、Team 和 Pro 用户,GPT-5.4 Pro 则面向 Pro 和 Enterprise 用户开放;开发者也可以在 API 中直接调用 gpt-5.4gpt-5.4-pro。价格方面,gpt-5.4 的标准 API 定价为输入 2.50 美元 / 百万 tokens、输出 15 美元 / 百万 tokens;gpt-5.4-pro 则为输入 30 美元 / 百万 tokens、输出 180 美元 / 百万 tokens。

整体来看,GPT-5.4 不是一次单纯的模型参数升级,而更像是 OpenAI 对“AI 真正进入专业工作流”这一方向的进一步推进。它把表格、文档、PPT、编程、网页搜索和计算机操作放到同一个模型体系中,意味着未来 AI 工具不只是回答问题,而是越来越接近“直接干活”的智能体形态。

©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。 笔灵AI降重