GPT-4内幕大泄露！1.8万亿巨量参数，13万亿token训练，斥资6300万美元

这篇文章揭示了OpenAI的GPT-4的内部细节，包括其架构、训练和推理的基础设施、参数量、训练数据集、token数、成本等。GPT-4的规模是GPT-3的10倍以上，拥有1.8万亿参数。OpenAI使用了混合专家模型（Mixture of Experts，MoE）来构建GPT-4，以保持合理的成本。文章还提到，OpenAI训练GPT-4的FLOPS约为2.15e25，在大约25000个A100上训练了90到100天，利用率在32%到36%之间。训练成本大约是6300万美元。

此外，文章指出，OpenAI之所以不开源，不是为了确保人类不被AI毁灭，而是因为他们构建的东西是可复制的。预计未来所有中国和美国的互联网大厂或者AI头部初创企业，都会有能力构建出和GPT-4一样，甚至是超过GPT-4的模型。但是，GPT-4是OpenAI的伟大杰作，它凝结了工程师的匠心设计，复杂的构架和各种巧妙的工程上的取舍。

以上内容由ChatGPT总结。

文章来自新智元，阅读原文：https://mp.weixin.qq.com/s/iqvdcnwl4pR4jDXn57Yg8Q

GPT-4内幕大泄露！1.8万亿巨量参数，13万亿token训练，斥资6300万美元

豆包 - 字节跳动旗下免费AI智能助手

SpeedAI - 专业的AIGC检测、降重降AI平台

LibTV - LiblibAI 推出的 AI 视频创作平台，剧本分镜成片一站式完成

蝉镜-AI数字人视频创作平台

星流 - LiblibAI 推出的一站式 AI 设计 Agent

AIPPT: AI一键生成高质量PPT

WorkRally - 腾讯视频推出的工业级 AI 漫剧制作平台

火山剧创 - 火山引擎推出的企业级一站式 AI 短剧创作平台

Google Antigravity - Google 推出的 Agent-first 开发平台，多 Agent 协作从想法到生产级应用

Google Stitch - Google 推出的 AI 原生 UI 设计画布，自然语言实时生成 UI 设计与代码

Qwen3.5-LiveTranslate - 阿里通义千问推出的多语言实时同传模型

千问云 - 阿里云面向 Agentic 时代推出的 AI 模型服务平台

Adthos 使用生成式 AI 完全自动化音频广告

OpenAI宣布所有付费API客户现在都可以访问GPT-4

聊一聊遥感+AI在农业场景中的应用

微软新必应搜索初步体验汇总