GPT-4内幕大泄露！1.8万亿巨量参数，13万亿token训练，斥资6300万美元

这篇文章揭示了OpenAI的GPT-4的内部细节，包括其架构、训练和推理的基础设施、参数量、训练数据集、token数、成本等。GPT-4的规模是GPT-3的10倍以上，拥有1.8万亿参数。OpenAI使用了混合专家模型（Mixture of Experts，MoE）来构建GPT-4，以保持合理的成本。文章还提到，OpenAI训练GPT-4的FLOPS约为2.15e25，在大约25000个A100上训练了90到100天，利用率在32%到36%之间。训练成本大约是6300万美元。

此外，文章指出，OpenAI之所以不开源，不是为了确保人类不被AI毁灭，而是因为他们构建的东西是可复制的。预计未来所有中国和美国的互联网大厂或者AI头部初创企业，都会有能力构建出和GPT-4一样，甚至是超过GPT-4的模型。但是，GPT-4是OpenAI的伟大杰作，它凝结了工程师的匠心设计，复杂的构架和各种巧妙的工程上的取舍。

以上内容由ChatGPT总结。

文章来自新智元，阅读原文：https://mp.weixin.qq.com/s/iqvdcnwl4pR4jDXn57Yg8Q

GPT-4内幕大泄露！1.8万亿巨量参数，13万亿token训练，斥资6300万美元

豆包 - 字节跳动旗下免费AI智能助手

SpeedAI - 专业的AIGC检测、降重降AI平台

千问 - 阿里旗下 AI 智能助手

LibTV - LiblibAI 推出的 AI 视频创作平台，剧本分镜成片一站式完成

星流 - LiblibAI 推出的一站式 AI 设计 Agent

讯飞智文 - 科大讯飞推出的 AI PPT 与文档生成工具

Claude Tag - Anthropic 推出的 Slack 团队协作 AI Agent，@Claude 即可派活

Seedance 2.5：字节跳动推出的新一代 AI 视频生成模型

Seed2.1 - 字节面向生产力场景的多模态 Agent 模型，视觉与视频理解突出

微信小微 - 微信原生 AI Agent，可操作聊天、公众号、视频号和小程序

LearnBuddy - 腾讯推出的 AI 自主学习平台，面向高校/院校场景

AI版支付宝 - 支付宝推出的全新 AI 版本

Adthos 使用生成式 AI 完全自动化音频广告

OpenAI宣布所有付费API客户现在都可以访问GPT-4

聊一聊遥感+AI在农业场景中的应用

微软新必应搜索初步体验汇总