Grok-1：马斯克xAI发布的开源AI大模型，可商用

Grok-1是什么？

Grok-1是马斯克旗下AI公司xAI发布的开源AI大模型，其参数量达到了3140亿，远超OpenAI GPT-3.5的1750亿。这是迄今参数量最大的开源大语言模型，遵照Apache 2.0协议开放模型权重和架构。

Grok-1是一个混合专家（Mixture-of-Experts，MOE）大模型，这种MOE架构重点在于提高大模型的训练和推理效率，形象地理解，MOE就像把各个领域的“专家”集合到了一起，遇到任务派发给不同领域的专家，最后汇总结论，提升效率。决定每个专家做什么的是被称为“门控网络”的机制。

Grok-1模型的公开发布，为研究人员和开发者提供了一个新的大型语言模型资源。

Grok-1的主要特性

xAI还特别强调了Grok-1的几大特性：

首先，Grok-1是一个未针对特定任务进行微调的基础模型，它基于大量文本数据训练而成；
其次，作为一款基于混合专家技术构建的大语言模型，Grok-1拥有3140亿参数，在处理每个token时有25%的权重处于活跃状态；
最后，Grok-1是xAI团队使用JAX和Rust编程语言自定义训练栈从零开始训练的成果，训练完成于2023年10月。

Grok-1的技术参数

基础信息：

模型大小：3140亿参数，其中混合了8名专家（2名活跃）
活动参数：860亿
特色技术：使用旋转嵌入（Rotary Embeddings，简称#rope），而非固定位置嵌入

模型结构细节:

分词器词汇量：131,072（与GPT-4相似），即2^17
嵌入尺寸：6,144（48*128）
架构层数：64层变压器层
每层结构：包含一个解码器层，具有多头注意力块和密集块
键值大小：128

多头注意力块:

查询头数量：48
键/值（KV）头数量：8
KV大小：128
密集块（Dense Block）:

加宽系数：8
隐藏层大小：32,768
每个代币从8名专家中选择2名

旋转位置嵌入:
尺寸：6,144，与模型的输入嵌入大小相同
上下文长度：8,192个标记
精度：bf16

如何使用Grok-1？

xAI已经将Grok-1的权重和架构在GitHub上开源。

GitHub地址：https://github.com/xai-org/grok-1

Grok-1：马斯克xAI发布的开源AI大模型，可商用

Grok-1是什么？

Grok-1的主要特性

Grok-1的技术参数

如何使用Grok-1？

豆包 - 字节跳动旗下免费AI智能助手

SpeedAI - 专业的AIGC检测、降重降AI平台

LibTV - LiblibAI 推出的 AI 视频创作平台，剧本分镜成片一站式完成

蝉镜-AI数字人视频创作平台

星流 - LiblibAI 推出的一站式 AI 设计 Agent

AIPPT: AI一键生成高质量PPT

腾讯吐司 - 腾讯推出的 AI 应用生成与灵感共创平台

Marvis 马维斯 - 腾讯推出的操作系统层级个人AI助手

Grok Build - xAI 推出的 AI 编程智能体 CLI 工具，对标 Claude Code

MonkeyCode - 长亭科技推出的在线 AI 开发平台

麦芽AI - AI 驱动的一体化项目开发平台

觅游 - 美团 AI 原生共生社区，Agent 养成与技能交流平台

Grok-1是什么？

Grok-1的主要特性

Grok-1的技术参数

如何使用Grok-1？

语鲸大模型-深言科技推出的开源中英双语大语言模型

PowerLawGLM-法律垂直AI大模型

阅文妙笔大模型：国内首个网文大模型

用友YonGPT：首个企业服务大模型

豆包 - 字节跳动旗下免费AI智能助手

SpeedAI - 专业的AIGC检测、降重降AI平台

LibTV - LiblibAI 推出的 AI 视频创作平台，剧本分镜成片一站式完成

蝉镜-AI数字人视频创作平台

星流 - LiblibAI 推出的一站式 AI 设计 Agent

AIPPT: AI一键生成高质量PPT

腾讯吐司 - 腾讯推出的 AI 应用生成与灵感共创平台

Marvis 马维斯 - 腾讯推出的操作系统层级个人AI助手

Grok Build - xAI 推出的 AI 编程智能体 CLI 工具，对标 Claude Code

MonkeyCode - 长亭科技推出的在线 AI 开发平台

麦芽AI - AI 驱动的一体化项目开发平台

觅游 - 美团 AI 原生共生社区，Agent 养成与技能交流平台