全部标签

开源大模型

GLM-5.2：智谱推出并开源的新一代旗舰基座模型

GLM-5.2 是智谱AI推出并开源的旗舰基座模型，支持 1M 上下文与 128K 最大输出 Tokens，面向 Coding、复杂工程开发、长程任务执行和 AI Agent 场景，支持 API 调用与本地部署。
AI模型
- 1.7k
- 0
AIHub6月17日
Kimi K2.7 Code 发布并开源：面向长程 Coding 与 Agent 任务优化

近日，月之暗面推出新一代代码专用模型 Kimi K2.7 Code。这是 Kimi 系列面向 AI 编程和 Coding Agent 场景的最新模型，已在 Kimi API 平台开放调用，并在 Hugging Face 提供开源权重。从定位来看，Kimi K2.7 Code 不是普通聊天模型，而是专门面向代码生成、代码库理解、调试重构、多文件修改和复杂软件工程任务优化的 Coding Agent…
AI资讯
- 2.3k
- 0
AIHub6月13日
Kimi K2.7 Code：月之暗面推出的开源代码专用 Agent 模型

Kimi K2.7 Code 是 Moonshot AI 推出的代码专用 Agent 模型，面向长程编程任务、代码库理解、调试重构和软件工程自动化场景优化。模型采用 MoE 架构，拥有 1T 总参数、32B 激活参数，支持 256K 上下文、文本/图片/视频输入、思考模式、多步工具调用和 OpenAI 兼容 API，已在 Hugging Face 开放权重。
AI模型
- 1k
- 0
AIHub6月13日
智谱 GLM-5.2 开放：支持 1M 上下文，API 与开源版本下周上线

智谱发布 GLM-5.2，面向 GLM Coding Plan 全量用户开放，支持 1M 上下文，API 与开源版本将于下周上线，重点面向 AI Coding、长程 Agent 和复杂工程任务。
AI资讯
- 8.8k
- 0
AIHub6月13日
Hy3 preview - 腾讯混元开源的快慢思考融合的混合专家模型

Hy3 preview 是由腾讯混元团队开发的一个拥有 2950 亿参数的混合专家（MoE）模型，其中激活参数为 210 亿，MTP 层参数为 38 亿。Hy3 preview 是首个基于我们重构后的基础设施训练而成的模型，也是迄今为止我们发布的最强模型。它在复杂推理、指令遵循、上下文学习、代码生成和智能体任务等方面均有显著提升。
AI模型
- 4.8k
- 0
AIHub4月24日
DeepSeek-V4：DeepSeek 推出的新一代开源大语言模型

DeepSeek-V4 是 DeepSeek 推出的新一代开源大语言模型系列，面向长上下文理解、复杂推理、代码生成和 Agent 自动化任务场景。
AI模型
- 18.1k
- 0
AIHub4月24日
Qwen2-阿里云最新发布的通义千问开源大模型

Qwen2是阿里云通义千问团队开源的新一代大语言模型，推出了5个尺寸的预训练和指令微调模型，在中文英语的基础上，训练数据中增加了27种语言相关的高质量数据；代码和数学能力显著提升；增大了上下文长度支持，最高达到128K tokens（Qwen2-72B-Instruct）。多个评测基准上的领先表现。现已在Hugging Face和ModelScope开源。
AI模型
- 16.3k
- 0
AIHub24年6月7日
Llama中文社区

Llama中文社区是中国最大的开源技术社区，开放了一系列尺寸的大模型。基于当前最优秀的开源模型Llama2，使用主流Decoder-only的标准Transformer网络结构，支持32K的上下文长度（Context Length），为同尺寸模型中最长，能满足更长的多轮对话、知识问答与摘要等需求，模型应用场景更广泛。
AI模型
- 7.1k
- 0
TomatKim24年3月20日
通义千问720亿参数模型开源，适配企业级、科研级高性能应用

全尺寸、全模态开源，做AI时代最开放的大模型
AI资讯
- 2.5k
- 0
AIHub23年12月1日
Yi大模型-零一万物发布的开源大模型

Yi系列模型是由来自“零一万物”的开发者研发的大型语言模型。第一个公开版本包含两个双语版（英语/中文）基础模型，参数规模分别为6B和34B。两者都使用4K序列长度进行训练，并在推理时可以扩展到32K。
AI模型
- 18.6k
- 0
AIHub23年11月6日