-
GLM-5.2:智谱推出并开源的新一代旗舰基座模型
GLM-5.2 是智谱AI推出并开源的旗舰基座模型,支持 1M 上下文与 128K 最大输出 Tokens,面向 Coding、复杂工程开发、长程任务执行和 AI Agent 场景,支持 API 调用与本地部署。- 1.7k
- 0
-
Kimi K2.7 Code 发布并开源:面向长程 Coding 与 Agent 任务优化
近日,月之暗面推出新一代代码专用模型 Kimi K2.7 Code。这是 Kimi 系列面向 AI 编程和 Coding Agent 场景的最新模型,已在 Kimi API 平台开放调用,并在 Hugging Face 提供开源权重。 从定位来看,Kimi K2.7 Code 不是普通聊天模型,而是专门面向代码生成、代码库理解、调试重构、多文件修改和复杂软件工程任务优化的 Coding Agent…- 2.3k
- 0
-
Kimi K2.7 Code:月之暗面推出的开源代码专用 Agent 模型
Kimi K2.7 Code 是 Moonshot AI 推出的代码专用 Agent 模型,面向长程编程任务、代码库理解、调试重构和软件工程自动化场景优化。模型采用 MoE 架构,拥有 1T 总参数、32B 激活参数,支持 256K 上下文、文本/图片/视频输入、思考模式、多步工具调用和 OpenAI 兼容 API,已在 Hugging Face 开放权重。- 1k
- 0
-
智谱 GLM-5.2 开放:支持 1M 上下文,API 与开源版本下周上线
智谱发布 GLM-5.2,面向 GLM Coding Plan 全量用户开放,支持 1M 上下文,API 与开源版本将于下周上线,重点面向 AI Coding、长程 Agent 和复杂工程任务。- 8.8k
- 0
-
Hy3 preview - 腾讯混元开源的快慢思考融合的混合专家模型
Hy3 preview 是由腾讯混元团队开发的一个拥有 2950 亿参数的混合专家(MoE)模型,其中激活参数为 210 亿,MTP 层参数为 38 亿。Hy3 preview 是首个基于我们重构后的基础设施训练而成的模型,也是迄今为止我们发布的最强模型。它在复杂推理、指令遵循、上下文学习、代码生成和智能体任务等方面均有显著提升。- 4.8k
- 0
-
DeepSeek-V4:DeepSeek 推出的新一代开源大语言模型
DeepSeek-V4 是 DeepSeek 推出的新一代开源大语言模型系列,面向长上下文理解、复杂推理、代码生成和 Agent 自动化任务场景。- 18.1k
- 0
-
Qwen2-阿里云最新发布的通义千问开源大模型
Qwen2是阿里云通义千问团队开源的新一代大语言模型,推出了5个尺寸的预训练和指令微调模型,在中文英语的基础上,训练数据中增加了27种语言相关的高质量数据;代码和数学能力显著提升;增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。多个评测基准上的领先表现。现已在Hugging Face和ModelScope开源。- 16.3k
- 0
-
-
Yi大模型-零一万物发布的开源大模型
Yi系列模型是由来自“零一万物”的开发者研发的大型语言模型。第一个公开版本包含两个双语版(英语/中文)基础模型,参数规模分别为6B和34B。两者都使用4K序列长度进行训练,并在推理时可以扩展到32K。- 18.6k
- 0











