豆包AI助手
当前位置:首页>AI资讯>DeepSeek-V4 预览版上线,全系标配100万上下文并同步开源

DeepSeek-V4 预览版上线,全系标配100万上下文并同步开源

深度求索(DeepSeek)今日正式发布新一代大模型 DeepSeek-V4 预览版,并同步在 HuggingFace 与 ModelScope 开源权重。新系列按规模分为旗舰版 V4-Pro 与经济版 V4-Flash,两个版本均原生支持一百万字超长上下文,1M 上下文自此成为 DeepSeek 所有官方服务的默认配置。

DeepSeek-V4 预览版

DeepSeek V4 采用了全新的注意力机制——在 token 维度进行压缩,并结合 DSA 稀疏注意力(DeepSeek Sparse Attention),从结构层面解决了传统 Transformer 在长文本下算力与显存急剧攀升的问题,相比上一代 V3.2 消耗显著降低。

能力方面,DeepSeek V4-Pro 在 Agentic Coding 评测中达到当前开源模型最佳水平,官方反馈实际使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式;数学、STEM 与竞赛代码测评中超越所有已公开的开源模型,比肩顶级闭源,世界知识仅稍逊于 Gemini-Pro-3.1。V4-Flash 则以更小的参数和激活提供更快、更经济的 API 服务,简单 Agent 任务与 Pro 旗鼓相当。

用户即日起可在 chat.deepseek.com 或官方 App 体验最新模型,API 同步上线,同时兼容 OpenAI ChatCompletions 与 Anthropic 接口,调用时将 model 参数改为 deepseek-v4-pro 或 deepseek-v4-flash 即可。需要注意的是,旧有模型名 deepseek-chat 与 deepseek-reasoner 将于 2026 年 7 月 24 日停止使用,当前阶段分别指向 V4-Flash 的非思考与思考模式。

©版权声明:如无特殊说明,本站所有内容均为AIHub.cn原创发布和所有。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。否则,我站将依法保留追究相关法律责任的权利。