DeepSeek-V4 预览版上线，全系标配100万上下文并同步开源

深度求索（DeepSeek）今日正式发布新一代大模型 DeepSeek-V4 预览版，并同步在 HuggingFace 与 ModelScope 开源权重。新系列按规模分为旗舰版 V4-Pro 与经济版 V4-Flash，两个版本均原生支持一百万字超长上下文，1M 上下文自此成为 DeepSeek 所有官方服务的默认配置。

DeepSeek V4 采用了全新的注意力机制——在 token 维度进行压缩，并结合 DSA 稀疏注意力（DeepSeek Sparse Attention），从结构层面解决了传统 Transformer 在长文本下算力与显存急剧攀升的问题，相比上一代 V3.2 消耗显著降低。

能力方面，DeepSeek V4-Pro 在 Agentic Coding 评测中达到当前开源模型最佳水平，官方反馈实际使用体验优于 Sonnet 4.5，交付质量接近 Opus 4.6 非思考模式；数学、STEM 与竞赛代码测评中超越所有已公开的开源模型，比肩顶级闭源，世界知识仅稍逊于 Gemini-Pro-3.1。V4-Flash 则以更小的参数和激活提供更快、更经济的 API 服务，简单 Agent 任务与 Pro 旗鼓相当。

用户即日起可在 chat.deepseek.com 或官方 App 体验最新模型，API 同步上线，同时兼容 OpenAI ChatCompletions 与 Anthropic 接口，调用时将 model 参数改为 deepseek-v4-pro 或 deepseek-v4-flash 即可。需要注意的是，旧有模型名 deepseek-chat 与 deepseek-reasoner 将于 2026 年 7 月 24 日停止使用，当前阶段分别指向 V4-Flash 的非思考与思考模式。