DeepSeek-V4 正式发布!
今天(2026年4月24日),DeepSeek-V4 预览版正式上线并同步开源。距离上一代 V3.2 已过去整整5个月,这5个月里各家大模型公司至少迭代了一代大版本+两三个小版本,DeepSeek面临的竞争压力不小。
但 V4 一出手,确实分量十足。
—
两大版本:Pro 与 Flash
| 版本 | 定位 | 特点 |
| V4-Pro | 旗舰版 | 复杂任务首选,推理能力强 |
| V4-Flash | 轻量版 | 速度快,适合日常对话 |
两个版本最大上下文长度均为 1M(百万token),均支持非思考模式与思考模式,思考模式支持 reasoning_effort 参数(high / max)。官方建议复杂 Agent 场景使用思考模式 + max 强度。
从此,1M 上下文是 DeepSeek 所有官方服务的标配。
—
核心技术架构解析
1. DSA2 注意力机制
V4 开创了一种全新注意力机制——DSA2,融合了 V3/R1 中的 DSA(DeepSeek Sparse Attention)和今年初论文提出的 NSA(Native Sparse Attention):
- 在 token 维度进行压缩,大幅降低计算和显存需求
- 结合稀疏注意力,实现全球领先的长上下文能力
- 头维度 512,采用稀疏多查询注意力(Sparse MQA)+ 滑动窗口注意力(SWA)
这意味着百万级上下文不再需要天文数字的显存,是真正的「普惠长上下文」。
2. MoE 混合专家架构
V4 采用融合 MoE(Fused MoE Mega-Kernel)架构:
- 每层 384 个专家,每次激活 6 个
- 旗舰版总参数约 1.6万亿,Flash/Lite 版约 2850亿
- MoE 效率 + 量化(INT8/INT4),理论上可在消费级硬件本地运行(双 RTX 4090 或单 RTX 5090)
3. Hyper-Connections 残差连接
V4 采用论文中提出的 Hyper-Connections 替代传统残差连接,在训练中更好地保留和传递信息,提升稳定性和准确性。
4. Muon 优化器 + GRPO 强化学习
- 优化器:Muon(基于牛顿-舒尔茨正交化的动量优化器)
- RL:GRPO(群相对策略优化)+ KL散度修正
- 预训练从 32K 上下文逐步扩展到 1M
—
Agent 能力全面优化
V4 针对主流 Agent 产品进行了专项适配和优化:
- Claude Code
- OpenClaw
- OpenCode
- CodeBuddy
在代码任务、文档生成等方面表现均有提升。Agent 场景建议使用 思考模式 + max 强度。
—
国产算力适配
路透社报道,V4 优先适配了 华为昇腾 950PR 芯片和 寒武纪 MLU,而非 NVIDIA。如果成功,这将是全球首个不依赖 NVIDIA 的顶级 AI 大模型,对国产算力生态意义重大。
华为昇腾 950PR 的计算性能据报告是 NVIDIA H20(允许出口中国的版本)的 2.87倍。
—
API 调用指南
# Pro 版本
curl https://api.deepseek.com/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \\n -H "Content-Type: application/json" \\n -d "{\"model\": \"deepseek-v4-pro\", \"messages\": [{\"role\": \"user\", \"content\": \"你好\"}]}"
# Flash 版本
curl https://api.deepseek.com/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \\n -H "Content-Type: application/json" \\n -d "{\"model\": \"deepseek-v4-flash\", \"messages\": [{\"role\": \"user\", \"content\": \"你好\"}]}"
# 思考模式
curl https://api.deepseek.com/v1/chat/completions \\n -H "Authorization: Bearer YOUR_API_KEY" \\n -H "Content-Type: application/json" \\n -d "{\"model\": \"deepseek-v4-pro\", \"messages\": [{\"role\": \"user\", \"content\": \"解这道数学题\"}], \"reasoning_effort\": \"max\"}"
⚠️ 旧接口 deepseek-chat 和 deepseek-reasoner 将于 2026-07-24 停用,目前分别指向 v4-flash 的非思考/思考模式。
—
融资动态
同一天,The Information 报道 DeepSeek 正在洽谈首轮外部融资,阿里和腾讯都在接触中,估值据报道从 100亿美元涨到了 200亿美元。梁文锋此前一直坚持「钱从来不是问题」,但V4的国产算力适配和模型规模增长显然需要大量投入。
—
总结
DeepSeek-V4 的几个关键突破:
- ✅ 百万上下文成为标配,不再是特权
- ✅ DSA2 创新注意力机制,长上下文不再烧显存
- ✅ Agent 能力专项优化,代码/文档场景明显提升
- ✅ 国产算力优先适配,昇腾+寒武纪
- ✅ 同步开源,Apache 2.0 协议
官网体验:https://chat.deepseek.com
API文档:https://api-docs.deepseek.com
—
本文由小E整理发布,数据来源于路透社、界面新闻、IT之家等权威媒体报道及 DeepSeek 官方公告。