DeepSeek-V4 今日正式上线：百万上下文、DSA2注意力、Agent全面优化

开发者小E

DeepSeek-V4 正式发布！

今天（2026年4月24日），DeepSeek-V4 预览版正式上线并同步开源。距离上一代 V3.2 已过去整整5个月，这5个月里各家大模型公司至少迭代了一代大版本+两三个小版本，DeepSeek面临的竞争压力不小。

但 V4 一出手，确实分量十足。

—

两大版本：Pro 与 Flash

版本	定位	特点
V4-Pro	旗舰版	复杂任务首选，推理能力强
V4-Flash	轻量版	速度快，适合日常对话

两个版本最大上下文长度均为 1M（百万token），均支持非思考模式与思考模式，思考模式支持 reasoning_effort 参数（high / max）。官方建议复杂 Agent 场景使用思考模式 + max 强度。

从此，1M 上下文是 DeepSeek 所有官方服务的标配。

—

核心技术架构解析

1. DSA2 注意力机制

V4 开创了一种全新注意力机制——DSA2，融合了 V3/R1 中的 DSA（DeepSeek Sparse Attention）和今年初论文提出的 NSA（Native Sparse Attention）：

在 token 维度进行压缩，大幅降低计算和显存需求
结合稀疏注意力，实现全球领先的长上下文能力
头维度 512，采用稀疏多查询注意力（Sparse MQA）+ 滑动窗口注意力（SWA）

这意味着百万级上下文不再需要天文数字的显存，是真正的「普惠长上下文」。

2. MoE 混合专家架构

V4 采用融合 MoE（Fused MoE Mega-Kernel）架构：

每层 384 个专家，每次激活 6 个
旗舰版总参数约 1.6万亿，Flash/Lite 版约 2850亿
MoE 效率 + 量化（INT8/INT4），理论上可在消费级硬件本地运行（双 RTX 4090 或单 RTX 5090）

3. Hyper-Connections 残差连接

V4 采用论文中提出的 Hyper-Connections 替代传统残差连接，在训练中更好地保留和传递信息，提升稳定性和准确性。

4. Muon 优化器 + GRPO 强化学习

优化器：Muon（基于牛顿-舒尔茨正交化的动量优化器）
RL：GRPO（群相对策略优化）+ KL散度修正
预训练从 32K 上下文逐步扩展到 1M

—

Agent 能力全面优化

V4 针对主流 Agent 产品进行了专项适配和优化：

Claude Code
OpenClaw
OpenCode
CodeBuddy

在代码任务、文档生成等方面表现均有提升。Agent 场景建议使用 思考模式 + max 强度。

—

国产算力适配

路透社报道，V4 优先适配了 华为昇腾 950PR 芯片和 寒武纪 MLU，而非 NVIDIA。如果成功，这将是全球首个不依赖 NVIDIA 的顶级 AI 大模型，对国产算力生态意义重大。

华为昇腾 950PR 的计算性能据报告是 NVIDIA H20（允许出口中国的版本）的 2.87倍。

—

API 调用指南

# Pro 版本
curl https://api.deepseek.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \\n  -H "Content-Type: application/json" \\n  -d "{\"model\": \"deepseek-v4-pro\", \"messages\": [{\"role\": \"user\", \"content\": \"你好\"}]}"

# Flash 版本
curl https://api.deepseek.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \\n  -H "Content-Type: application/json" \\n  -d "{\"model\": \"deepseek-v4-flash\", \"messages\": [{\"role\": \"user\", \"content\": \"你好\"}]}"

# 思考模式
curl https://api.deepseek.com/v1/chat/completions \\n  -H "Authorization: Bearer YOUR_API_KEY" \\n  -H "Content-Type: application/json" \\n  -d "{\"model\": \"deepseek-v4-pro\", \"messages\": [{\"role\": \"user\", \"content\": \"解这道数学题\"}], \"reasoning_effort\": \"max\"}"

⚠️ 旧接口 deepseek-chat 和 deepseek-reasoner 将于 2026-07-24 停用，目前分别指向 v4-flash 的非思考/思考模式。

—

融资动态

同一天，The Information 报道 DeepSeek 正在洽谈首轮外部融资，阿里和腾讯都在接触中，估值据报道从 100亿美元涨到了 200亿美元。梁文锋此前一直坚持「钱从来不是问题」，但V4的国产算力适配和模型规模增长显然需要大量投入。

—

总结

DeepSeek-V4 的几个关键突破：

✅ 百万上下文成为标配，不再是特权
✅ DSA2 创新注意力机制，长上下文不再烧显存
✅ Agent 能力专项优化，代码/文档场景明显提升
✅ 国产算力优先适配，昇腾+寒武纪
✅ 同步开源，Apache 2.0 协议

官网体验：https://chat.deepseek.com
API文档：https://api-docs.deepseek.com

—

本文由小E整理发布，数据来源于路透社、界面新闻、IT之家等权威媒体报道及 DeepSeek 官方公告。