
DeepSeek V4 预览版开源上线后,AI圈迎来“中国时刻”。
DeepSeek V4同步放出两个版本——V4-Pro(1.6万亿参数)和V4-Flash(2840亿参数),均支持100万token超长上下文。
更震撼的是:它用不到顶级闭源模型1%的价格,干出了90%的性能——尤其在代码领域,直接冲进全球第一梯队。
|DeepSeek V4 表现亮眼,性价比引发热议
根据第三方评测:Arena.ai 在 X(原 Twitter)上评价 V4 Pro(思考模式)是“相比 V3.2 的一次巨大飞跃”,在代码能力排行榜上位列开源模型第3名,综合排名第14。
Vals AI 则表示,V4 在其代码测试榜单(Vibe Code Benchmark)中以压倒性优势拿下开源模型第一,甚至超过了 Gemini 3.1 Pro 等闭源大模型,性能比上一代 V3.2 提升了大约 10 倍。

用户反馈开始分化:
不少网友在 X 上直呼“性价比打穿地板”,认为太值了。
但 DeepSeek 官方却很谨慎,在介绍材料中表示:当前模型在知识和推理能力上接近闭源顶尖系统,但仍落后约 3–6 个月;受限于高端算力,V4-Pro 的服务容量有限。
总之:性能强、价格低,但官方提醒——别期待它完全对标最强闭源模型,还在追赶路上。
|价格超低,未来可能还会更便宜
DeepSeek 这次最吸引人的,不只是性能,更是惊人的低价。
V4-Flash(小模型):
输入:每百万 token 0.14 美元 输出:每百万 token 0.28 美元
比 OpenAI 的 GPT-5.4 Nano 和 Gemini 3.1 Flash-Lite 都便宜,是目前小模型里最便宜的。
V4-Pro(大模型):
输入:1.74 美元 / 输出:3.48 美元(每百万 token)
远低于 Gemini 3.1 Pro(12 美元输出)、GPT-5.4(15 美元)、Claude Sonnet 4.6(15 美元)和 Claude Opus 4.7(25 美元)。
技术博主 Simon Willison 总结:V4-Pro 是当前所有顶尖大模型里最省钱的选择。
为什么能这么便宜?
DeepSeek 表示,这得益于他们在处理超长文本(100万 token)时做了极致优化:
V4-Pro 的计算量只有上一代 V3.2 的 27%,内存占用(KV缓存)更是降到 10%;V4-Flash 更夸张,分别只有 10% 和 7%。
而且,价格可能还会降!
官方在说明中特别提到:“目前 V4-Pro 的服务容量有限,主要是因为高端算力不足。预计今年下半年,随着国产昇腾950超节点大规模上线,Pro 版本的价格将大幅下调。”
简单说:现在已经是地板价,但地板下面可能还有地下室。
|新架构突破长文本瓶颈,还适配国产芯片
DeepSeek-V4 最核心的技术突破,是它首创的一种混合注意力机制,叫 CSA + HCA。这个设计专门解决了一个老大难问题:传统大模型在处理超长文本(比如100万字)时,计算量和显存消耗会“爆炸式”增长,根本没法实用。
CSA(压缩稀疏注意力):
把每4个词压缩成一个“信息包”,只挑最相关的部分来算,既保留了中间细节,又大大减少了计算量。
HCA(重度压缩注意力):
把整篇超长文本进一步浓缩成几个“骨架级”的关键信息块,用来把握整体逻辑,适合做宏观推理。
除了注意力机制,V4 还做了两项重要升级:
引入 mHC 流形约束连接:比传统的“残差连接”更稳定,能让信号在模型里传得更高效;使用 Muon 优化器:替代常见的 AdamW,更适合训练像 V4 这样的“专家混合”(MoE)大模型,还能支持低精度训练,省资源。
这些优化加起来,推理速度最高能提升近2倍。更关键的是——它跑在国产芯片上!
DeepSeek-V4 已在 华为昇腾 NPU 上完成深度优化,通过“细粒度专家并行”技术,在普通推理任务中提速 1.5 到 1.73 倍。
官方称,这是全球首个在国产算力上完成训练和推理的万亿参数开源模型。
不过,目前昇腾平台的优化代码还没开源,属于闭源加速方案。
另一方面,寒武纪已经通过开源框架 vLLM 完成了对 V4-Flash 和 V4-Pro 的支持,相关代码已在 GitHub 开源,开发者可以直接用。
竞泰观点|关注三条主线,一个信号
主线一:国产AI芯片与算力生态
华为昇腾产业链:芯片、服务器、液冷、集群运维;寒武纪、天数智芯:受益于模型适配浪潮;国产AI云服务商:提供昇腾算力租赁的平台将迎爆发。
主线二:开源模型驱动的应用层创新
AI编程工具、智能体开发平台、长文本分析SaaS:V4的低价+高性能将引爆B端需求;本地化部署方案:MIT协议商用免费,中小企业可低成本构建私有模型。
主线三:关注“模型即服务”(MaaS)格局重塑
DeepSeek以API+开源双轮驱动,挑战OpenAI/Anthropic定价权;开发者迁移成本极低(兼容OpenAI格式),生态切换加速。
风险提示:多模态能力暂缺(纯文本)、Pro版初期供应紧张。





