网站首页 > 市场观察 > 行业动态
DeepSeek V4开源炸场:代码能力登顶,价格“打骨折”
发布时间:2026-05-05

26571712-2MRdKe.jpg?auth_key=1778428799-

DeepSeek V4 预览版开源上线后,AI圈迎来“中国时刻”。


DeepSeek V4同步放出两个版本——V4-Pro(1.6万亿参数)和V4-Flash(2840亿参数),均支持100万token超长上下文。

更震撼的是:它用不到顶级闭源模型1%的价格,干出了90%的性能——尤其在代码领域,直接冲进全球第一梯队。


01


|DeepSeek V4 表现亮眼,性价比引发热议

根据第三方评测:Arena.ai 在 X(原 Twitter)上评价 V4 Pro(思考模式)是“相比 V3.2 的一次巨大飞跃”,在代码能力排行榜上位列开源模型第3名,综合排名第14。


Vals AI 则表示,V4 在其代码测试榜单(Vibe Code Benchmark)中以压倒性优势拿下开源模型第一,甚至超过了 Gemini 3.1 Pro 等闭源大模型,性能比上一代 V3.2 提升了大约 10 倍。


26571712-YAQYw5.jpg?auth_key=1778428799-


用户反馈开始分化:

不少网友在 X 上直呼“性价比打穿地板”,认为太值了。


但 DeepSeek 官方却很谨慎,在介绍材料中表示:当前模型在知识和推理能力上接近闭源顶尖系统,但仍落后约 3–6 个月;受限于高端算力,V4-Pro 的服务容量有限


总之:性能强、价格低,但官方提醒——别期待它完全对标最强闭源模型,还在追赶路上。


02


|价格超低,未来可能还会更便宜

DeepSeek 这次最吸引人的,不只是性能,更是惊人的低价。

V4-Flash(小模型):

  • 输入:每百万 token 0.14 美元

  • 输出:每百万 token 0.28 美元

比 OpenAI 的 GPT-5.4 Nano 和 Gemini 3.1 Flash-Lite 都便宜,是目前小模型里最便宜的。


V4-Pro(大模型):

  • 输入:1.74 美元 /

  • 输出:3.48 美元(每百万 token)

远低于 Gemini 3.1 Pro(12 美元输出)、GPT-5.4(15 美元)、Claude Sonnet 4.6(15 美元)和 Claude Opus 4.7(25 美元)。


技术博主 Simon Willison 总结:V4-Pro 是当前所有顶尖大模型里最省钱的选择。


为什么能这么便宜?


DeepSeek 表示,这得益于他们在处理超长文本(100万 token)时做了极致优化:

V4-Pro 的计算量只有上一代 V3.2 的 27%,内存占用(KV缓存)更是降到 10%;V4-Flash 更夸张,分别只有 10% 和 7%。


而且,价格可能还会降!

官方在说明中特别提到:“目前 V4-Pro 的服务容量有限,主要是因为高端算力不足。预计今年下半年,随着国产昇腾950超节点大规模上线,Pro 版本的价格将大幅下调。”


简单说:现在已经是地板价,但地板下面可能还有地下室。


03


|新架构突破长文本瓶颈,还适配国产芯片

DeepSeek-V4 最核心的技术突破,是它首创的一种混合注意力机制,叫 CSA + HCA。这个设计专门解决了一个老大难问题:传统大模型在处理超长文本(比如100万字)时,计算量和显存消耗会“爆炸式”增长,根本没法实用。


CSA(压缩稀疏注意力):

把每4个词压缩成一个“信息包”,只挑最相关的部分来算,既保留了中间细节,又大大减少了计算量。


HCA(重度压缩注意力):

把整篇超长文本进一步浓缩成几个“骨架级”的关键信息块,用来把握整体逻辑,适合做宏观推理。


除了注意力机制,V4 还做了两项重要升级:

引入 mHC 流形约束连接:比传统的“残差连接”更稳定,能让信号在模型里传得更高效;使用 Muon 优化器:替代常见的 AdamW,更适合训练像 V4 这样的“专家混合”(MoE)大模型,还能支持低精度训练,省资源。


这些优化加起来,推理速度最高能提升近2倍。更关键的是——它跑在国产芯片上!


DeepSeek-V4 已在 华为昇腾 NPU 上完成深度优化,通过“细粒度专家并行”技术,在普通推理任务中提速 1.5 到 1.73 倍。


官方称,这是全球首个在国产算力上完成训练和推理的万亿参数开源模型。


不过,目前昇腾平台的优化代码还没开源,属于闭源加速方案。


另一方面,寒武纪已经通过开源框架 vLLM 完成了对 V4-Flash 和 V4-Pro 的支持,相关代码已在 GitHub 开源,开发者可以直接用。


04


竞泰观点|关注三条主线,一个信号

主线一:国产AI芯片与算力生态

华为昇腾产业链:芯片、服务器、液冷、集群运维;寒武纪、天数智芯:受益于模型适配浪潮;国产AI云服务商:提供昇腾算力租赁的平台将迎爆发。


主线二:开源模型驱动的应用层创新

AI编程工具、智能体开发平台、长文本分析SaaS:V4的低价+高性能将引爆B端需求;本地化部署方案:MIT协议商用免费,中小企业可低成本构建私有模型。


主线三:关注“模型即服务”(MaaS)格局重塑

DeepSeek以API+开源双轮驱动,挑战OpenAI/Anthropic定价权;开发者迁移成本极低(兼容OpenAI格式),生态切换加速。


风险提示:多模态能力暂缺(纯文本)、Pro版初期供应紧张。



统一服务热线:
18117862238
邮箱地址:zhangruxia@jt-capital.com.cn
公司地址:成都市高新区泰合·国际金融中心18层

Copyright © 2021 jt-capital.com.cn All Rights Reserved 

版权所有: 竞泰资本 粤ICP备2022003949号-1  

快速链接

Copyright © 2021 jt-capital.com.cn All Rights Reserved 

版权所有: 竞泰资本 粤ICP备2022003949号-1