DeepSeek V4开源炸场：代码能力登顶，价格“打骨折”

EN / 中文

网站首页 > 市场观察 > 行业动态

发布时间：2026-05-05

26571712-2MRdKe.jpg?auth_key=1778428799-

DeepSeek V4 预览版开源上线后，AI圈迎来“中国时刻”。

DeepSeek V4同步放出两个版本——V4-Pro（1.6万亿参数）和V4-Flash（2840亿参数），均支持100万token超长上下文。

更震撼的是：它用不到顶级闭源模型1%的价格，干出了90%的性能——尤其在代码领域，直接冲进全球第一梯队。

｜DeepSeek V4 表现亮眼，性价比引发热议

根据第三方评测：Arena.ai 在 X（原 Twitter）上评价 V4 Pro（思考模式）是“相比 V3.2 的一次巨大飞跃”，在代码能力排行榜上位列开源模型第3名，综合排名第14。

Vals AI 则表示，V4 在其代码测试榜单（Vibe Code Benchmark）中以压倒性优势拿下开源模型第一，甚至超过了 Gemini 3.1 Pro 等闭源大模型，性能比上一代 V3.2 提升了大约 10 倍。

26571712-YAQYw5.jpg?auth_key=1778428799-

用户反馈开始分化：

不少网友在 X 上直呼“性价比打穿地板”，认为太值了。

但 DeepSeek 官方却很谨慎，在介绍材料中表示：当前模型在知识和推理能力上接近闭源顶尖系统，但仍落后约 3–6 个月；受限于高端算力，V4-Pro 的服务容量有限。

总之：性能强、价格低，但官方提醒——别期待它完全对标最强闭源模型，还在追赶路上。

｜价格超低，未来可能还会更便宜

DeepSeek 这次最吸引人的，不只是性能，更是惊人的低价。

V4-Flash（小模型）：

输入：每百万 token 0.14 美元
输出：每百万 token 0.28 美元

比 OpenAI 的 GPT-5.4 Nano 和 Gemini 3.1 Flash-Lite 都便宜，是目前小模型里最便宜的。

V4-Pro（大模型）：

输入：1.74 美元 /
输出：3.48 美元（每百万 token）

远低于 Gemini 3.1 Pro（12 美元输出）、GPT-5.4（15 美元）、Claude Sonnet 4.6（15 美元）和 Claude Opus 4.7（25 美元）。

技术博主 Simon Willison 总结：V4-Pro 是当前所有顶尖大模型里最省钱的选择。

为什么能这么便宜？

DeepSeek 表示，这得益于他们在处理超长文本（100万 token）时做了极致优化：

V4-Pro 的计算量只有上一代 V3.2 的 27%，内存占用（KV缓存）更是降到 10%；V4-Flash 更夸张，分别只有 10% 和 7%。

而且，价格可能还会降！

官方在说明中特别提到：“目前 V4-Pro 的服务容量有限，主要是因为高端算力不足。预计今年下半年，随着国产昇腾950超节点大规模上线，Pro 版本的价格将大幅下调。”

简单说：现在已经是地板价，但地板下面可能还有地下室。

｜新架构突破长文本瓶颈，还适配国产芯片

DeepSeek-V4 最核心的技术突破，是它首创的一种混合注意力机制，叫 CSA + HCA。这个设计专门解决了一个老大难问题：传统大模型在处理超长文本（比如100万字）时，计算量和显存消耗会“爆炸式”增长，根本没法实用。

CSA（压缩稀疏注意力）：

把每4个词压缩成一个“信息包”，只挑最相关的部分来算，既保留了中间细节，又大大减少了计算量。

HCA（重度压缩注意力）：

把整篇超长文本进一步浓缩成几个“骨架级”的关键信息块，用来把握整体逻辑，适合做宏观推理。

除了注意力机制，V4 还做了两项重要升级：

引入 mHC 流形约束连接：比传统的“残差连接”更稳定，能让信号在模型里传得更高效；使用 Muon 优化器：替代常见的 AdamW，更适合训练像 V4 这样的“专家混合”（MoE）大模型，还能支持低精度训练，省资源。

这些优化加起来，推理速度最高能提升近2倍。更关键的是——它跑在国产芯片上！

DeepSeek-V4 已在华为昇腾 NPU 上完成深度优化，通过“细粒度专家并行”技术，在普通推理任务中提速 1.5 到 1.73 倍。

官方称，这是全球首个在国产算力上完成训练和推理的万亿参数开源模型。

不过，目前昇腾平台的优化代码还没开源，属于闭源加速方案。

另一方面，寒武纪已经通过开源框架 vLLM 完成了对 V4-Flash 和 V4-Pro 的支持，相关代码已在 GitHub 开源，开发者可以直接用。

竞泰观点｜关注三条主线，一个信号

主线一：国产AI芯片与算力生态

华为昇腾产业链：芯片、服务器、液冷、集群运维；寒武纪、天数智芯：受益于模型适配浪潮；国产AI云服务商：提供昇腾算力租赁的平台将迎爆发。

主线二：开源模型驱动的应用层创新

AI编程工具、智能体开发平台、长文本分析SaaS：V4的低价+高性能将引爆B端需求；本地化部署方案：MIT协议商用免费，中小企业可低成本构建私有模型。

主线三：关注“模型即服务”（MaaS）格局重塑

DeepSeek以API+开源双轮驱动，挑战OpenAI/Anthropic定价权；开发者迁移成本极低（兼容OpenAI格式），生态切换加速。

风险提示：多模态能力暂缺（纯文本）、Pro版初期供应紧张。

上一条：美伊谈判“打打谈谈”，欧美股市却在大涨

下一条：谷歌豪掷400亿入股“对手”Anthropic！

返回列表

统一服务热线：

18117862238

邮箱地址：zhangruxia@jt-capital.com.cn
公司地址：成都市高新区泰合·国际金融中心18层

快速链接

微信咨询
电话咨询

18117862238
返回顶部