DeepSeek V4落地华为昇腾：黄仁勋最怕的那天来了

我自己用了整整一天。芯片、性能、价格，三件事单拎出来都是大事，但凑在一起看，信号就完全不一样了。

卡脖子卡出了一条新路

有点讽刺。美国限制高端芯片出口，本意是让中国 AI 减速。结果 DeepSeek 在算力受限下，被逼着用大量低制程芯片堆并行计算，硬是跑出一套不依赖最新工艺的训练体系。

V4 的官方文档写得很直白：支持国产芯片训练和推理，下半年昇腾到货后，将完全移植到国产计算架构上。

黄仁勋自己也认这个逻辑。他在采访里说："算力受限反而会逼出更聪明的算法。真正的杠杆在计算机科学。"他真正担心的不是 DeepSeek 今天有多强，而是——如果未来 DeepSeek 被专门为华为平台做优化，全球的 AI 模型跑在非美国硬件上效果更好，那才是真问题。

现在 V4 官宣完整支持国产芯片，意思是：不再需要那个限制了。自己的芯片路径、自己的模型、自己的训练体系，技术层面的自循环开始闭合。

差距是时间问题，不是结构问题

自媒体都在喊"全面超越""全球领先"，DeepSeek 官方反而很冷静：我们距离国际顶尖大约差 3 到 6 个月。

这句话比任何吹捧都有力。它诚实，背后有个判断——差距是有限的、可追的。而且这个差距集中在少数极端任务：前沿推理、顶级数学竞赛、边界科研。在大多数人的日常工作里，故事是另外一回事。

技术报告里的几组对比，翻译成人话：

编程竞赛：V4 拿到 3206 分，Claude Opus 4.6 是 3168 分，GPT-5.4 是 3052 分——V4 领先
真实软件工程任务（修 bug、做工程需求）：V4 完成率 80.6%，Claude Opus 80.8%，基本打平，都在全球顶尖水平
综合能力评测：V4 90.2%，Claude Opus 85.9%，V4 领先 4 个多点
知识问答准确性：V4 答对 57.9%，Claude 只有 46.2%，V4 明显领先

让 AI 写代码、做实际工作，V4 已经跟全球最贵的旗舰打成平手，不少地方甚至超过它们。

100 万上下文，第一次变得用得起

光说"支持 100 万上下文"很多人没感觉。换种说法：把季度报表、行业分析、会议纪要一股脑扔进去，让它帮你梳理关键决策点，它不会因为资料太多就开始混乱或忘掉前面的内容。

更关键的是，上下文扩大了，算力反而降了。这个效率提升来自架构创新，细节在官方技术论文 2.3 节。处理 100 万上下文时，所需计算量降到上一代的 27%，存储空间降到 10%。

我之前讲过一个公式：

好答案 = 好模型 × 好提问 × 好上文

很多人只盯着模型好不好，忽略了上文有多重要。AI 的本质是预测——离答案越近的内容，影响越大。你扔给它的资料越完整，它的答案越准。

以前 100 万上下文太贵，普通用户根本用不起。V4-Flash 把这个成本降到几乎可以忽略——这才是 100 万上下文真正的价值，不只是容量大，而是让"好上文"这件事，第一次变得人人负担得起。

我自己用了一整天，主力模型本来是 Claude Sonnet，Opus 更强但很少用——每次打开都要在心里盘算一下值不值得动旗舰。用了一天 V4，写稿、整理会议、处理复杂问题，没有让我明显觉得"不够用"的地方。

便宜不是促销，是新的游戏规则

V4 有两个版本。

Flash 版每百万 token 输出 $0.28。Claude Sonnet 是 $15，Claude Opus 是 $25——Flash 比 Sonnet 便宜 54 倍，比 Opus 便宜近 90 倍。Pro 版贵一些，$3.48，比 Sonnet 便宜 4 倍，比 Opus 便宜 7 倍左右。两个版本在 100 万上下文场景下，都比上一代 V3 还便宜。

这种差距是什么感受？以前用 Opus，每次都要在心里掂量一下：这个任务值不值得用这么贵的模型？这种判断只是几秒钟，但它会在你用 AI 的过程中形成一种无形的边界。V4 的定价，把这个心理负担基本清零了。

但真正的影响不只是个人用户。便宜叠加开源，整个应用生态的变化速度会完全不同。当一个模型便宜到可以随意嵌入各种产品——客服、搜索、数据分析、内部流程——过去因为 API 成本不划算的场景，现在全部重新变得可行。开源意味着任何开发者都能在上面建东西，不需要等某家公司开放接口，也不受平台限制。

三件事串起来，是一个闭环

把这次 V4 的几个突破放一起看：

技术层：不再被芯片卡脖子，国产计算路径已跑通
产品层：距顶尖 3 到 6 个月，实际任务上已与全球旗舰持平，100 万上下文算力反而更省
商业层：Flash 版比 Claude 便宜近 90 倍，开源让生态自由生长

三个维度在同一个版本里同时突破。系统性的闭环正在形成。

差距是时间问题，不是结构问题。当技术自循环、产品竞争力、生态扩散同时跑起来，这件事的终局，比大多数人预期的要近得多。

对独立开发者来说，最直接的动作是把 V4-Flash 当成默认模型试一试——以前因为成本不敢做的产品 idea，现在可以重新拉出清单算一遍账了。