我自己用了整整一天。芯片、性能、价格,三件事单拎出来都是大事,但凑在一起看,信号就完全不一样了。
卡脖子卡出了一条新路
有点讽刺。美国限制高端芯片出口,本意是让中国 AI 减速。结果 DeepSeek 在算力受限下,被逼着用大量低制程芯片堆并行计算,硬是跑出一套不依赖最新工艺的训练体系。
V4 的官方文档写得很直白:支持国产芯片训练和推理,下半年昇腾到货后,将完全移植到国产计算架构上。
黄仁勋自己也认这个逻辑。他在采访里说:"算力受限反而会逼出更聪明的算法。真正的杠杆在计算机科学。"他真正担心的不是 DeepSeek 今天有多强,而是——如果未来 DeepSeek 被专门为华为平台做优化,全球的 AI 模型跑在非美国硬件上效果更好,那才是真问题。
现在 V4 官宣完整支持国产芯片,意思是:不再需要那个限制了。自己的芯片路径、自己的模型、自己的训练体系,技术层面的自循环开始闭合。
差距是时间问题,不是结构问题
自媒体都在喊"全面超越""全球领先",DeepSeek 官方反而很冷静:我们距离国际顶尖大约差 3 到 6 个月。
这句话比任何吹捧都有力。它诚实,背后有个判断——差距是有限的、可追的。而且这个差距集中在少数极端任务:前沿推理、顶级数学竞赛、边界科研。在大多数人的日常工作里,故事是另外一回事。
技术报告里的几组对比,翻译成人话:
- 编程竞赛:V4 拿到 3206 分,Claude Opus 4.6 是 3168 分,GPT-5.4 是 3052 分——V4 领先
- 真实软件工程任务(修 bug、做工程需求):V4 完成率 80.6%,Claude Opus 80.8%,基本打平,都在全球顶尖水平
- 综合能力评测:V4 90.2%,Claude Opus 85.9%,V4 领先 4 个多点
- 知识问答准确性:V4 答对 57.9%,Claude 只有 46.2%,V4 明显领先
让 AI 写代码、做实际工作,V4 已经跟全球最贵的旗舰打成平手,不少地方甚至超过它们。
100 万上下文,第一次变得用得起
光说"支持 100 万上下文"很多人没感觉。换种说法:把季度报表、行业分析、会议纪要一股脑扔进去,让它帮你梳理关键决策点,它不会因为资料太多就开始混乱或忘掉前面的内容。
更关键的是,上下文扩大了,算力反而降了。这个效率提升来自架构创新,细节在官方技术论文 2.3 节。处理 100 万上下文时,所需计算量降到上一代的 27%,存储空间降到 10%。
我之前讲过一个公式:
好答案 = 好模型 × 好提问 × 好上文
很多人只盯着模型好不好,忽略了上文有多重要。AI 的本质是预测——离答案越近的内容,影响越大。你扔给它的资料越完整,它的答案越准。
以前 100 万上下文太贵,普通用户根本用不起。V4-Flash 把这个成本降到几乎可以忽略——这才是 100 万上下文真正的价值,不只是容量大,而是让"好上文"这件事,第一次变得人人负担得起。
我自己用了一整天,主力模型本来是 Claude Sonnet,Opus 更强但很少用——每次打开都要在心里盘算一下值不值得动旗舰。用了一天 V4,写稿、整理会议、处理复杂问题,没有让我明显觉得"不够用"的地方。
便宜不是促销,是新的游戏规则
V4 有两个版本。
Flash 版每百万 token 输出 $0.28。Claude Sonnet 是 $15,Claude Opus 是 $25——Flash 比 Sonnet 便宜 54 倍,比 Opus 便宜近 90 倍。Pro 版贵一些,$3.48,比 Sonnet 便宜 4 倍,比 Opus 便宜 7 倍左右。两个版本在 100 万上下文场景下,都比上一代 V3 还便宜。
这种差距是什么感受?以前用 Opus,每次都要在心里掂量一下:这个任务值不值得用这么贵的模型?这种判断只是几秒钟,但它会在你用 AI 的过程中形成一种无形的边界。V4 的定价,把这个心理负担基本清零了。
但真正的影响不只是个人用户。便宜叠加开源,整个应用生态的变化速度会完全不同。当一个模型便宜到可以随意嵌入各种产品——客服、搜索、数据分析、内部流程——过去因为 API 成本不划算的场景,现在全部重新变得可行。开源意味着任何开发者都能在上面建东西,不需要等某家公司开放接口,也不受平台限制。
三件事串起来,是一个闭环
把这次 V4 的几个突破放一起看:
- 技术层:不再被芯片卡脖子,国产计算路径已跑通
- 产品层:距顶尖 3 到 6 个月,实际任务上已与全球旗舰持平,100 万上下文算力反而更省
- 商业层:Flash 版比 Claude 便宜近 90 倍,开源让生态自由生长
三个维度在同一个版本里同时突破。系统性的闭环正在形成。
差距是时间问题,不是结构问题。当技术自循环、产品竞争力、生态扩散同时跑起来,这件事的终局,比大多数人预期的要近得多。
对独立开发者来说,最直接的动作是把 V4-Flash 当成默认模型试一试——以前因为成本不敢做的产品 idea,现在可以重新拉出清单算一遍账了。