从"预录软件"到"实时智能"
过去几十年,软件本质上是"预录"的:人类编写算法,计算机执行指令,数据必须结构化存储,通过精确查询检索。SQL 之所以不可或缺,正是因为它让这套范式可以运转。
AI 打破了这个模型。
我们第一次拥有了能理解非结构化信息的计算机——它能看图像、读文本、听声音、理解语义,能基于上下文和意图进行推理。更关键的是,它在实时生成智能。每一个回复都是新创建的,每一个答案都取决于你提供的上下文。这不是软件在检索存储的指令,而是软件在按需推理和生成智能。
正因为智能是实时生产的,整个计算堆栈都必须被重新发明。
AI 基础设施的五层架构
从工业视角看,AI 可以被拆解为五个层次:
第一层:能源
能源是最底层。实时生成智能,需要实时供应电力。每一个 token 的产出,背后都是电子在运动、热量在管理、能源在转化为算力。能源没有更底层的抽象,它是 AI 基础设施的第一性原理,也是系统能生产多少智能的硬约束。
第二层:芯片
芯片的任务是将能源高效转化为大规模计算。AI 工作负载需要海量并行度、高带宽内存和高速互联。芯片层的进步,决定了 AI 扩展的速度和智能的成本。
第三层:基础设施
包括土地、电力输送、冷却、建筑、网络,以及将数万块处理器编排成一台机器的系统。这些是 AI 工厂——它们的设计目标不是存储信息,而是制造智能。
第四层:模型
AI 模型能理解多种信息:语言、生物学、化学、物理、金融、医学,乃至物理世界本身。语言模型只是其中一个类别。蛋白质 AI、化学 AI、物理仿真、机器人、自动驾驶——最具变革性的工作正在这些领域发生。
第五层:应用
经济价值在这一层被创造。药物发现平台、工业机器人、法律 Copilot、自动驾驶汽车。自动驾驶是 AI 应用嵌入机器,人形机器人是 AI 应用嵌入身体——同一套技术栈,不同的产出形态。
完整链路:能源 → 芯片 → 基础设施 → 模型 → 应用。每一个成功的应用,都在向下拉动每一层,一直到为它供电的发电厂。
这场建设有多大?
目前的投入仅在数千亿美元量级,仍有数万亿美元的基础设施等待建造。全球范围内,芯片工厂、计算机组装厂、AI 工厂正以前所未有的规模兴建。这正在成为人类历史上最大的基础设施建设。
支撑这场建设所需的劳动力规模巨大:电工、管道工、钢铁工人、网络技术员、安装人员、运维人员——这些都是高技能、高薪酬的岗位,且严重供不应求。参与这场变革,不需要计算机科学博士学位。
过去一年发生了什么?
过去一年,AI 跨过了一个关键门槛:模型变得足够好,可以大规模使用。推理能力提升,幻觉减少,接地性(Grounding)大幅改善。基于 AI 构建的应用,第一次开始产生真实的经济价值。
药物发现、物流、客户服务、软件开发、制造业的应用已展现出强劲的产品-市场契合度,并对下方每一层产生强力拉动。
开源模型在其中扮演关键角色。全球大多数模型是免费的,研究者、创业公司、企业乃至国家都依赖开源模型参与前沿 AI。当开源模型触及前沿水平,它不只是改变了软件,而是激活了整个技术栈的需求。DeepSeek-R1 就是一个典型案例——通过广泛提供强推理模型,它加速了应用层的采用,并向下拉动了训练、基础设施、芯片和能源的需求。
AI 驱动生产力,而非替代人
以放射科为例:AI 现在辅助阅读影像,但放射科医生的需求仍在增长。这不是悖论——放射科医生的核心使命是服务患者,阅读影像只是其中一个环节。当 AI 承担更多常规工作,医生可以专注于判断、沟通和诊疗。医院变得更高效,服务更多患者,雇佣更多人。
生产力创造产能,产能创造增长。
延伸思考
对于正在搭建 AI Agent 和自动化工作流的从业者来说,这个五层模型提供了一个清晰的定位框架:你构建的每一个 Agent、每一条工作流,都处于"应用层",而它的性能、成本和可靠性,取决于下方四层的成熟度。理解这个全栈视角,能帮助你更好地做技术选型、评估成本结构,并判断哪些应用场景已经具备规模化的条件。我们仍处于早期,但方向已经明确——现在是入场建设的时候。