拆解Claude Code源码：一个先进Agent的Harness究竟是怎么搭起来的

一个不能忽略的背景是，Claude Code 的源码此前曾被泄露，新璐团队直接把它当作教学样本，做成了开源教程 Learn Claude Code，目前在 GitHub 上已经积累了相当可观的关注度。这意味着，很多人第一次有机会从工程层面，看清一个「先进 Agent」究竟是怎么被构建出来的。

Harness 到底是什么

新璐给的定义干脆利落：模型以外的所有东西，都是 Harness。

把模型看作一个极其聪明的大脑，它本身其实是「无能为力」的。它能推理、能回答问题，但无法行动，无法长期记忆，也无法与外部世界产生真正的交互。Harness 的作用，就是给这个大脑装上身体和手脚，让它具备行动能力、记忆能力以及协作能力。

一个 Agent 最终能做到什么程度，很大程度上不取决于模型本身，而取决于这套「外壳」设计得有多好。

过去大多数 Agent 系统，本质上是「流程驱动」的。开发者通过 Prompt Flow 或类似 LangGraph 的方式，把任务拆成节点，再用流程串起来，整个系统更像一条精心设计的流水线。

Claude Code 的思路完全不同。它尽可能减少人为流程控制，把主动权交还给模型。模型不再只是执行某个节点，而是直接承担「Agent」的角色，在充分上下文中自主决策、行动并纠错。

换句话说，它不是在「指挥模型」，而是在「释放模型」。模型成为真正的主角，而不是被流程约束的执行器。

如果把 Harness 拆开来看，可以分成三个核心层次。这也是这期对谈最有价值的部分。

第一层：Action Layer（执行能力）

目标很简单：让模型能真正动手做事。核心能力包括文件系统操作、搜索、代码执行环境、浏览器交互等。这些能力足够完整，模型才具备处理复杂任务的基础。

一个值得注意的实践经验是，CLI 环境往往比复杂协议更有效。原因并不神秘——模型在训练过程中见过大量命令行操作，对这类交互方式更熟悉、也更稳定。所以，构建一个接近 UNIX 的执行环境，往往比引入额外抽象更实用。

第二层：Context 与 Memory（上下文与记忆）

模型的上下文窗口始终有限，长任务不可避免会遇到「记不住」的问题。Claude Code 在这一层的设计相当巧妙，没有走复杂知识图谱的路线，而是采用更接近人类习惯的方式：

关键不在于记住一切，而在于学会整理和取舍。好的记忆系统，更像人类的大脑，而不是一个无限堆积的数据库。

第三层：Orchestration 与 Governance（治理与编排）

当系统里存在多个 Agent，问题就变成了如何协作。任务是并行还是串行，不同 Agent 的权限怎么隔离，信息如何传递，冲突如何避免，都属于这一层。

Claude Code 的一个重要特点是，它并没有把这些逻辑写死成固定流程，而是尽可能交给模型基于上下文动态决策。这种「弱编排」的方式，让系统更灵活，也更接近真实的人类协作模式。

从工程角度看，这套思路给出的方向其实非常明确：

新璐团队工具链的本质目标，就是让开发者在任何可以运行 JavaScript 的环境里，都能快速搭建这样一套轻量但完整的 Agent 运行系统。

关于未来，新璐的判断相当激进，但不是没有逻辑。

随着模型能力持续提升，Agent 会变得越来越自洽。模型本身负责思考与决策，Harness 只提供必要的执行环境与边界约束。系统的复杂性，会逐渐从「人写流程」转向「模型自组织」。

在这种趋势下，「零人公司」不再是一个科幻概念，而是可以被逐步逼近的现实。每个人都可能拥有一组长期运行的 Agent，持续完成任务、创造价值，而人类只负责设定目标和方向。

Claude Code 的价值，不仅是给出了一个工程范例，更重要的是，它改变了我们看待 Agent 的方式。

Agent 不再是一个由流程驱动的工具，而是一个具备行动能力的智能体。Harness 的意义，也不再是控制，而是赋能。当模型拥有足够好的「身体」与「环境」，它就不再只是聪明的工具，而更像一个可以独立完成工作的合作伙伴。

如果你正在搭建自己的一人公司基础设施，与其继续在节点式流程上叠加复杂度，不如回到这三层结构，问自己一个最朴素的问题：我究竟是在指挥模型，还是在释放它？ 答案不同，路径就完全不同。