一个不能忽略的背景是,Claude Code 的源码此前曾被泄露,新璐团队直接把它当作教学样本,做成了开源教程 Learn Claude Code,目前在 GitHub 上已经积累了相当可观的关注度。这意味着,很多人第一次有机会从工程层面,看清一个「先进 Agent」究竟是怎么被构建出来的。

Harness 到底是什么

新璐给的定义干脆利落:模型以外的所有东西,都是 Harness。

把模型看作一个极其聪明的大脑,它本身其实是「无能为力」的。它能推理、能回答问题,但无法行动,无法长期记忆,也无法与外部世界产生真正的交互。Harness 的作用,就是给这个大脑装上身体和手脚,让它具备行动能力、记忆能力以及协作能力。

一个 Agent 最终能做到什么程度,很大程度上不取决于模型本身,而取决于这套「外壳」设计得有多好。

为什么 Claude Code 被认为是目前最好的 Harness

过去大多数 Agent 系统,本质上是「流程驱动」的。开发者通过 Prompt Flow 或类似 LangGraph 的方式,把任务拆成节点,再用流程串起来,整个系统更像一条精心设计的流水线。

Claude Code 的思路完全不同。它尽可能减少人为流程控制,把主动权交还给模型。模型不再只是执行某个节点,而是直接承担「Agent」的角色,在充分上下文中自主决策、行动并纠错。

换句话说,它不是在「指挥模型」,而是在「释放模型」。模型成为真正的主角,而不是被流程约束的执行器。

拆开 Harness:清晰的三层结构

如果把 Harness 拆开来看,可以分成三个核心层次。这也是这期对谈最有价值的部分。

第一层:Action Layer(执行能力)

目标很简单:让模型能真正动手做事。核心能力包括文件系统操作、搜索、代码执行环境、浏览器交互等。这些能力足够完整,模型才具备处理复杂任务的基础。

一个值得注意的实践经验是,CLI 环境往往比复杂协议更有效。原因并不神秘——模型在训练过程中见过大量命令行操作,对这类交互方式更熟悉、也更稳定。所以,构建一个接近 UNIX 的执行环境,往往比引入额外抽象更实用。

第二层:Context 与 Memory(上下文与记忆)

模型的上下文窗口始终有限,长任务不可避免会遇到「记不住」的问题。Claude Code 在这一层的设计相当巧妙,没有走复杂知识图谱的路线,而是采用更接近人类习惯的方式:

  • 使用结构化的 Markdown 文件来存储记忆
  • 引入类似「做梦」的机制,让一个子 Agent 定期回顾最近的对话,对信息进行整理、纠错与合并
  • 当上下文接近上限时,生成总结文档,作为「接力棒」交给后续任务继续执行

关键不在于记住一切,而在于学会整理和取舍。好的记忆系统,更像人类的大脑,而不是一个无限堆积的数据库。

第三层:Orchestration 与 Governance(治理与编排)

当系统里存在多个 Agent,问题就变成了如何协作。任务是并行还是串行,不同 Agent 的权限怎么隔离,信息如何传递,冲突如何避免,都属于这一层。

Claude Code 的一个重要特点是,它并没有把这些逻辑写死成固定流程,而是尽可能交给模型基于上下文动态决策。这种「弱编排」的方式,让系统更灵活,也更接近真实的人类协作模式。

给实践者的几条更现实的启发

从工程角度看,这套思路给出的方向其实非常明确:

  • 不再依赖传统的节点式流程编排,而是让模型成为核心决策者
  • 优先构建一个简单、稳定的 CLI 或类 UNIX 环境,让模型自然发挥
  • 在记忆设计上保持克制,用结构化文档配合自动整理机制,而不是过度工程化
  • 在上下文管理上减少人为干预,让系统具备自我收敛能力

新璐团队工具链的本质目标,就是让开发者在任何可以运行 JavaScript 的环境里,都能快速搭建这样一套轻量但完整的 Agent 运行系统。

一个正在到来的方向

关于未来,新璐的判断相当激进,但不是没有逻辑。

随着模型能力持续提升,Agent 会变得越来越自洽。模型本身负责思考与决策,Harness 只提供必要的执行环境与边界约束。系统的复杂性,会逐渐从「人写流程」转向「模型自组织」。

在这种趋势下,「零人公司」不再是一个科幻概念,而是可以被逐步逼近的现实。每个人都可能拥有一组长期运行的 Agent,持续完成任务、创造价值,而人类只负责设定目标和方向。

真正的分水岭

Claude Code 的价值,不仅是给出了一个工程范例,更重要的是,它改变了我们看待 Agent 的方式。

Agent 不再是一个由流程驱动的工具,而是一个具备行动能力的智能体。Harness 的意义,也不再是控制,而是赋能。当模型拥有足够好的「身体」与「环境」,它就不再只是聪明的工具,而更像一个可以独立完成工作的合作伙伴。

如果你正在搭建自己的一人公司基础设施,与其继续在节点式流程上叠加复杂度,不如回到这三层结构,问自己一个最朴素的问题:我究竟是在指挥模型,还是在释放它? 答案不同,路径就完全不同。