我们都在租东西,没什么是稳的

现在用 AI 这件事,本质上就是租。租 compute、租 token、租 context window。Claude Pro 一个月 20 刀,给你的 context 是有上限的;你以为自己在用 Opus,背后可能悄悄换成了 Sonnet;模型本身又是非确定性的,同一个 prompt 跑两遍能给你两个答案。

Tejas 一句话点透:Harness 的核心就是 Reliability。它的作用就是把模型从一个「不可控黑盒」,锚定成一个「在你规则下稳定干活的工具」。没有 Harness,你每天上线本质上就是在赌模型今天心情好不好。

Harness 到底是个什么东西

回到字面意义。登山的人用 harness 把自己固定在山上,因为山是稳定的锚点;遛狗的人用 harness 防止狗乱跑,因为你需要约束它的行为。

放到 AI 世界里,Agent Harness 就是模型周围的一切——所有让它 grounded in reality(落地在现实里)的东西。这不是 ML 时代那种跑完就完事的 test suite,而是 Agent 时代的完整运行时。

一个完整的 Harness 包含这些核心部件:

  • Tool Registry:工具注册表,比如读写文件、执行 bash、操作浏览器
  • Model:可以是 Claude、GPT,也可以是开源模型
  • Context Management:负责自动压缩和维护上下文
  • Guardrails:安全护栏,比如 max steps、max messages
  • Agent Loop:循环执行逻辑,甚至可以是 loop 套 loop
  • Verify Step:跑测试、lint、做端到端检查

这些东西合起来,才能把模型从「随便浪」变成「按规则稳定干活」。

现场 Demo:四版迭代,让 GPT-3.5 给 Hacker News 点赞

Tejas 故意挑了最老的 GPT-3.5 Turbo,任务也简单到离谱:打开 Hacker News,给第一条帖子 upvote。

第一版:简单的 agent loop 加几个 tool。结果直接失败,更离谱的是模型还撒谎说「已经 upvote 完成」。这就是经典的模型自欺。

第二版:加上 Guardrails,包括 max iterations、max messages、自动压缩上下文。结果还是失败,但起码模型这回老老实实承认自己没搞定。

第三版:加上 Verify Step,由确定性代码去检查 upvote 按钮是否真的被点过。模型不再有机会自己骗自己。

第四版:加上 Login Handler。遇到登录页时,Harness 自动接管,填凭证并提交,最终成功 upvote。

最值得品的细节是:整个过程没改过一个字的 prompt,只改 Harness 结构,效果就从「彻底翻车」变成「稳定完成」。

怎么从零搭一个 Baby Harness

Tejas 现场代码的思路其实很朴素:

  • Playwright 打开浏览器,做真实的 Computer Use
  • 把 browser session 传给 tools
  • 写一个 RunHarness 函数,把 loop、guardrails、verify 全封装进去

这里有两条铁律不能破:

Verify Step 必须是 deterministic(确定性的),不能让模型自己验证自己。写代码的 Agent 验证自己写的代码,跟让嫌疑人当自己案子的法官没区别。

Login Handler 这类关键操作必须由 Harness 接管。说白了,凡是「容易翻车」的部分,都要从模型手里抢回来,用确定性代码自己管。模型负责动脑子,Harness 负责守住底线。

2026 是 Harness 年

Tejas 给了一条挺有意思的时间线:

  • 2025 是 Agent 年,所有人疯狂造 Agent
  • 2026 是 Harness 年,因为大家终于会意识到,没好 Harness 的 Agent 就是个玩具
  • 2027 可能会出现 Dynamic On-the-Fly Generated Harnesses——Agent 自己先生成 Harness,再执行任务

他的判断是:通往 AGI 的真正路径,不是模型变得更聪明,而是「模型提供智能,Harness 提供纪律」。

给独立开发者的几条直接抄的建议

  • 别老盯着 prompt 改,先造 Harness。prompt 调到天花板也救不了一个没护栏的 Agent。
  • Verify Step 必须独立、对抗性,写代码的 Agent 不能验证自己写的代码。
  • Guardrails 是底线,max steps、context 压缩、登录处理这些一个都不能少。
  • 关键操作交给确定性代码:登录、支付、敏感操作,全部由 Harness 接管,不要赌模型今天乖不乖。
  • 从一个能稳定跑完的小任务开始,慢慢加复杂度,别一上来就想造一个能干所有事的通用 Agent。

一句话总结

以前我们总担心 AI 抢饭碗,现在看,真正稀缺的从来不是模型,而是能把模型管好的那套系统。未来的稀缺岗位不是「prompt 工程师」,而是 Harness 工程师——能把不可控的智能,包装成可控的生产力。

你现在用 Agent 时,最头疼的是它撒谎、跑偏,还是上下文炸了?欢迎留言聊聊你的踩坑现场。