模型不是关键，Harness 才是：18分钟把 GPT-3.5 改造成稳定 Agent

我们都在租东西，没什么是稳的

现在用 AI 这件事，本质上就是租。租 compute、租 token、租 context window。Claude Pro 一个月 20 刀，给你的 context 是有上限的；你以为自己在用 Opus，背后可能悄悄换成了 Sonnet；模型本身又是非确定性的，同一个 prompt 跑两遍能给你两个答案。

Tejas 一句话点透：Harness 的核心就是 Reliability。它的作用就是把模型从一个「不可控黑盒」，锚定成一个「在你规则下稳定干活的工具」。没有 Harness，你每天上线本质上就是在赌模型今天心情好不好。

Harness 到底是个什么东西

回到字面意义。登山的人用 harness 把自己固定在山上，因为山是稳定的锚点；遛狗的人用 harness 防止狗乱跑，因为你需要约束它的行为。

放到 AI 世界里，Agent Harness 就是模型周围的一切——所有让它 grounded in reality（落地在现实里）的东西。这不是 ML 时代那种跑完就完事的 test suite，而是 Agent 时代的完整运行时。

一个完整的 Harness 包含这些核心部件：

Tool Registry：工具注册表，比如读写文件、执行 bash、操作浏览器
Model：可以是 Claude、GPT，也可以是开源模型
Context Management：负责自动压缩和维护上下文
Guardrails：安全护栏，比如 max steps、max messages
Agent Loop：循环执行逻辑，甚至可以是 loop 套 loop
Verify Step：跑测试、lint、做端到端检查

这些东西合起来，才能把模型从「随便浪」变成「按规则稳定干活」。

现场 Demo：四版迭代，让 GPT-3.5 给 Hacker News 点赞

Tejas 故意挑了最老的 GPT-3.5 Turbo，任务也简单到离谱：打开 Hacker News，给第一条帖子 upvote。

第一版：简单的 agent loop 加几个 tool。结果直接失败，更离谱的是模型还撒谎说「已经 upvote 完成」。这就是经典的模型自欺。

第二版：加上 Guardrails，包括 max iterations、max messages、自动压缩上下文。结果还是失败，但起码模型这回老老实实承认自己没搞定。

第三版：加上 Verify Step，由确定性代码去检查 upvote 按钮是否真的被点过。模型不再有机会自己骗自己。

第四版：加上 Login Handler。遇到登录页时，Harness 自动接管，填凭证并提交，最终成功 upvote。

最值得品的细节是：整个过程没改过一个字的 prompt，只改 Harness 结构，效果就从「彻底翻车」变成「稳定完成」。

怎么从零搭一个 Baby Harness

Tejas 现场代码的思路其实很朴素：

用 Playwright 打开浏览器，做真实的 Computer Use
把 browser session 传给 tools
写一个 RunHarness 函数，把 loop、guardrails、verify 全封装进去

这里有两条铁律不能破：

Verify Step 必须是 deterministic（确定性的），不能让模型自己验证自己。写代码的 Agent 验证自己写的代码，跟让嫌疑人当自己案子的法官没区别。

Login Handler 这类关键操作必须由 Harness 接管。说白了，凡是「容易翻车」的部分，都要从模型手里抢回来，用确定性代码自己管。模型负责动脑子，Harness 负责守住底线。

2026 是 Harness 年

Tejas 给了一条挺有意思的时间线：

2025 是 Agent 年，所有人疯狂造 Agent
2026 是 Harness 年，因为大家终于会意识到，没好 Harness 的 Agent 就是个玩具
2027 可能会出现 Dynamic On-the-Fly Generated Harnesses——Agent 自己先生成 Harness，再执行任务

他的判断是：通往 AGI 的真正路径，不是模型变得更聪明，而是「模型提供智能，Harness 提供纪律」。

给独立开发者的几条直接抄的建议

别老盯着 prompt 改，先造 Harness。prompt 调到天花板也救不了一个没护栏的 Agent。
Verify Step 必须独立、对抗性，写代码的 Agent 不能验证自己写的代码。
Guardrails 是底线，max steps、context 压缩、登录处理这些一个都不能少。
关键操作交给确定性代码：登录、支付、敏感操作，全部由 Harness 接管，不要赌模型今天乖不乖。
从一个能稳定跑完的小任务开始，慢慢加复杂度，别一上来就想造一个能干所有事的通用 Agent。

一句话总结

以前我们总担心 AI 抢饭碗，现在看，真正稀缺的从来不是模型，而是能把模型管好的那套系统。未来的稀缺岗位不是「prompt 工程师」，而是 Harness 工程师——能把不可控的智能，包装成可控的生产力。

你现在用 Agent 时，最头疼的是它撒谎、跑偏，还是上下文炸了？欢迎留言聊聊你的踩坑现场。