Anthropic 把 Harness 做成了产品：Agent 开发者从此不用再造轮子

如果你最近在搭 Agent，应该听过 LangChain 工程师 Vivek Trivedy 说的那个公式：Agent = Model + Harness。模型出智能，Harness 让智能能真的跑起来。问题在于，自己搭一套生产级 Harness 要处理沙箱执行、状态管理、权限控制、端到端追踪——基础设施工作能耗掉好几个月，而用户什么新功能都看不到。

Anthropic 这次干脆把这层全接管了。

官方 Harness 下场：Claude Managed Agents 是什么

简单说，这是一套用于构建和部署云托管 Agent 的可组合 API。你定义 Agent 的任务、工具和护栏，Anthropic 的基础设施负责跑。内置的编排 harness 自己决定什么时候调工具、怎么管理上下文、怎么从错误里恢复。

四个核心能力：

生产级 Agent：安全沙箱、身份验证、工具执行全部由平台处理，你不用自己搭。
长运行会话：Agent 可以自主工作几个小时，进度和输出会持久化保存，连接断了也不丢状态。这意味着 Agent 能接真正复杂的长期任务，不再是几分钟的小活。
多 Agent 协调：Agent 可以生成并指挥其他 Agent，把复杂工作并行化。一个主 Agent 派生多个子 Agent 分别处理不同子任务，再汇总。
可信治理：作用域权限、身份管理、执行追踪都内置。企业最担心的"Agent 越权访问敏感数据"问题，在这里有了系统化方案。

Anthropic 内部测试里，针对结构化文件生成任务，Managed Agents 比标准提示循环的成功率最多提升了 10 个百分点，而且越难的问题提升越大。

Anthropic 设计这套东西时遵循的三个模式

我觉得这部分比产品本身更值得读，因为它解释了"什么是好的 Agent 架构"。

模式一：用 Claude 已经熟的工具

Claude 在 2024 年末的 SWE-bench Verified 上拿到 49%，当时是 SOTA。它当时只用了两个工具：bash 和文本编辑器。bash 本来不是为构建 Agent 设计的，但它是 Claude 深度理解、并且会随着模型迭代不断改进使用能力的工具。

Anthropic 发现 Claude 能把这些通用工具自己组合成解决不同问题的模式。Agent Skills、编程式工具调用、内存工具——全都是基于 bash 和文本编辑器构建的。

设计哲学就一句话：给 Claude 它已经精通的通用工具，让它自己组合方案，而不是为每个任务设计专用工具。

模式二：让 Claude 自己做编排决策

Agent harness 里通常会编码一些"Claude 不能自己做什么"的假设，但模型变强之后，这些假设就需要重新检验。

最常见的假设是：每个工具调用的结果都必须过一遍 Claude 的上下文窗口，才能决定下一步。但处理工具结果要消耗 token，又慢又贵——如果结果只是要传给下一个工具，或者 Claude 只关心输出的一小部分，这种处理就是浪费。

给 Claude 一个代码执行工具（比如 bash）就能解决这个问题：Claude 自己写代码来表达工具调用之间的逻辑，自己决定哪些结果要处理、哪些过滤掉、哪些直接管道传给下一个调用。只有最终输出才进上下文。

编排决策从 harness 转移到模型本身。这也是为什么强大的编码模型同时也是强大的通用 Agent。BrowseComp 基准测试（测 Agent 浏览网页的能力）里，给 Opus 4.6 加上"过滤自己工具输出"的能力之后，准确率从 45.3% 直接干到 61.6%。

另一个常见假设是：系统提示词应该手工写任务特定的指令。但预加载所有指令没法跨多任务扩展——每多一个 token 都在消耗 Claude 的注意力预算。

Skills 的设计就是为了这个：每个 skill 的 YAML 前言是预加载到上下文窗口的简短描述，提供概览。任务真的需要时，Claude 才通过读文件工具逐步展开完整内容。本质上是把上下文做成了渐进式加载。

模式三：边界要谨慎设

Claude 自己不一定知道应用的安全边界或 UX 表面。它发出工具调用，由 harness 处理。bash 给 Claude 广泛的编程杠杆，但只给 harness 一个命令字符串——每个操作的形状都一样，难以拦截。

把操作提升为专用工具，就能给 harness 一个带类型参数的特定钩子，可以拦截、控制、渲染或审计。

需要安全边界的操作是专用工具的天然候选。可逆性通常是个好标准——难以逆转的操作（比如外部 API 调用）可以通过用户确认控制。像编辑这样的写入工具可以包含过期检查，这样 Claude 就不会覆盖自上次读取以来已经被改过的文件。

工具在需要向用户呈现操作时也很有用——比如渲染成模态框，清晰显示问题、提供选项、阻塞 Agent 循环直到用户给反馈。

但这些决策应该持续重新评估。Claude Code 的自动模式（发布时还在研究模式）就在 bash 周围用了另一种思路：让第二个 Claude 读命令字符串、判断是否安全。这种模式可以减少对专用工具的需求，但只适合用户信任总体方向的任务。

已经在用的几个团队

Notion 把 Claude 直接集成进工作空间，让团队委托工作给 Claude（目前在 Notion Custom Agents 私有 alpha）。工程师用它交付代码，知识工作者用它生成网站和演示文稿。数十个任务可以并行跑。
Sentry 把他们的调试 Agent Seer 跟 Claude 驱动的 Agent 配对，后者负责写补丁、开 PR。开发者从标记 bug 到拿到可审查的修复，整个流程一气呵成。这个集成只用了数周完成，省掉了维护定制 Agent 基础设施的持续运营开销。
Asana 构建了 AI Teammates，在 Asana 项目里跟人类并肩工作，接手任务、起草交付物。
Rakuten 在产品、销售、营销、财务部门都部署了企业 Agent，接 Slack 和 Teams，让员工分配任务后能拿到电子表格、幻灯片、应用等交付物。每个专业 Agent 都在一周内完成部署。
Vibecode 帮客户从提示词到部署应用，把 Managed Agents 作为默认集成。联合创始人 Ansh Nanda 说，在这之前用户必须手动在沙箱里跑 LLM、管理生命周期、配工具、监督执行，整个过程要数周甚至数月。现在几行代码就能搭起来，速度至少快 10 倍。

Anthropic 的商业定位变了

我觉得这件事最值得琢磨的是商业模型的变化。

过去 Anthropic 卖的是模型 API，按 token 收费。现在卖的是完整的 Agent 运行环境：从沙箱、会话管理到权限控制，全部托管。本质上他们开始做云服务商做的事——提供计算资源和运行环境，只不过跑在上面的是智能 Agent，不是普通应用。

定价上能看出这个转变。除了标准 token 费用，Managed Agents 按会话活跃时间收费：每小时 0.08 美元。这是更接近基础设施服务的计费方式，类似云主机按运行时长。

技术上，Anthropic 在 Harness 设计上留了挺大的灵活性。他们没强制一套固定的编排逻辑，而是提供了一个能容纳不同控制器的系统。Claude Code 可以跑在上面，针对特定任务优化的控制器也可以跑在上面。这种设计让产品能跟着模型能力一起演进，不用推倒重来。

对独立开发者意味着什么

我不确定这是不是构建 Agent 的最佳方式，毕竟自己控所有基础设施有自己的好处。但如果你是一人公司或者小团队，这个产品省掉的工作量是非常实在的——从原型到生产之间那段最枯燥、用户也看不到的基础设施工作，不用你自己写了。

Notion、Sentry、Asana 这些案例都说明一件事：当基础设施不再是瓶颈，团队可以把精力放在真正重要的地方——设计 Agent 能做什么、怎么做、边界在哪里。

如果你最近在评估要不要自己搭 Harness，建议先把这套官方方案跑一遍，至少有个基线对比。按小时计费的模式也意味着你可以低成本试，跑完关掉就行。

参考：https://claude.com/blog/claude-managed-agents