如果你最近在搭 Agent,应该听过 LangChain 工程师 Vivek Trivedy 说的那个公式:Agent = Model + Harness。模型出智能,Harness 让智能能真的跑起来。问题在于,自己搭一套生产级 Harness 要处理沙箱执行、状态管理、权限控制、端到端追踪——基础设施工作能耗掉好几个月,而用户什么新功能都看不到。

Anthropic 这次干脆把这层全接管了。

官方 Harness 下场:Claude Managed Agents 是什么

简单说,这是一套用于构建和部署云托管 Agent 的可组合 API。你定义 Agent 的任务、工具和护栏,Anthropic 的基础设施负责跑。内置的编排 harness 自己决定什么时候调工具、怎么管理上下文、怎么从错误里恢复。

四个核心能力:

  • 生产级 Agent:安全沙箱、身份验证、工具执行全部由平台处理,你不用自己搭。
  • 长运行会话:Agent 可以自主工作几个小时,进度和输出会持久化保存,连接断了也不丢状态。这意味着 Agent 能接真正复杂的长期任务,不再是几分钟的小活。
  • 多 Agent 协调:Agent 可以生成并指挥其他 Agent,把复杂工作并行化。一个主 Agent 派生多个子 Agent 分别处理不同子任务,再汇总。
  • 可信治理:作用域权限、身份管理、执行追踪都内置。企业最担心的"Agent 越权访问敏感数据"问题,在这里有了系统化方案。

Anthropic 内部测试里,针对结构化文件生成任务,Managed Agents 比标准提示循环的成功率最多提升了 10 个百分点,而且越难的问题提升越大。

Anthropic 设计这套东西时遵循的三个模式

我觉得这部分比产品本身更值得读,因为它解释了"什么是好的 Agent 架构"。

模式一:用 Claude 已经熟的工具

Claude 在 2024 年末的 SWE-bench Verified 上拿到 49%,当时是 SOTA。它当时只用了两个工具:bash 和文本编辑器。bash 本来不是为构建 Agent 设计的,但它是 Claude 深度理解、并且会随着模型迭代不断改进使用能力的工具。

Anthropic 发现 Claude 能把这些通用工具自己组合成解决不同问题的模式。Agent Skills、编程式工具调用、内存工具——全都是基于 bash 和文本编辑器构建的。

设计哲学就一句话:给 Claude 它已经精通的通用工具,让它自己组合方案,而不是为每个任务设计专用工具。

模式二:让 Claude 自己做编排决策

Agent harness 里通常会编码一些"Claude 不能自己做什么"的假设,但模型变强之后,这些假设就需要重新检验。

最常见的假设是:每个工具调用的结果都必须过一遍 Claude 的上下文窗口,才能决定下一步。但处理工具结果要消耗 token,又慢又贵——如果结果只是要传给下一个工具,或者 Claude 只关心输出的一小部分,这种处理就是浪费。

给 Claude 一个代码执行工具(比如 bash)就能解决这个问题:Claude 自己写代码来表达工具调用之间的逻辑,自己决定哪些结果要处理、哪些过滤掉、哪些直接管道传给下一个调用。只有最终输出才进上下文。

编排决策从 harness 转移到模型本身。这也是为什么强大的编码模型同时也是强大的通用 Agent。BrowseComp 基准测试(测 Agent 浏览网页的能力)里,给 Opus 4.6 加上"过滤自己工具输出"的能力之后,准确率从 45.3% 直接干到 61.6%。

另一个常见假设是:系统提示词应该手工写任务特定的指令。但预加载所有指令没法跨多任务扩展——每多一个 token 都在消耗 Claude 的注意力预算。

Skills 的设计就是为了这个:每个 skill 的 YAML 前言是预加载到上下文窗口的简短描述,提供概览。任务真的需要时,Claude 才通过读文件工具逐步展开完整内容。本质上是把上下文做成了渐进式加载

模式三:边界要谨慎设

Claude 自己不一定知道应用的安全边界或 UX 表面。它发出工具调用,由 harness 处理。bash 给 Claude 广泛的编程杠杆,但只给 harness 一个命令字符串——每个操作的形状都一样,难以拦截。

把操作提升为专用工具,就能给 harness 一个带类型参数的特定钩子,可以拦截、控制、渲染或审计。

需要安全边界的操作是专用工具的天然候选。可逆性通常是个好标准——难以逆转的操作(比如外部 API 调用)可以通过用户确认控制。像编辑这样的写入工具可以包含过期检查,这样 Claude 就不会覆盖自上次读取以来已经被改过的文件。

工具在需要向用户呈现操作时也很有用——比如渲染成模态框,清晰显示问题、提供选项、阻塞 Agent 循环直到用户给反馈。

但这些决策应该持续重新评估。Claude Code 的自动模式(发布时还在研究模式)就在 bash 周围用了另一种思路:让第二个 Claude 读命令字符串、判断是否安全。这种模式可以减少对专用工具的需求,但只适合用户信任总体方向的任务。

已经在用的几个团队

  • Notion 把 Claude 直接集成进工作空间,让团队委托工作给 Claude(目前在 Notion Custom Agents 私有 alpha)。工程师用它交付代码,知识工作者用它生成网站和演示文稿。数十个任务可以并行跑。
  • Sentry 把他们的调试 Agent Seer 跟 Claude 驱动的 Agent 配对,后者负责写补丁、开 PR。开发者从标记 bug 到拿到可审查的修复,整个流程一气呵成。这个集成只用了数周完成,省掉了维护定制 Agent 基础设施的持续运营开销。
  • Asana 构建了 AI Teammates,在 Asana 项目里跟人类并肩工作,接手任务、起草交付物。
  • Rakuten 在产品、销售、营销、财务部门都部署了企业 Agent,接 Slack 和 Teams,让员工分配任务后能拿到电子表格、幻灯片、应用等交付物。每个专业 Agent 都在一周内完成部署。
  • Vibecode 帮客户从提示词到部署应用,把 Managed Agents 作为默认集成。联合创始人 Ansh Nanda 说,在这之前用户必须手动在沙箱里跑 LLM、管理生命周期、配工具、监督执行,整个过程要数周甚至数月。现在几行代码就能搭起来,速度至少快 10 倍

Anthropic 的商业定位变了

我觉得这件事最值得琢磨的是商业模型的变化。

过去 Anthropic 卖的是模型 API,按 token 收费。现在卖的是完整的 Agent 运行环境:从沙箱、会话管理到权限控制,全部托管。本质上他们开始做云服务商做的事——提供计算资源和运行环境,只不过跑在上面的是智能 Agent,不是普通应用。

定价上能看出这个转变。除了标准 token 费用,Managed Agents 按会话活跃时间收费:每小时 0.08 美元。这是更接近基础设施服务的计费方式,类似云主机按运行时长。

技术上,Anthropic 在 Harness 设计上留了挺大的灵活性。他们没强制一套固定的编排逻辑,而是提供了一个能容纳不同控制器的系统。Claude Code 可以跑在上面,针对特定任务优化的控制器也可以跑在上面。这种设计让产品能跟着模型能力一起演进,不用推倒重来。

对独立开发者意味着什么

我不确定这是不是构建 Agent 的最佳方式,毕竟自己控所有基础设施有自己的好处。但如果你是一人公司或者小团队,这个产品省掉的工作量是非常实在的——从原型到生产之间那段最枯燥、用户也看不到的基础设施工作,不用你自己写了。

Notion、Sentry、Asana 这些案例都说明一件事:当基础设施不再是瓶颈,团队可以把精力放在真正重要的地方——设计 Agent 能做什么、怎么做、边界在哪里。

如果你最近在评估要不要自己搭 Harness,建议先把这套官方方案跑一遍,至少有个基线对比。按小时计费的模式也意味着你可以低成本试,跑完关掉就行。

参考:https://claude.com/blog/claude-managed-agents