从一部电影看懂 Agent 的能力边界与人机协作的正确姿势

为什么说这部电影"懂" Agent

过去的 AI 电影有个通病：它们假设 AI 是全知全能的封闭式超级系统。天网覆盖全球军事网络，《黑镜》的社会评分系统覆盖所有人。这些系统凭空出现，和现实世界完全断裂。这就像自动驾驶里的一种思路——把道路完全封闭、所有车联网、消灭行人和自行车。技术上可行，但谁都知道不现实。

《Mercy》里的 AI 叫 Maddox，它没有天网级别的超能力。它做的每一件事，用的都是现在就存在的系统：门铃摄像头、邮件系统、社交媒体、公共监控、停车场记录、警局内部系统。电影甚至具象地展示了 Maddox 接入这些系统的过程——打开警局系统界面，用男主的账号登录，然后开始检索。你看到的就是一个 AI 在操作现有的 Web 界面，在不同系统之间切换。

这不就是你装的 OpenClaw 在干的事吗？不是接管世界，不是凭空造一个超级系统，而是接入你已有的工具，通过浏览器操作、API 调用、跨系统检索来完成任务。Maddox 构建能力的方式和现在的 Agent 工具一模一样。你完全有机会在现实中复刻出 Maddox 的能力。

Agent 强在哪

电影设定是这样的：男主 Chris 被控谋杀妻子，被绑在审判椅上，只有 90 分钟向 AI 法官 Maddox 自证清白，否则当场执行死刑。

90 分钟。换成人类调查员来做同样的事——调监控、翻邮件、查社交媒体、交叉比对证人信息——90 天可能都不够。但 Maddox 做到了。拆开来看，就是一份非常直观的 Agent 能力清单：

信息处理带宽。 几秒内同时调出门铃录像、停车场监控、邻居的安防摄像头，并行处理。人一个系统一个系统去查，光登录切换就要半天。这不是快一点的问题，是量级碾压。人是单线程拨号上网，Agent 是千兆光纤同时开几十个连接。

检索能力。 信息本来就在那里，关键是你能多快找到它。Maddox 几秒内扫完几十个小时的监控录像，做文字匹配、图像匹配，锁定关键帧。换成人类调查员坐在那里从头看到尾，光这一件事就要几天。而且 Maddox 不会走神。

不遗漏。 人查案会有盲区，会先入为主，会因为觉得某条线索不重要就跳过。Maddox 不会。它系统性地扫所有能接入的数据源。电影里最终破案的关键证据，来自女儿的 Instagram 小号和邻居家车库外面的摄像头——这种边缘信息人类调查员大概率会漏掉。

快速验证。 这是 Agent 最厉害的地方。Chris 说"我觉得 Rob 有问题"，这是人的直觉。但光有直觉不够，你需要大量检索去验证。Maddox 几秒内就把 Rob 的所有信息拉出来：工作记录、聊天记录、他弟弟被处决的历史、化学品失踪的记录。人给一个方向，Agent 瞬间把这个方向上的所有信息铺开。人做这件事可能要几周，Agent 几秒。

情绪稳定。 Chris 全程在崩溃——愤怒、恐惧、愧疚轮番来。如果让他自己查案，情绪会严重干扰判断。Maddox 在人最不理性的时候保持稳定输出。这不是冷血，这是可靠。

Agent 的边界在哪

但 Maddox 也不是万能的。

电影最核心的矛盾在这里：既然最后真相是 Chris 清白的，那 Maddox 一开始给出的 97.5% 有罪概率怎么解释？一个如此强大的 AI，为什么一开始就判错了？

因为 Maddox 不是全知全能的。97.5% 是基于它能接入的所有数字化信息算出来的——监控录像、手机定位、邮件记录、Chris 的案底。从这些数据看，Chris 确实高度可疑。Maddox 没有算错，在它能获取的信息范围内，这个概率是合理的。

问题在于它获取不到的信息。

Chris 和妻子关系恶化的真实原因？没有记录。那是两个人之间日积月累的消耗，不会出现在任何邮件或聊天记录里。Chris 酗酒后对妻子说过什么？没有录像。那些对话发生在家里没有摄像头的角落。Chris 对那次烧烤聚会的模糊记忆，当时有个人让他感觉不太对？这个"感觉不太对"在哪个数据库里能查到？

查不到。

Agent 的能力边界就是数字化信息的边界。 超过这条线的东西，只有人自己知道。97.5% 到无罪之间的距离，不是靠更强的算力能跨过去的，需要的是人脑子里那些从未被数字化的记忆和判断。

人为什么不可替代

这是整部电影给我最大的启发。

Maddox 能检索到的信息量远超人类，但它对所有信息的权重是统计性的、通用的——哪条记录相关度高就排前面，和搜索引擎的逻辑差不多。

Chris 不一样。他只记得自己亲身经历过的事情。

这既是短板，也是长处。

说是短板——他确实会遗漏。Chris 不记得停车场几点有辆车经过，不记得邻居家的监控拍到了什么。这些 Maddox 几秒就能查到，Chris 根本不知道它们存在。

但这也是人最大的长处。正因为人只记得自己亲身经历的事情，他知道哪些关键信息没有被数字化。Chris 知道那天晚上他和妻子之间发生了什么，知道 Rob 给他的感觉不对，知道烧烤那天的氛围有问题。这些东西不在任何系统里，但 Chris 能在几秒内回忆起来，甚至是以直觉的方式。

"那天她看我的眼神不对。"——这条信息在 Maddox 的数据库里根本不存在。但在 Chris 的世界里，它比 100 条监控录像都重要。

人对自己相关的事情有一套完全不同的权重体系。这个权重不是算出来的，是活出来的。你和一个人十年的相处，无数次对话，每次争吵和和解，最后压缩成一种直觉。这个直觉不是玄学——本质上和大模型一样，都是大量数据训练出来的 pattern matching。区别在于训练数据：大模型的训练数据是通用的，而人的训练数据是自己私有的、不可复制的一生经历。

最佳协作方式：人给方向，Agent 去跑

回看电影里的几个关键转折点：

Chris 说"查我的戒酒互助人 Rob"，Maddox 去检索，发现了 Rob 和化学品的关联
Chris 说"看看烧烤那天的录像"，Maddox 调出来分析，锁定了可疑人员
Chris 说"我女儿的社交媒体上可能有线索"，Maddox 去翻，发现有人藏在地下室

每一次都是 Chris 给方向，Maddox 去执行。

Chris 一个人做不了——90 分钟根本查不完那么多系统。Maddox 一个人也做不了——它会陷在 97.5% 有罪概率的数据里出不来，因为它不知道该往哪个方向突破。两个结合才破了局。

方向比速度重要。 没有方向的高速检索只会产生噪声。但有了正确的方向，Agent 的速度会让你变成一个人的特种部队。

你现在用的 OpenClaw 也好，其他 Agent 工具也好，它就是你的 Maddox。区别只是你面对的不是谋杀审判，而是你每天的工作和决策。你不需要什么都会，你需要的是知道该往哪看——然后让 Agent 去跑。

那么问题来了：在你自己的工作里，有哪些信息是只有你知道、但从未告诉过你的 Agent 的？把这些信息喂给它，也许就是你效率跃升的起点。