为什么说这部电影"懂" Agent
过去的 AI 电影有个通病:它们假设 AI 是全知全能的封闭式超级系统。天网覆盖全球军事网络,《黑镜》的社会评分系统覆盖所有人。这些系统凭空出现,和现实世界完全断裂。这就像自动驾驶里的一种思路——把道路完全封闭、所有车联网、消灭行人和自行车。技术上可行,但谁都知道不现实。
《Mercy》里的 AI 叫 Maddox,它没有天网级别的超能力。它做的每一件事,用的都是现在就存在的系统:门铃摄像头、邮件系统、社交媒体、公共监控、停车场记录、警局内部系统。电影甚至具象地展示了 Maddox 接入这些系统的过程——打开警局系统界面,用男主的账号登录,然后开始检索。你看到的就是一个 AI 在操作现有的 Web 界面,在不同系统之间切换。
这不就是你装的 OpenClaw 在干的事吗?不是接管世界,不是凭空造一个超级系统,而是接入你已有的工具,通过浏览器操作、API 调用、跨系统检索来完成任务。Maddox 构建能力的方式和现在的 Agent 工具一模一样。你完全有机会在现实中复刻出 Maddox 的能力。
Agent 强在哪
电影设定是这样的:男主 Chris 被控谋杀妻子,被绑在审判椅上,只有 90 分钟向 AI 法官 Maddox 自证清白,否则当场执行死刑。
90 分钟。换成人类调查员来做同样的事——调监控、翻邮件、查社交媒体、交叉比对证人信息——90 天可能都不够。但 Maddox 做到了。拆开来看,就是一份非常直观的 Agent 能力清单:
信息处理带宽。 几秒内同时调出门铃录像、停车场监控、邻居的安防摄像头,并行处理。人一个系统一个系统去查,光登录切换就要半天。这不是快一点的问题,是量级碾压。人是单线程拨号上网,Agent 是千兆光纤同时开几十个连接。
检索能力。 信息本来就在那里,关键是你能多快找到它。Maddox 几秒内扫完几十个小时的监控录像,做文字匹配、图像匹配,锁定关键帧。换成人类调查员坐在那里从头看到尾,光这一件事就要几天。而且 Maddox 不会走神。
不遗漏。 人查案会有盲区,会先入为主,会因为觉得某条线索不重要就跳过。Maddox 不会。它系统性地扫所有能接入的数据源。电影里最终破案的关键证据,来自女儿的 Instagram 小号和邻居家车库外面的摄像头——这种边缘信息人类调查员大概率会漏掉。
快速验证。 这是 Agent 最厉害的地方。Chris 说"我觉得 Rob 有问题",这是人的直觉。但光有直觉不够,你需要大量检索去验证。Maddox 几秒内就把 Rob 的所有信息拉出来:工作记录、聊天记录、他弟弟被处决的历史、化学品失踪的记录。人给一个方向,Agent 瞬间把这个方向上的所有信息铺开。人做这件事可能要几周,Agent 几秒。
情绪稳定。 Chris 全程在崩溃——愤怒、恐惧、愧疚轮番来。如果让他自己查案,情绪会严重干扰判断。Maddox 在人最不理性的时候保持稳定输出。这不是冷血,这是可靠。
Agent 的边界在哪
但 Maddox 也不是万能的。
电影最核心的矛盾在这里:既然最后真相是 Chris 清白的,那 Maddox 一开始给出的 97.5% 有罪概率怎么解释?一个如此强大的 AI,为什么一开始就判错了?
因为 Maddox 不是全知全能的。97.5% 是基于它能接入的所有数字化信息算出来的——监控录像、手机定位、邮件记录、Chris 的案底。从这些数据看,Chris 确实高度可疑。Maddox 没有算错,在它能获取的信息范围内,这个概率是合理的。
问题在于它获取不到的信息。
Chris 和妻子关系恶化的真实原因?没有记录。那是两个人之间日积月累的消耗,不会出现在任何邮件或聊天记录里。Chris 酗酒后对妻子说过什么?没有录像。那些对话发生在家里没有摄像头的角落。Chris 对那次烧烤聚会的模糊记忆,当时有个人让他感觉不太对?这个"感觉不太对"在哪个数据库里能查到?
查不到。
Agent 的能力边界就是数字化信息的边界。 超过这条线的东西,只有人自己知道。97.5% 到无罪之间的距离,不是靠更强的算力能跨过去的,需要的是人脑子里那些从未被数字化的记忆和判断。
人为什么不可替代
这是整部电影给我最大的启发。
Maddox 能检索到的信息量远超人类,但它对所有信息的权重是统计性的、通用的——哪条记录相关度高就排前面,和搜索引擎的逻辑差不多。
Chris 不一样。他只记得自己亲身经历过的事情。
这既是短板,也是长处。
说是短板——他确实会遗漏。Chris 不记得停车场几点有辆车经过,不记得邻居家的监控拍到了什么。这些 Maddox 几秒就能查到,Chris 根本不知道它们存在。
但这也是人最大的长处。正因为人只记得自己亲身经历的事情,他知道哪些关键信息没有被数字化。Chris 知道那天晚上他和妻子之间发生了什么,知道 Rob 给他的感觉不对,知道烧烤那天的氛围有问题。这些东西不在任何系统里,但 Chris 能在几秒内回忆起来,甚至是以直觉的方式。
"那天她看我的眼神不对。"——这条信息在 Maddox 的数据库里根本不存在。但在 Chris 的世界里,它比 100 条监控录像都重要。
人对自己相关的事情有一套完全不同的权重体系。这个权重不是算出来的,是活出来的。你和一个人十年的相处,无数次对话,每次争吵和和解,最后压缩成一种直觉。这个直觉不是玄学——本质上和大模型一样,都是大量数据训练出来的 pattern matching。区别在于训练数据:大模型的训练数据是通用的,而人的训练数据是自己私有的、不可复制的一生经历。
最佳协作方式:人给方向,Agent 去跑
回看电影里的几个关键转折点:
- Chris 说"查我的戒酒互助人 Rob",Maddox 去检索,发现了 Rob 和化学品的关联
- Chris 说"看看烧烤那天的录像",Maddox 调出来分析,锁定了可疑人员
- Chris 说"我女儿的社交媒体上可能有线索",Maddox 去翻,发现有人藏在地下室
每一次都是 Chris 给方向,Maddox 去执行。
Chris 一个人做不了——90 分钟根本查不完那么多系统。Maddox 一个人也做不了——它会陷在 97.5% 有罪概率的数据里出不来,因为它不知道该往哪个方向突破。两个结合才破了局。
方向比速度重要。 没有方向的高速检索只会产生噪声。但有了正确的方向,Agent 的速度会让你变成一个人的特种部队。
你现在用的 OpenClaw 也好,其他 Agent 工具也好,它就是你的 Maddox。区别只是你面对的不是谋杀审判,而是你每天的工作和决策。你不需要什么都会,你需要的是知道该往哪看——然后让 Agent 去跑。
那么问题来了:在你自己的工作里,有哪些信息是只有你知道、但从未告诉过你的 Agent 的?把这些信息喂给它,也许就是你效率跃升的起点。