1. GPT-5.4 mini 正式上线

OpenAI 今天发布了 GPT-5.4 mini,现已在 ChatGPT、Codex 和 API 全面开放。

关键数字:比 GPT-5 mini 快 2 倍

优化方向:代码生成、计算机操控(computer use)、多模态理解、子代理(subagents)。

这个发布时间点很有意思——就在 Anthropic 宣布 Dispatch 的同一天。两家在同一天加码 Agent 基础能力,不像是巧合。


2. Anthropic 发布 Dispatch:官方版"替你干活的 Agent"

Anthropic 今天给 Claude Cowork(即 OpenClaw)加了一个新功能:Dispatch

核心能力:你发一条消息说"帮我做 X",然后去忙别的——Claude 在后台自动拉起 Agent 完成任务,你回来看结果就行。

同时配套发布了持久记忆(persistent memory):Claude 现在可以在会话之间记住你的上下文,不用每次重新解释自己是谁、在做什么。

一句话总结:Anthropic 把 OpenClaw 的核心使用模式——异步、后台、多 Agent 协作——做成了官方原生功能。


3. 英伟达 GTC:迪士尼 Olaf 机器人走上台

今天 NVIDIA GTC 现场最后一幕:黄仁勋没有自己谢幕,而是叫出了一个迪士尼的雪宝 Olaf 机器人。

它从大屏幕动画直接"走出"屏幕,自己走到台中央,跟老黄对话,还吐槽"站太久腿酸"。

现场有人一开始没分辨出这是机器人——外形、动作、对话都极度真人化

这是具身 AI 的一个新里程碑:不再是冰冷的工业机械,而是能进入大众感知圈的形象级机器人。


4. Hermes Agent v0.3.0

Nous Research 发布了 Hermes Agent v0.3.0。

5 天,15 个贡献者,248 个 PR。

这次更新的核心:

  • 实时流式输出(CLI 和所有平台)
  • 插件架构:打包分享你自己的工具、命令、Skills
  • /browser 命令:直接接管 Chrome(通过 CDP 协议)
  • Vercel AI Gateway 模型提供商接入

浏览器控制能力的原生化,是这个版本最值得关注的一点——Agent 不再只是读写文件,而是可以真正操控浏览器完成任何网页上的操作。


5. 1 个创始人 + AI,年化营收 $450 万

创始人 @Bencera 今天的帖子,1302 赞:

"About to hit $4.5M run rate. Still 1 founder + AI. Zero employees."

他说这周几乎把他压垮了——所有基础设施合作伙伴同时触发限速,每个可能出现的 Bug 都出现了,同时投资人在推大数字。PMF 是什么感觉,没人提前告诉你。

这个数字本身不是重点。重点是这种规模的公司现在可以由 1 个人 + AI 跑起来,已经不是个案了。


6. OpenGranola:macOS 本地会议助手

开发者 @yazins 今天开源了 OpenGranola——一个 macOS 会议助手。

特点:

  • 双侧实时转录(你和对方的声音都转)
  • 实时搜索你的本地笔记,在对话需要时推送相关内容
  • 音频不离开本机,全程本地处理
  • 可以接入 Notion、Obsidian 等笔记工具

会议场景里的 AI 助手已经很多,但全本地 + 双侧转录 + 实时联动笔记库,这个组合比较少见。


今天的主线

表面上是几条独立的新闻,底层是同一件事在加速:

AI Agent 的操控范围正在从"帮你写东西"扩展到"帮你做事"。

GPT-5.4 mini 专门优化了 subagents;Anthropic Dispatch 把异步任务执行做进官方产品;Hermes 原生支持 Chrome 操控;NVIDIA 在 GTC 展示的机器人已经可以站在台上跟人聊天。

下一步是什么,现在已经很清楚了。