GLM-5-Turbo:专门给 Agent 场景调过的模型

GLM-5-Turbo 是基于 GLM-5 针对 Agent 场景做的高速版本,内部代号叫"pony-alpha-2"。官方说的很直白——这个模型就是为 OpenClaw 这类 Agent 编排环境优化的,暂时不开源,成果会整合进下一代开源版本。

说实话,之前用通用模型跑 Agent 流程,经常碰到响应慢、工具调用不稳定的问题。如果这个模型真的在 function calling 和多步推理上做了专项优化,那对搭建复杂 Agent 工作流的体验提升应该挺明显的。

在 GLM Coding Plan 里,Max 套餐用户现在就能用,Pro 用户月底前开放,Lite 用户要等到 4 月。

计费规则要算清楚

这个模型的计费有个坑需要注意:高峰期(14:00-18:00 UTC+8)按 3 倍额度消耗,非高峰期按 2 倍。不过截至 4 月底,非高峰期有 1 倍系数的限时福利。

换句话说,如果你的 Agent 任务可以错峰跑,尽量安排在非高峰时段,现在还能享受优惠系数。这对跑批量任务或者定时触发的自动化工作流来说,调度策略直接影响成本。

龙虾套餐:给 Agent 开发者的入门选项

智谱同步推出了"龙虾套餐·团队协作版",搭载 GLM-5-Turbo,上下文窗口 200K,最大输出 128K Tokens。官方数据说在 ZClawBench 基准测试里排第一梯队。

两档月卡:

  • 体验月卡:39 元 / 3500 万 tokens
  • 进阶月卡:99 元 / 1 亿 tokens

每类限购 5 张,支持 OpenAI 或 Anthropic 协议接入——这点挺实用的,意味着你现有的 Agent 框架如果是基于这两种协议搭的,基本可以无缝切换过来试试,不用改太多代码。

老用户权益窗口

另外提一嘴,智谱针对 GLM Coding Plan 开了一个到月底的限时服务窗口,主要处理老用户权益。停售前订阅的用户可以续订老版套餐,误升级的支持回退(多退少不补),系统漏算优惠的按 1.5 倍赠金补偿。如果你之前买过老套餐,这几天可以去看看自己的账户状态。

顺便说两个相关的事

NotebookLM 开始向 Pro 用户推送"Cinematic Video Overviews"功能,就是电影级的视频概览,用 Google 最新模型组合驱动的。这个功能如果成熟了,拿来做内容总结的 Agent 工作流应该挺有意思。

MiniMax 官网 Coding Plan 页面被人发现短暂出现了"MiniMax-M2.7"和"MiniMax-M2.7-highspeed"字样,看起来新模型快了。又多一个可以拿来跑 Agent 的模型选项。

对于正在搭建 Agent 工作流的独立开发者,我觉得现在可以做的事情是:把 GLM-5-Turbo 接入现有的 OpenClaw 或类似编排框架里跑一跑,200K 上下文对于多步骤 Agent 任务来说够用了,39 元的体验月卡试错成本也不高。关键是看它在实际的工具调用链路里表现到底怎么样——基准测试是一回事,跑起来又是另一回事。