GLM-5-Turbo与龙虾套餐：智谱为Agent场景量身打造的新武器值不值得上车

GLM-5-Turbo：专门给 Agent 场景调过的模型

GLM-5-Turbo 是基于 GLM-5 针对 Agent 场景做的高速版本，内部代号叫"pony-alpha-2"。官方说的很直白——这个模型就是为 OpenClaw 这类 Agent 编排环境优化的，暂时不开源，成果会整合进下一代开源版本。

说实话，之前用通用模型跑 Agent 流程，经常碰到响应慢、工具调用不稳定的问题。如果这个模型真的在 function calling 和多步推理上做了专项优化，那对搭建复杂 Agent 工作流的体验提升应该挺明显的。

在 GLM Coding Plan 里，Max 套餐用户现在就能用，Pro 用户月底前开放，Lite 用户要等到 4 月。

计费规则要算清楚

这个模型的计费有个坑需要注意：高峰期（14:00-18:00 UTC+8）按 3 倍额度消耗，非高峰期按 2 倍。不过截至 4 月底，非高峰期有 1 倍系数的限时福利。

换句话说，如果你的 Agent 任务可以错峰跑，尽量安排在非高峰时段，现在还能享受优惠系数。这对跑批量任务或者定时触发的自动化工作流来说，调度策略直接影响成本。

龙虾套餐：给 Agent 开发者的入门选项

智谱同步推出了"龙虾套餐·团队协作版"，搭载 GLM-5-Turbo，上下文窗口 200K，最大输出 128K Tokens。官方数据说在 ZClawBench 基准测试里排第一梯队。

两档月卡：

体验月卡：39 元 / 3500 万 tokens
进阶月卡：99 元 / 1 亿 tokens

每类限购 5 张，支持 OpenAI 或 Anthropic 协议接入——这点挺实用的，意味着你现有的 Agent 框架如果是基于这两种协议搭的，基本可以无缝切换过来试试，不用改太多代码。

老用户权益窗口

另外提一嘴，智谱针对 GLM Coding Plan 开了一个到月底的限时服务窗口，主要处理老用户权益。停售前订阅的用户可以续订老版套餐，误升级的支持回退（多退少不补），系统漏算优惠的按 1.5 倍赠金补偿。如果你之前买过老套餐，这几天可以去看看自己的账户状态。

顺便说两个相关的事

NotebookLM 开始向 Pro 用户推送"Cinematic Video Overviews"功能，就是电影级的视频概览，用 Google 最新模型组合驱动的。这个功能如果成熟了，拿来做内容总结的 Agent 工作流应该挺有意思。

MiniMax 官网 Coding Plan 页面被人发现短暂出现了"MiniMax-M2.7"和"MiniMax-M2.7-highspeed"字样，看起来新模型快了。又多一个可以拿来跑 Agent 的模型选项。

对于正在搭建 Agent 工作流的独立开发者，我觉得现在可以做的事情是：把 GLM-5-Turbo 接入现有的 OpenClaw 或类似编排框架里跑一跑，200K 上下文对于多步骤 Agent 任务来说够用了，39 元的体验月卡试错成本也不高。关键是看它在实际的工具调用链路里表现到底怎么样——基准测试是一回事，跑起来又是另一回事。