AGENTS.md:给 AI 定规矩的正确方式
一个常见误解是 AGENTS.md 文件会自动生成。事实上,它需要手动维护,本质上是 Codex CLI 的行为策略配置文件——你可以把它理解为给 AI agent 写的一份「行事准则」。
配置这个文件有几条值得记住的原则:
- 从默认配置起步,只在同类问题反复出现时才添加针对性规则。过度定制往往引入不可预期的副作用,"最小干预"是核心思路
- 内容聚焦在策略、优先级、约束条件三个维度,不要试图规定每一步操作的细节
- 绝不硬编码密钥,同时为破坏性操作(删除文件、重写模块等)设置明确的确认规则
- 所有自动化脚本都应在 README 和 PR 中记录来源、触发时机和入口点
模型选择:难度 × 成本 × 长度的三维平衡
不同任务应该匹配不同模型,这个决策可以沿三个维度展开:
- 高难度推理任务(架构设计、复杂重构、深层 bug 排查)→ 用最强推理模型
- 机械性工作(代码批量阅读、摘要生成、格式化)→ 用小型高性价比模型
- 长上下文任务(审阅大型 diff、跨文件分析)→ 用大窗口模型
还有一条容易被忽略的建议:按阶段锁定模型选择。设计阶段、实现阶段、验证阶段各用固定模型,这样做的好处是确保结果可复现。频繁切换模型会让输出风格和质量波动,排查问题时很难定位是代码的问题还是模型的问题。
上下文与 Token 管理
这部分是实际使用中最影响效果的环节。几条关键策略:
- 精准定位而非全量输入:先用
rg(ripgrep)定位代码片段,再以不超过 250 行的块分段读取,不要把整个文件丢给模型 - 跨轮次摘要传递:多轮交互中,把关键假设和决策浓缩成简短笔记传递,而不是让模型重新消化完整对话历史
- 单一主题原则:每个任务保持 diff 聚焦于一个主题,不要在一次交互中混入多个不相关变更
- 指针优于内容:引用代码时优先给路径和行号,而不是粘贴大段代码
- 日志要节选:只包含决定性的日志片段,完整日志对模型来说是噪音
Codex CLI 界面中显示的百分比数值,反映的是综合资源消耗——主要是 token 消耗,也包含工具 I/O 开销。当这个数值接近极限时会触发截断或强制摘要,回答质量会明显下降。留意这个指标,是避免"对话到后半段越来越离谱"的关键。
成本优化:强模型做决策,弱模型做执行
这个思路很实用,尤其对独立开发者来说,API 成本是实打实的开支:
- 把发现和探索阶段的工作交给小模型和本地搜索工具
- 只在需要深度推理时才调用强模型
- 先在本地验证变更的正确性,确认后再扩大操作范围
- 维护简短的决策笔记,避免因上下文丢失而重复消耗 token
本质上就是把 AI 编码代理当团队来管理——不是所有任务都需要"最贵的人"来做,合理分配才能让整体效率最大化。对于用 AI 工具做产品的一人团队来说,这套分层策略的价值不只是省钱,更是让有限的注意力和预算花在真正需要深度思考的环节上。