Skills 不是 Markdown 文件,是一个能力单元
很多人把 Skill 理解成"写一段提示词存成 .md 文件"。这个理解差了一层。Skill 是一个文件夹,里面可以放脚本、资源文件、数据,甚至带状态的数据库。Claude 能自己发现和操作这些文件。在 Claude Code 里,Skill 还能注册动态 Hooks,Anthropic 发现最有价值的 Skill 恰恰都是创造性利用了文件夹结构和配置选项的那些。
换句话说,Skill 的上限不是"写得好不好",而是"结构设计得巧不巧"。
9 种经过验证的 Skill 类型
Anthropic 梳理内部所有 Skill 后发现,它们会自然聚集成固定类别。一个 Skill 如果搞不清自己属于哪类,效果往往最差。这个判断标准本身就值得记住。
1. 库和 API 参考——教 Claude 正确使用某个库、CLI 或 SDK。重点放在参考代码片段和常见踩坑点上,尤其适合 Claude 容易用错的公共库或团队内部库。
2. 产品验证——描述怎么测试和验证代码是否正确工作,通常配合 Playwright、tmux 等工具。Anthropic 的判断是:让一个工程师花一整周专门优化验证类 Skill,回报率极高。可以让 Claude 录制测试视频、在每一步做程序化断言。对独立开发者来说,这类 Skill 直接替代了 QA 角色。
3. 数据获取和分析——连接数据和监控系统,可能包含带凭证的数据获取库、Dashboard ID、常见查询工作流。
4. 业务流程自动化——把重复性工作流打包成一个命令。比如聚合 Ticket 跟踪器、GitHub 活动和 Slack 消息,生成格式化的站会报告。一人公司最需要这类 Skill,因为你没有人帮你做这些琐碎但必要的汇总工作。
5. 代码脚手架和模板——为代码库中的特定功能生成框架样板代码。
6. 代码质量和审查——在团队内强制执行代码质量标准,可包含确定性脚本,能集成到 GitHub Action。
7. CI/CD 和部署——自动化代码获取、推送和部署流程,包括渐进式流量切换和基于错误率的自动回滚。
8. Runbooks——接收一个症状,走完多工具调查流程,输出结构化报告。本质上是把运维经验编码化。
9. 基础设施运维——执行例行维护和运维操作,同时设置安全护栏。
这九类覆盖了从开发到部署到运维的完整链条。对独立开发者而言,优先级最高的是第 2、4、7 类——验证、流程自动化、部署,这三块是一个人最容易成为瓶颈的地方。
写好 Skill 的四个关键判断
知道做什么类型之后,怎么写决定了实际效果。
不要说显而易见的事情。 Claude 对代码库和编程本身已有大量默认判断,如果你的 Skill 主要是知识类的,要专注在那些能把 Claude 推出默认思维方式的信息上。重复它已经知道的东西只是在浪费上下文窗口。
建立踩坑清单。 这是任何 Skill 中信号密度最高的部分。从 Claude 使用 Skill 时遇到的常见失败点中积累,持续更新。一个好的踩坑清单比十页说明文档更有效。
善用文件系统做渐进式披露。 把整个文件系统当成上下文工程的载体——告诉 Claude 你的 Skill 里有哪些文件,它会在合适的时候自己去读。不需要一次性把所有信息塞进提示词。
不要过度限制 Claude。 Skill 是高度复用的,指令要避免过于具体。给它需要的信息,但也给它适应具体情况的灵活性。另外,description 字段是写给模型看的触发条件描述,不是给人看的摘要。
让 Skill 拥有记忆
这一点容易被忽略但非常关键:Skill 可以通过在目录内存储数据来实现记忆机制。简单的可以是一个追加写入的文本日志,复杂的可以是一个 SQLite 数据库。
一个实际场景:站会 Skill 保留一个 standups.log 记录每次发送的内容,下次运行时 Claude 读取历史,就能准确说出跟昨天相比发生了什么变化。
有一个注意点:存储在 Skill 目录里的数据在升级 Skill 时可能被删除,应该把数据存到 ${CLAUDE_PLUGIN_DATA} 这个稳定路径下。
给 Claude 提供脚本和函数库也是最强大的做法之一——让它把精力花在编排和决策上,而不是重复构建样板代码。这个思路对一人公司尤其重要:你的杠杆不在于 Claude 能写多少代码,而在于它能调用多少你预先准备好的能力模块。
分发和衡量
Skill 有两种分发方式:提交到代码仓库的 .claude/skills/ 目录下,适合小团队;或者做成插件建立内部市场,适合规模化。Anthropic 内部没有集中团队审批,而是采用有机发现的路径——先放到 GitHub sandbox,在 Slack 分享,有使用量后再提 PR 移入市场。
衡量方面,Anthropic 用 PreToolUse hook 记录 Skill 使用日志,以此发现哪些 Skill 受欢迎、哪些触发频率低于预期。
整个 Skill 生态还在早期。Anthropic 的大部分 Skill 都是从几行文字加一个踩坑点开始,随着 Claude 遇到新的边界情况逐步完善。对独立开发者来说,现在值得做的事情是:从你每天重复最多的三个工作流开始,各做一个 Skill,然后在使用中迭代。这条路目前还没看到真正的壁垒,先跑起来的人先受益。