这背后有一个值得认真拆解的判断——在agent时代,builder的角色发生了根本变化。过去的builder是亲自下场敲代码的人,现在的builder更像导演、CEO、产品经理和架构师的混合体。人负责vision和taste,agent负责执行、补全、测试、修复、迭代。

一个13年没写代码的人,凭什么突然爆发

Garry Tan早年是Posterous的创始人,公司被Twitter收购后转去做投资,最后成为YC CEO,基本远离日常coding十几年。

2025年初他想做Garry's List——一个能自动研究信息、整理资料、生成长文的agentic平台。按传统开发方式,这种项目从框架、爬虫、RAG到工作流,光搭建就够头大。但他发现Claude Code已经好用到不像话,于是做的第一件事不是直接写代码,而是把自己日常重复的动作全部沉淀成Markdown skills。

这是关键动作。他把「怎么规划」「怎么写代码」「怎么review」「怎么测试」「怎么调研」这些动作,全部变成结构化的说明书交给agent去执行。结果从「写一个功能要几天」变成「几分钟就能出带测试的PR」。

Thin Harness + Fat Skills:这期最值得记住的概念

Garry提出的核心哲学只有一句话:Thin Harness + Fat Skills

Thin Harness指的是agent的执行框架要尽量薄、尽量简单。不需要搞复杂系统,OpenClaw、Claude Code这种工具就够了。

Fat Skills指的是把真正复杂的东西写进Markdown skills里。这些skills像recipe一样一步步告诉agent该怎么做:怎么做产品规划、怎么写工程方案、怎么做code review、怎么跑QA、怎么画数据流图。

这里有一个反常识的判断:不要把一切都塞进代码里。

过去的共识是复杂逻辑应该写成代码,因为代码确定、可执行、可复用。但在agent时代,Garry认为很多逻辑更适合写成Markdown。代码是确定性的,写错一个edge case就会出bug;Markdown是模糊的、开放的,正好适合agent理解和发挥。

以前写代码要小心翼翼考虑edge case,现在可以直接让agent "boil the ocean",把所有能想到的东西都展开,让它自己处理细节。这意味着人和机器的分工彻底反转——人是指挥者,机器把模糊意图翻译成具体实现。

实操方法一:用Claude Code重启coding

Garry的第一步极其简单:打开Claude Code(后期更多用OpenClaw),开始把重复操作沉淀成skills。

他有一个最关键的skill叫Plan-Eng-Review,流程是这样的:

  • 先让agent做规划
  • 让agent画ASCII图,把数据流、用户流程、状态机全部画出来
  • 进入代码实现
  • 最后review测试

这一步至关重要。很多人用AI写代码最大的问题是上来就让它写,结果agent很快跑偏。Garry的方法是写代码之前必须先画图,让agent把结构、状态和流程讲清楚再动手实现。

他现在的日常workflow是这样的:

  • 先写CEO Plan,像Brian Chesky那样问10x问题:这个功能有没有可能做大十倍?有没有更极端、更用户友好的方案?有没有被传统软件惯性限制住?
  • Plan-Eng-Review,让agent把计划变成工程方案,再变成代码
  • 最后用Codex做最终code review

他对模型的分工也很清楚:Claude适合创意和生成,Codex适合严谨review。此外他还会用Playwright加Browse skill做自动QA。所以他现在一天能drop 10+ PR,而且都是带完整测试和review流程的代码。

实操方法二:Gstack到底是什么

Gstack是Garry基于OpenClaw魔改出来的agent harness,内置了很多skills:CEO、Designer、DevEx、Plan-Eng-Review、Browse、QA等等。

用法非常简单:

  • 想做新功能时敲 /ceo,让agent自动做市场调研、10x思考、产品判断和架构草图
  • /plan-eng-review 生成完整代码和测试
  • /codex/claude 做最终review

听起来像开发工具,但它本质上是一套「把人升级成产品CEO」的工作流。Gstack不是取代你,而是把你从码农变成CEO+产品经理。你不再需要把大部分时间花在boilerplate、重复逻辑、测试修复、查文档上。你要做的是提需求、判方向、校准品味、决定什么值得做。

agent干95%的活,人类负责最后5%的判断。但恰恰是这5%决定了产品的上限。

实操方法三:Tokenmaxxing到底怎么玩

Garry最爱说的词叫Tokenmaxxing——把token烧到极致。

以前大家用AI总想着省token、压缩prompt。Garry的思路完全反过来:能多加context,就多加context。在agent时代,token不是成本,而是杠杆。烧掉的是token,买回来的是时间、注意力和执行力。

具体做法是先让agent "boil the ocean"。在写代码之前,把所有相关代码、文档、历史PR、产品背景、用户反馈都喂进去。不要只给一个孤零零的prompt,而是尽可能把上下文补满。

在Gstack里,他还会用RAG加hybrid search(也就是Browse skill)去抓全网数据。最重要的是写代码前必须先画ASCII图——数据流怎么走,状态机怎么切换,用户路径是什么。这是为了防止agent在大量context里迷路。

Garry's List的RAG系统就是把GitHub和互联网的大量信息喂给agent,最后生成出来的文章质量甚至超过了很多人类记者。一个直接的判断:未来真正厉害的人不是最会省token的人,而是最会花token的人。

关于"代码行数不重要"这件事

网上很多人喷Garry,说lines of code不代表生产力。这句话在过去成立——人类写代码时行数容易注水,写得多不代表写得好。

但在agent时代逻辑反过来了。agent写代码不是为了显得自己工作努力,它写的是实际逻辑、测试、修复和工程实现。Garry用工具统计后发现,自己现在每天产出的有效代码是2013年的400倍。

重点不是「代码越多越好」,而是agent把人从boilerplate和重复劳动里解放出来,让人能把注意力放在架构、产品和判断上。过去一个人一天能认真推进一个功能就不错,现在一个人一天可以同时推进多个PR、多个实验、多个产品方向。这才是400x的本质。

Agent不是取代人,是放大人

很多人担心AI抢程序员饭碗。Garry的判断刚好相反——现在恰恰是人类最有力量的时候。

以前写代码是执行:你想到一个功能,还要花大量时间把它翻译成代码,想法和产品之间隔着大量体力活。现在写代码变成了指挥:你只要有vision、有taste,能判断什么是好东西,agent就能帮你把中间的执行工作吃掉。

这就是为什么一个13年没coding的人能重新变成超高产builder。他不是回到了2013年「手写每一行代码」的状态,而是进入了新状态:人类负责方向,agent负责执行。这不是人被AI替代,而是人被AI放大。

普通人怎么开始

不要一上来就搭超复杂的agent系统。直接装Claude Code或OpenClaw,从写一个简单skill开始。比如先写一个产品规划skill,让agent每次做功能前都先帮你想清楚用户、目标、边界和风险。

然后养成一个固定workflow:

  • 用CEO skill做plan
  • 让agent画ASCII图,把数据流、用户流程、状态机讲清楚
  • 让agent写代码和测试
  • 用Codex或另一个模型做code review

整个过程里最重要的是Tokenmaxxing的心态:不要太省token,能多喂context就多喂;不要怕agent写错,写错就让它自己fix,人类只负责最终判断——方向对不对、体验好不好、架构合不合理。


这套方法论本身没什么神秘的——Claude Code、OpenClaw这些工具任何人都能用,真正的差距不在工具而在工作方式的重构。Thin Harness + Fat Skills + Tokenmaxxing这个组合的真正价值,是把「会写代码」这个稀缺资源贬值了,把「有vision和taste」这个稀缺资源放大了。当agent接管95%的执行后,能不能找到值得做的那5%才是分水岭。