工作流的剧变:从手写代码到自然语言编程

11月时还是80%手动编码加自动补全、20%交给AI Agent。到了12月,比例彻底反转——80%的编码工作由Agent完成,人只负责20%的编辑和润色。换句话说,现在基本是用英语(自然语言)告诉大模型该写什么代码。

这种转变确实有点伤程序员自尊,但用大粒度的"代码动作"来操控软件的威力实在太大了,尤其当你适应了它、配置好了它、搞清楚它能做什么不能做什么之后。目前估计已有两位数百分比的工程师在经历类似的转变,但大众的认知还停留在个位数。

Agent编程仍然需要你盯着

无论是"IDE已死"还是"Agent集群自动干活"的说法,目前都过于夸张了。

模型仍然会犯错。如果你有任何真正在乎的代码,建议像鹰一样盯着Agent的输出,同时在旁边开一个大型 IDE 做对照。错误的性质已经不是简单的语法错误了,而是那种粗心的初级开发者才会犯的微妙概念性错误。最常见的情况包括:

  • 错误假设一路狂奔:模型替你做了一个错误的假设,然后不加验证地一路执行下去
  • 不会管理自己的困惑:不会主动寻求澄清,不会指出不一致的地方,不会呈现权衡取舍,该反对时不反对,还是有点过于谄媚
  • 过度工程化:特别喜欢把代码和API搞得太复杂,膨胀抽象层,不会自己清理死代码。可能会用1000行代码实现一个低效臃肿的方案,你说一句"你不能直接这样做吗?",它就"当然可以!"然后缩到100行
  • 误伤旁观代码:有时会作为副作用改动或删除它不理解的注释和代码,即使跟当前任务完全无关

即使在 CLAUDE.md 里写了明确的指令来约束这些行为,以上问题仍然时有发生。但尽管如此,这仍然是一个巨大的净改进,很难想象回到纯手动编码的日子。

当前推荐的开发布局:左侧用 Ghostty 终端窗口开几个 Claude Code 会话,右侧放一个 IDE 同步查看和手动编辑代码。

Agent的耐力是一种被低估的优势

看着Agent不知疲倦地攻克一个难题,这种体验很有意思。它从不疲惫、从不气馁,只是不断尝试不同的方案,而人类可能早就放弃改天再说了。看它在一个问题上挣扎半小时后终于搞定,你会意识到耐力本身就是工作中的核心瓶颈,而AI把这个瓶颈大幅拉高了。

加速还是能力扩张?

如何衡量AI辅助编程的"加速"效果其实并不明确。做原来就要做的事确实快了很多,但主要的变化是:做了比原计划多得多的事情。原因有两个:

  1. 可以编写各种以前不值得花时间写的东西
  2. 可以处理以前因为知识或技能不足而无法触碰的代码

所以与其说是加速,不如说是一种能力边界的扩张。这对独立开发者来说尤其重要——一个人能覆盖的技术栈范围被显著拓宽了。

用声明式思维放大杠杆效应

大模型特别擅长循环迭代直到满足特定目标,这也是Agent编程中最有威力的部分。实操建议:

  • 不要告诉它怎么做,给出成功标准让它自己去执行
  • 让它先写测试,然后通过测试——这是天然的验证闭环
  • 配合浏览器 MCP 放进自动化循环里
  • 先写出大概率正确的朴素算法,再让它在保持正确性的前提下优化
  • 把你的指令风格从命令式改为声明式,让Agent循环更久,获得更大的杠杆效应

编程反而变得更有趣了

一个意外的收获是,有了Agent之后编程变得更有趣了。大量填空式的苦差事被消除,剩下的是创造性部分。被卡住的频率也低了很多,因为几乎总有办法和AI协作取得一些进展。

当然也有人感受相反。AI编程正在把工程师分成两类人:一类主要享受编码本身的人,另一类主要享受构建产品的人。对于后者来说,这是一个黄金时代。

需要警惕的退化

一个真实的副作用:手动写代码的能力开始退化。生成代码(写)和判别代码(读/审查)是大脑中不同的能力回路。由于编程涉及大量语法细节,即使写代码的手感变钝了,审查代码的能力仍然可以保持。但这种分化值得每个依赖AI编程的人留意。

2026年的展望

大模型Agent的能力(尤其是 Claude 和 Codex)在2025年12月左右跨越了某种连贯性阈值,在软件工程领域引发了一次相变。智能部分突然远远领先于配套的工具集成、组织工作流、流程设计和更广泛的行业扩散。2026年将是整个行业消化吸收这种新能力的高能量年份。

几个值得思考的问题:普通工程师和顶级工程师之间的生产力差距很可能会大幅扩大;通才可能越来越胜过专家,因为大模型在填补微观知识方面远强于宏观战略;而对于独立开发者和一人公司来说,这意味着一个人能做的事情的上限,正在被重新定义。