当代码不再需要程序员亲手书写

Clive Thompson 在2026年3月12日发表于《纽约时报》杂志的长篇报道《Coding After Coders: The End of Computer Programming as We Know It》（副标题：“在AI代理的时代，许多硅谷程序员几乎不再编程。他们正在做的事情，深深地、深深地诡异”），是迄今为止对AI如何改变编程工作最全面的新闻调查。文章的核心判断是：编程正经历其80年历史中最怪异的转变——从一种书写行为变成了一种对话行为，而编码可能是”AI真正能够替代的第一种昂贵的工业化人力劳动”。矛盾的是，Thompson 在2025年秋冬采访的70多位开发者中，大多数人对此不是沮丧，而是”奇怪地兴奋”。这篇文章在发表后迅速引发了开发者社区的广泛讨论，被 Simon Willison 称为”史诗级报道”。

从一天缩短到半小时：Hyperspell 的日常

文章以机器学习工程师 Manu Ebert（39岁，前神经科学家，曾在 Airbnb 工作）和他的联合创始人 Conor Brennan-Burke（32岁）的创业公司 Hyperspell（YC F25 批次）开场。Thompson 造访了他们工作的公寓，看到 Ebert 的巨大曲面显示器上同时运行着多个 Claude Code 代理——一个在写新功能，一个在测试，第三个像虚拟监工一样监督一切。几分钟后，Claude 闪出提示：“Implementation complete!”

Ebert 在90年代学会编程，一行一行地手写代码。但到了2025年秋天，“一切都结束了”。AI 变得如此出色，Ebert 从谨慎尝试到逐步放手，到现在 Claude Code 承担了绝大部分编码工作。一个客户最近需要新功能，过去要花一整天的工作，现在只用半小时。他和 Brennan-Burke 仍然是软件开发者，但”像他们的大多数同行一样，只是偶尔才亲自写代码。相反，他们整天在跟AI对话，用简单英语描述需求，回应AI的’计划’，然后放手让代理去干”。

文章中一个极为生动的细节是 Ebert 的提示文件（prompt file）——Thompson 将其形容为”一份严厉的十诫”。其中一条针对 Python 测试的提示写道：“推送未通过 pytest 的代码是不可接受的，也是令人羞耻的（embarrassing）。“Thompson 好奇地问：告诉AI”别丢你的脸”真的有用吗？Ebert 不好意思地笑了，说他无法证明，但这类提示”似乎略微提升了 Claude 的表现”。Brennan-Burke 补充：“还记得那个研究吗？对模型越粗鲁，它表现越好。“两人大笑。Thompson 观察到，许多程序员如今会”责骂AI代理、恳求它们、用大写字母呐喊重要指令——或者像催眠师一样重复同一条指令多次”。

“建筑师而非建筑工人”：文章的核心论点

Thompson 的叙事框架清晰而尖锐。文章指出，几十年来，编程被视为一种魔法——只要你能力尚可，就可以期待终身就业；如果你特别优秀还有运气，就能致富。硅谷的大人物们在2010年代对那些处于衰落行业的美国工人说教：“去学编程吧”。现在轮到编程本身被自动化了。

Thompson 写道：“对外人来说，程序员面临的处境似乎是活该，甚至是可笑的：美国白领工人长期担心硅谷有一天会用AI自动化他们的工作，但看看谁先被击中了！“他紧接着点明了关键差异：“AI生成的视频看起来很粗糙，人造照片超现实；法律文书可能布满令人职业自杀的错误。但AI生成的代码？如果它通过了测试、能正常运行，它就值得人类每年20万美元以上的薪水。”

文章的核心隐喻是从建筑工人到建筑师的转变。开发者使用AI后，专注于软件的整体架构——功能如何协作，特性如何组合。由于代理可以极快地产出可运行代码，人类监督者可以不断实验，尝试各种方案，丢弃不行的。Thompson 发现，多位程序员表示”感觉有点像 Steve Jobs——后者以让员工不断做原型闻名，自己处理大量原型再选出感觉对的”。

七十多位开发者说了什么

文章采访阵容横跨大公司和独立开发者，以下是通过二手来源可确认的关键人物及观点：

Steve Yegge（资深程序员，自己构建了运行编码代理群的工具）提供了最夸张的生产力数据：“我们说的是比我职业生涯中任何时候都高10到20倍——甚至100倍的生产力。就像我们一辈子都在走路，“他说，但现在他们搭上了一辆车，“快得他妈的。”

Anil Dash（资深程序员和科技高管）贡献了文章中最精炼的概念区分：“科技界——特别是编码者——对大语言模型的看法与其他人不同，原因是：在创意领域，LLM 夺走了工作中最有灵魂的人性部分，把苦活留给你。而在编码中，LLM 夺走了苦活，把人性的、有灵魂的部分留给你。”

Simon Willison（科技创业者、AI辅助编程领域最具影响力的博主之一）的引用出现在文章讨论”代码可验证性”的段落中：“程序员的处境其实很轻松。如果你是律师，你就惨了，对吧？“他的逻辑是，代码有一个独特优势——你可以要求AI代理测试代码，看它是否正确运行，从而”将AI拴在现实上”。法律文书则没有自动检查幻觉的方法，除了在法庭上彻底出丑。

一位匿名苹果工程师是文章中为数不多的反对声音之一：“我相信（编程）可以是有趣的、令人满足的、引人入胜的，让计算机替你做这些事剥夺了你的这种体验。“他要求匿名，以免因批评苹果对AI的拥抱而惹上麻烦。Simon Willison 对此评论道：“这个要求匿名的请求，尖锐地提醒我们，企业动态可能正在压制这个话题上的大量声音。”

Thomas Ptacek（知名安全研究者）被确认为受访者之一，但其具体引述因原文受付费墙保护而未能从二手来源获取。

Andrej Karpathy 的观点贯穿文章背景。他在2025年2月创造了”vibe coding”（氛围编码）一词，描述开发者通过提示而非直接写代码来制作软件。到2026年2月，他进一步提出了”agentic engineering”（代理工程）的概念——“你不再99%的时间里直接写代码，而是编排做事的代理并充当监督者”。他广为引用的判断是：“在文本编辑器中输入计算机代码的时代——自计算机发明以来的方式——那个时代已经结束了。你现在是启动AI代理，用英语给它们分配任务，然后并行管理和审查它们的工作。“

数据与研究：生产力奇迹还是生产力幻觉？

文章发表的背景是大量相互矛盾的生产力数据。这些数据为理解文章论点提供了重要的证伪和验证框架。

乐观的一面：AI编码工具市场在2025年达到73.7亿美元（2024年为49.1亿），预计2032年达301亿。GitHub Copilot 拥有2000万历史用户和130万付费订阅者，活跃用户中 Copilot 编写了46%的代码（2022年启用时仅27%）。Cursor 在24个月内从零冲到10亿美元年化收入，创造了B2B SaaS历史上最快纪录，估值达293亿美元。Claude Code 在公开发布仅6个月后就为 Anthropic 贡献了10亿美元年化收入，到2026年2月已翻倍至25亿美元。Stack Overflow 2025年开发者调查显示，84%的开发者正在使用或计划使用AI编码工具，51%每天使用。

矛盾的信号：最具颠覆性的发现来自 METR 研究（2025年7月），这是一项对16位经验丰富的开源开发者进行的随机对照实验。开发者在246个任务上使用 Cursor Pro + Claude 3.5/3.7 Sonnet。他们预测AI会让完成时间缩短24%，事后感觉缩短了20%。但实际测量结果是：AI让他们变慢了19%。Faros AI 对10000多名开发者的分析也揭示了一个”生产力悖论”：重度使用AI的团队完成了多21%的任务、合并了多98%的PR，但PR审查时间暴涨91%，每位开发者的bug增加了9%，平均PR规模膨胀154%。DX 在2026年2月调查了12.1万开发者，发现开发者自称每天节省约40分钟，但整体生产力提升仅约10%。Bain & Company 在2025年9月的报告直接用了”不起眼”来形容实际生产力节省。

这组数据揭示了一个关键张力：个人体验与系统测量之间存在巨大鸿沟。开发者普遍感觉自己快了很多（正如 Steve Yegge 声称的10-100倍），但严谨的实验测量要么显示提升有限，要么甚至显示效率下降。这并不一定意味着某一方是错的——可能AI在某些任务类型（如原型设计、样板代码）上确实带来了飞跃性提升，但在成熟代码库的复杂任务上反而制造了额外开销。

就业市场地震：初级开发者首当其冲

文章对经济后果的讨论获得了斯坦福大学一项关键研究的支持。斯坦福数字经济实验室（Brynjolfsson、Chandar、Chen）2025年8月发表的《煤矿中的金丝雀？》分析了ADP薪资数据覆盖的数百万工人，发现22-25岁软件开发者的就业人数从2022年末的峰值下降了近20%，而26-55岁同行的就业保持稳定甚至增长6-12%。研究者指出，AI可能正在自动化”可编码化、可检查的任务——这些任务历史上为初级岗位的存在提供了理由”，同时增强了”需要判断力、客户互动和流程管理的资深工作者”。

更广泛的数据同样严峻：22-27岁群体的失业率达7.4%（几乎是全国平均值4.2%的两倍）；计算机工程毕业生的失业率达7.5%（高于美术专业毕业生）；科技实习岗位自2023年以来减少了30%；大型科技公司2025年新毕业生招聘仅占总招聘的7%，比前几年下降25%。同时，具备AI技能的入门级开发者薪资为9-13万美元，而传统开发岗位仅为6.5-8.5万美元。

这种两极分化正是文章”建筑师vs建筑工人”隐喻的现实注脚——经验丰富的架构师比以往更有价值，而执行层面的”建筑工人”正在被代理取代。文章提及了杰文斯悖论作为一种乐观可能性：正如更高效的蒸汽机反而增加了煤炭消费，更便宜的编码可能激发对定制软件的更大需求。但这种乐观尚未在就业数据中得到验证。

社区反应：谁在欢呼，谁在沉默

文章发表后，开发者社区的反应呈现出鲜明的分层。

业内意见领袖普遍赞赏。Simon Willison 称其为”史诗级作品”，认为文章”准确而清晰地捕捉了我们行业当前的状况，且以适合广泛受众的方式呈现”。Jason Kottke 在 kottke.org 上转发并高亮了”通过测试将AI拴在现实上”的论点。Anil Dash 在LinkedIn分享了文章，并在此前发表过”编码代理是新的编译器”的类比框架。

普通开发者和技术社区反应则更为复杂。在 Althouse 博客上，一篇引用文章的帖子收到了67条评论，呈现出多种立场：有人认为AI最先替代的是那些”复制粘贴GitHub代码的脚本小子”；有人将AI比作”出色的实习生——几秒钟收集基本信息，但无法避免菜鸟错误”；还有人质疑成本效益——“AI编写代码节省的成本，因为编辑需求而被抵消了，因为代码太基础、太容易被攻击”。一位评论者指出了生存者偏差问题：“这么说的都是还有工作的人。当管理层能做你做的事——他们为什么还需要你？”

几个反复出现的争论主题值得注意：

“编译器类比”vs.”拖拉机类比”：乐观者将AI比作编译器——每一层抽象都创造了更多工作岗位。悲观者更倾向于拖拉机类比——拖拉机不只是改变了农业，它消灭了大部分农业就业
初级开发者培养断层：如果初级开发者从不亲手写代码，未来的架构师如何获得设计系统所需的深层理解？
AI bug的规模问题：人类程序员制造的bug是”人类规模的”，AI制造的bug可能达到”前所未有的规模”
企业压力下的沉默：匿名苹果工程师的案例被反复引用，作为批评声音被压制的证据

历史回响与前方道路

编程史上的每一次抽象跃迁——从穿孔卡到汇编、从汇编到 FORTRAN/COBOL、从C到面向对象、从框架到低代码——都伴随着”你这不是真正的编程”的嘲讽，也都伴随着”程序员要失业了”的预言。每一次，程序员的总数不减反增，因为更低的门槛扩大了能编程的人群，新能力创造了对软件的新需求。但每一次也确实有特定技能变得过时——今天几乎没人用汇编写通用应用，穿孔卡操作员早已消失。

当前的AI转型与历史模式既有相似也有显著不同。相似之处在于：争论的核心仍然是”质量vs.手工编写”（与1950年代对FORTRAN的怀疑如出一辙），以及抽象层级的再次提升。不同之处在于两点：第一，技能萎缩成为新问题——开发者报告称大量使用AI后，手动编码能力在退化，这在以前的转型中未曾出现；第二，AI的能力天花板尚未确定——它不像编译器那样有明确的功能边界，而是持续快速进化。

与此同时，Paul Ford 在文章发表前三周的《纽约时报》专栏中提供了一个有力的个人案例：重建自己的个人网站——过去他会为此支付2.5万美元请人做的工作，现在他用AI几周内完成了；一个过去他会收费35万美元的数据转换项目，也在AI辅助下迅速解决。Ford 写道：“我爱的所有人都讨厌这东西，我讨厌的所有人都喜欢它。但可能是因为吸引我走向科技的同一种性格缺陷，我令人烦恼地兴奋。“

结论

Thompson 的报道并未采取末日论调——它将这场转变描绘为编程80年历史中”最奇怪的一次”，同时记录了那些最受影响的人如何以出人意料的热情适应新现实。但文章的真正力量在于它揭示的结构性张力：开发者个体的兴奋与行业整体的就业收缩并行不悖。当一个人能做过去十个人的工作时，那个人确实会”奇怪地兴奋”——但另外九个人的沉默，可能正如匿名苹果工程师的案例所暗示的，被企业动态系统性地压制着。

这篇文章最持久的贡献或许不是它的结论，而是它捕捉到的一个历史瞬间的精确快照：编程正在从一种手艺变成一种管理行为，而从事这一职业的人类正处于一个短暂的窗口期——他们既拥有AI尚不具备的架构判断力，又面临着这种判断力可能在未来几年内也被侵蚀的风险。杰文斯悖论给出了乐观的理论可能性，但斯坦福的就业数据提供了冷峻的现实检验。在这两个极端之间，每一位开发者都在用自己的方式回答同一个问题：当代码不再需要你亲手书写，你还是谁？