当代码不再需要程序员亲手书写
Clive Thompson 在2026年3月12日发表于《纽约时报》杂志的长篇报道《Coding After Coders: The End of Computer Programming as We Know It》(副标题:“在AI代理的时代,许多硅谷程序员几乎不再编程。他们正在做的事情,深深地、深深地诡异”),是迄今为止对AI如何改变编程工作最全面的新闻调查。文章的核心判断是:编程正经历其80年历史中最怪异的转变——从一种书写行为变成了一种对话行为,而编码可能是”AI真正能够替代的第一种昂贵的工业化人力劳动”。矛盾的是,Thompson 在2025年秋冬采访的70多位开发者中,大多数人对此不是沮丧,而是”奇怪地兴奋”。这篇文章在发表后迅速引发了开发者社区的广泛讨论,被 Simon Willison 称为”史诗级报道”。
从一天缩短到半小时:Hyperspell 的日常
文章以机器学习工程师 Manu Ebert(39岁,前神经科学家,曾在 Airbnb 工作)和他的联合创始人 Conor Brennan-Burke(32岁)的创业公司 Hyperspell(YC F25 批次)开场。Thompson 造访了他们工作的公寓,看到 Ebert 的巨大曲面显示器上同时运行着多个 Claude Code 代理——一个在写新功能,一个在测试,第三个像虚拟监工一样监督一切。几分钟后,Claude 闪出提示:“Implementation complete!”
Ebert 在90年代学会编程,一行一行地手写代码。但到了2025年秋天,“一切都结束了”。AI 变得如此出色,Ebert 从谨慎尝试到逐步放手,到现在 Claude Code 承担了绝大部分编码工作。一个客户最近需要新功能,过去要花一整天的工作,现在只用半小时。他和 Brennan-Burke 仍然是软件开发者,但”像他们的大多数同行一样,只是偶尔才亲自写代码。相反,他们整天在跟AI对话,用简单英语描述需求,回应AI的’计划’,然后放手让代理去干”。
文章中一个极为生动的细节是 Ebert 的提示文件(prompt file)——Thompson 将其形容为”一份严厉的十诫”。其中一条针对 Python 测试的提示写道:“推送未通过 pytest 的代码是不可接受的,也是令人羞耻的(embarrassing)。“Thompson 好奇地问:告诉AI”别丢你的脸”真的有用吗?Ebert 不好意思地笑了,说他无法证明,但这类提示”似乎略微提升了 Claude 的表现”。Brennan-Burke 补充:“还记得那个研究吗?对模型越粗鲁,它表现越好。“两人大笑。Thompson 观察到,许多程序员如今会”责骂AI代理、恳求它们、用大写字母呐喊重要指令——或者像催眠师一样重复同一条指令多次”。
“建筑师而非建筑工人”:文章的核心论点
Thompson 的叙事框架清晰而尖锐。文章指出,几十年来,编程被视为一种魔法——只要你能力尚可,就可以期待终身就业;如果你特别优秀还有运气,就能致富。硅谷的大人物们在2010年代对那些处于衰落行业的美国工人说教:“去学编程吧”。现在轮到编程本身被自动化了。
Thompson 写道:“对外人来说,程序员面临的处境似乎是活该,甚至是可笑的:美国白领工人长期担心硅谷有一天会用AI自动化他们的工作,但看看谁先被击中了!“他紧接着点明了关键差异:“AI生成的视频看起来很粗糙,人造照片超现实;法律文书可能布满令人职业自杀的错误。但AI生成的代码?如果它通过了测试、能正常运行,它就值得人类每年20万美元以上的薪水。”
文章的核心隐喻是从建筑工人到建筑师的转变。开发者使用AI后,专注于软件的整体架构——功能如何协作,特性如何组合。由于代理可以极快地产出可运行代码,人类监督者可以不断实验,尝试各种方案,丢弃不行的。Thompson 发现,多位程序员表示”感觉有点像 Steve Jobs——后者以让员工不断做原型闻名,自己处理大量原型再选出感觉对的”。
七十多位开发者说了什么
文章采访阵容横跨大公司和独立开发者,以下是通过二手来源可确认的关键人物及观点:
Steve Yegge(资深程序员,自己构建了运行编码代理群的工具)提供了最夸张的生产力数据:“我们说的是比我职业生涯中任何时候都高10到20倍——甚至100倍的生产力。就像我们一辈子都在走路,“他说,但现在他们搭上了一辆车,“快得他妈的。”
Anil Dash(资深程序员和科技高管)贡献了文章中最精炼的概念区分:“科技界——特别是编码者——对大语言模型的看法与其他人不同,原因是:在创意领域,LLM 夺走了工作中最有灵魂的人性部分,把苦活留给你。而在编码中,LLM 夺走了苦活,把人性的、有灵魂的部分留给你。”
Simon Willison(科技创业者、AI辅助编程领域最具影响力的博主之一)的引用出现在文章讨论”代码可验证性”的段落中:“程序员的处境其实很轻松。如果你是律师,你就惨了,对吧?“他的逻辑是,代码有一个独特优势——你可以要求AI代理测试代码,看它是否正确运行,从而”将AI拴在现实上”。法律文书则没有自动检查幻觉的方法,除了在法庭上彻底出丑。
一位匿名苹果工程师是文章中为数不多的反对声音之一:“我相信(编程)可以是有趣的、令人满足的、引人入胜的,让计算机替你做这些事剥夺了你的这种体验。“他要求匿名,以免因批评苹果对AI的拥抱而惹上麻烦。Simon Willison 对此评论道:“这个要求匿名的请求,尖锐地提醒我们,企业动态可能正在压制这个话题上的大量声音。”
Thomas Ptacek(知名安全研究者)被确认为受访者之一,但其具体引述因原文受付费墙保护而未能从二手来源获取。
Andrej Karpathy 的观点贯穿文章背景。他在2025年2月创造了”vibe coding”(氛围编码)一词,描述开发者通过提示而非直接写代码来制作软件。到2026年2月,他进一步提出了”agentic engineering”(代理工程)的概念——“你不再99%的时间里直接写代码,而是编排做事的代理并充当监督者”。他广为引用的判断是:“在文本编辑器中输入计算机代码的时代——自计算机发明以来的方式——那个时代已经结束了。你现在是启动AI代理,用英语给它们分配任务,然后并行管理和审查它们的工作。“
数据与研究:生产力奇迹还是生产力幻觉?
文章发表的背景是大量相互矛盾的生产力数据。这些数据为理解文章论点提供了重要的证伪和验证框架。
乐观的一面:AI编码工具市场在2025年达到73.7亿美元(2024年为49.1亿),预计2032年达301亿。GitHub Copilot 拥有2000万历史用户和130万付费订阅者,活跃用户中 Copilot 编写了46%的代码(2022年启用时仅27%)。Cursor 在24个月内从零冲到10亿美元年化收入,创造了B2B SaaS历史上最快纪录,估值达293亿美元。Claude Code 在公开发布仅6个月后就为 Anthropic 贡献了10亿美元年化收入,到2026年2月已翻倍至25亿美元。Stack Overflow 2025年开发者调查显示,84%的开发者正在使用或计划使用AI编码工具,51%每天使用。
矛盾的信号:最具颠覆性的发现来自 METR 研究(2025年7月),这是一项对16位经验丰富的开源开发者进行的随机对照实验。开发者在246个任务上使用 Cursor Pro + Claude 3.5/3.7 Sonnet。他们预测AI会让完成时间缩短24%,事后感觉缩短了20%。但实际测量结果是:AI让他们变慢了19%。Faros AI 对10000多名开发者的分析也揭示了一个”生产力悖论”:重度使用AI的团队完成了多21%的任务、合并了多98%的PR,但PR审查时间暴涨91%,每位开发者的bug增加了9%,平均PR规模膨胀154%。DX 在2026年2月调查了12.1万开发者,发现开发者自称每天节省约40分钟,但整体生产力提升仅约10%。Bain & Company 在2025年9月的报告直接用了”不起眼”来形容实际生产力节省。
这组数据揭示了一个关键张力:个人体验与系统测量之间存在巨大鸿沟。开发者普遍感觉自己快了很多(正如 Steve Yegge 声称的10-100倍),但严谨的实验测量要么显示提升有限,要么甚至显示效率下降。这并不一定意味着某一方是错的——可能AI在某些任务类型(如原型设计、样板代码)上确实带来了飞跃性提升,但在成熟代码库的复杂任务上反而制造了额外开销。
就业市场地震:初级开发者首当其冲
文章对经济后果的讨论获得了斯坦福大学一项关键研究的支持。斯坦福数字经济实验室(Brynjolfsson、Chandar、Chen)2025年8月发表的《煤矿中的金丝雀?》分析了ADP薪资数据覆盖的数百万工人,发现22-25岁软件开发者的就业人数从2022年末的峰值下降了近20%,而26-55岁同行的就业保持稳定甚至增长6-12%。研究者指出,AI可能正在自动化”可编码化、可检查的任务——这些任务历史上为初级岗位的存在提供了理由”,同时增强了”需要判断力、客户互动和流程管理的资深工作者”。
更广泛的数据同样严峻:22-27岁群体的失业率达7.4%(几乎是全国平均值4.2%的两倍);计算机工程毕业生的失业率达7.5%(高于美术专业毕业生);科技实习岗位自2023年以来减少了30%;大型科技公司2025年新毕业生招聘仅占总招聘的7%,比前几年下降25%。同时,具备AI技能的入门级开发者薪资为9-13万美元,而传统开发岗位仅为6.5-8.5万美元。
这种两极分化正是文章”建筑师vs建筑工人”隐喻的现实注脚——经验丰富的架构师比以往更有价值,而执行层面的”建筑工人”正在被代理取代。文章提及了杰文斯悖论作为一种乐观可能性:正如更高效的蒸汽机反而增加了煤炭消费,更便宜的编码可能激发对定制软件的更大需求。但这种乐观尚未在就业数据中得到验证。
社区反应:谁在欢呼,谁在沉默
文章发表后,开发者社区的反应呈现出鲜明的分层。
业内意见领袖普遍赞赏。Simon Willison 称其为”史诗级作品”,认为文章”准确而清晰地捕捉了我们行业当前的状况,且以适合广泛受众的方式呈现”。Jason Kottke 在 kottke.org 上转发并高亮了”通过测试将AI拴在现实上”的论点。Anil Dash 在LinkedIn分享了文章,并在此前发表过”编码代理是新的编译器”的类比框架。
普通开发者和技术社区反应则更为复杂。在 Althouse 博客上,一篇引用文章的帖子收到了67条评论,呈现出多种立场:有人认为AI最先替代的是那些”复制粘贴GitHub代码的脚本小子”;有人将AI比作”出色的实习生——几秒钟收集基本信息,但无法避免菜鸟错误”;还有人质疑成本效益——“AI编写代码节省的成本,因为编辑需求而被抵消了,因为代码太基础、太容易被攻击”。一位评论者指出了生存者偏差问题:“这么说的都是还有工作的人。当管理层能做你做的事——他们为什么还需要你?”
几个反复出现的争论主题值得注意:
- “编译器类比”vs.”拖拉机类比”:乐观者将AI比作编译器——每一层抽象都创造了更多工作岗位。悲观者更倾向于拖拉机类比——拖拉机不只是改变了农业,它消灭了大部分农业就业
- 初级开发者培养断层:如果初级开发者从不亲手写代码,未来的架构师如何获得设计系统所需的深层理解?
- AI bug的规模问题:人类程序员制造的bug是”人类规模的”,AI制造的bug可能达到”前所未有的规模”
- 企业压力下的沉默:匿名苹果工程师的案例被反复引用,作为批评声音被压制的证据
历史回响与前方道路
编程史上的每一次抽象跃迁——从穿孔卡到汇编、从汇编到 FORTRAN/COBOL、从C到面向对象、从框架到低代码——都伴随着”你这不是真正的编程”的嘲讽,也都伴随着”程序员要失业了”的预言。每一次,程序员的总数不减反增,因为更低的门槛扩大了能编程的人群,新能力创造了对软件的新需求。但每一次也确实有特定技能变得过时——今天几乎没人用汇编写通用应用,穿孔卡操作员早已消失。
当前的AI转型与历史模式既有相似也有显著不同。相似之处在于:争论的核心仍然是”质量vs.手工编写”(与1950年代对FORTRAN的怀疑如出一辙),以及抽象层级的再次提升。不同之处在于两点:第一,技能萎缩成为新问题——开发者报告称大量使用AI后,手动编码能力在退化,这在以前的转型中未曾出现;第二,AI的能力天花板尚未确定——它不像编译器那样有明确的功能边界,而是持续快速进化。
与此同时,Paul Ford 在文章发表前三周的《纽约时报》专栏中提供了一个有力的个人案例:重建自己的个人网站——过去他会为此支付2.5万美元请人做的工作,现在他用AI几周内完成了;一个过去他会收费35万美元的数据转换项目,也在AI辅助下迅速解决。Ford 写道:“我爱的所有人都讨厌这东西,我讨厌的所有人都喜欢它。但可能是因为吸引我走向科技的同一种性格缺陷,我令人烦恼地兴奋。“
结论
Thompson 的报道并未采取末日论调——它将这场转变描绘为编程80年历史中”最奇怪的一次”,同时记录了那些最受影响的人如何以出人意料的热情适应新现实。但文章的真正力量在于它揭示的结构性张力:开发者个体的兴奋与行业整体的就业收缩并行不悖。当一个人能做过去十个人的工作时,那个人确实会”奇怪地兴奋”——但另外九个人的沉默,可能正如匿名苹果工程师的案例所暗示的,被企业动态系统性地压制着。
这篇文章最持久的贡献或许不是它的结论,而是它捕捉到的一个历史瞬间的精确快照:编程正在从一种手艺变成一种管理行为,而从事这一职业的人类正处于一个短暂的窗口期——他们既拥有AI尚不具备的架构判断力,又面临着这种判断力可能在未来几年内也被侵蚀的风险。杰文斯悖论给出了乐观的理论可能性,但斯坦福的就业数据提供了冷峻的现实检验。在这两个极端之间,每一位开发者都在用自己的方式回答同一个问题:当代码不再需要你亲手书写,你还是谁?