iPhone 黑客称 AI 编程代理是一场昂贵的错误

2026年5月26日上午3:13 • 专题 • 阅读 2318

乔治·霍茨（George Hotz），这位在 17 岁时首次破解 iPhone，并对 PlayStation 3 进行了逆向工程的黑客，在周日发布了一篇博客文章，称认为大规模采用用于 AI 编程代理（AI coding agents）将导致软件质量出现显著下滑。霍茨写道：“我现在就说，AI 代理进入软件开发的采用，将成为该领域历史上代价最高的错误之一。”他的观点与人工智能领域最知名的研究者之一安德烈吉·卡尔帕蒂（Andrej Karpathy）形成直接对立。卡尔帕蒂于 2026 年 5 月 19 日加入 Anthropic 的预训练团队，明确表示他的看法是：AI 代理已经改变了软件开发。这两人代表了这场尚未平息的行业争论中的对立两极，都有相当可信度来支撑各自立场。

霍茨的核心论点

霍茨用 6 个月时间在真实项目上测试 AI 代理：测试内容包括他开源的深度学习框架 Tinygrad 的部分，以及对一个 USB-PCIe 芯片的完整固件逆向工程。基于这段经历，他认为“代理无法编程，而且越来越意识到它们根本不行”。他形容其输出是：“坏掉了，但这种坏法越来越难以被发现。也正是你会期待的——来自一个愈发准确的统计模型。”

他最关心的是组织层面的问题。高绩效者拥有紧密的反馈回路，能在代理生成的问题交付之前就捕捉到——他们会阅读代码、发现错误，并在何时信任该工具上进行校准。“低绩效者不会有那种自我校验，”霍茨写道。关键在于：低绩效者正在使用代理来产出相当于他们以往 10 倍的结果。在大型公司中，这会让平均代码质量出现更快的劣化，而这种劣化被海量产出掩盖。霍茨将其结果描述为：“海量烂摊子的黄金时代，以及高质量瑰宝的黑暗时代。”他还提到有报道称苹果正将 AI 编程工具推向其整个工程组织，并追问：“你觉得未来 2 年里，macOS 会变得更好还是更糟？”

这不关乎自我（ego）

霍茨预见了这样的反对意见：程序员会自然地抵制被替代工具，因为程序往往会成为他们身份的一部分。他认真对待这种担忧并从道理上加以否定。“Google 的 AFL 找到的错误比 LLMs 还多，而没人对此有那种感觉。国际象棋和围棋比以往更受欢迎，”他写道。国际象棋 AI 已经统治人类数十年，但这项游戏反而变得更受欢迎。

霍茨也对行业动机表达怀疑：“我几乎觉得这是一种为了卖代理而进行的某种心理战（psyop）。恐惧失去是让大公司挪动的少数方式之一。不过我觉得在这种恐惧之下，他们会犯下一个巨大的错误。”

两派各自站在哪儿

霍茨现在把自己定位在他所称的“LeCun/Marcus 阵营”——指的是 Meta 首席 AI 科学家 Yann LeCun，以及长期以来对 LLM 持怀疑态度的 Gary Marcus。两人都曾论证：语言模型本质上是更复杂的模式匹配器——它们可以模仿现有代码的分布，但无法从第一性原理去推理真正全新的问题。

“氛围编码”（vibe coding）——用自然语言描述你想要什么，并让 AI 生成实现——在过去一年中迅速爆发。主要的 AI 实验室已将基于代理的编码定位为旗舰产品。微软在 2025 年把 GitHub Copilot 转变为一个完整的代理化系统，CEO 萨提亚·纳德拉（Satya Nadella）将其描述为类似于转向云的、平台层面的转变。

卡尔帕蒂在 2025 年早些时候对代理持怀疑态度，但在新的模型发布后改变了立场。Anthropic 首席执行官达里奥·阿莫代伊（Dario Amodei）在达沃斯表示：一些 Anthropic 的工程师已经停止亲自编写代码，让模型来处理，而他们则在审阅输出。霍茨在尝试同样的方法后说，他发现每一次都会忍不住去做手动修复。

免责声明：以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。

本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com，本站相关工作人员将会进行核查处理回复