iPhone 黑客称 AI 编程代理是一场昂贵的错误

乔治·霍茨(George Hotz),这位在 17 岁时首次破解 iPhone,并对 PlayStation 3 进行了逆向工程的黑客,在周日发布了一篇博客文章,称认为大规模采用用于 AI 编程代理(AI coding agents)将导致软件质量出现显著下滑。霍茨写道:“我现在就说,AI 代理进入软件开发的采用,将成为该领域历史上代价最高的错误之一。”他的观点与人工智能领域最知名的研究者之一安德烈吉·卡尔帕蒂(Andrej Karpathy)形成直接对立。卡尔帕蒂于 2026 年 5 月 19 日加入 Anthropic 的预训练团队,明确表示他的看法是:AI 代理已经改变了软件开发。这两人代表了这场尚未平息的行业争论中的对立两极,都有相当可信度来支撑各自立场。

霍茨的核心论点

霍茨用 6 个月时间在真实项目上测试 AI 代理:测试内容包括他开源的深度学习框架 Tinygrad 的部分,以及对一个 USB-PCIe 芯片的完整固件逆向工程。基于这段经历,他认为“代理无法编程,而且越来越意识到它们根本不行”。他形容其输出是:“坏掉了,但这种坏法越来越难以被发现。也正是你会期待的——来自一个愈发准确的统计模型。”

他最关心的是组织层面的问题。高绩效者拥有紧密的反馈回路,能在代理生成的问题交付之前就捕捉到——他们会阅读代码、发现错误,并在何时信任该工具上进行校准。“低绩效者不会有那种自我校验,”霍茨写道。关键在于:低绩效者正在使用代理来产出相当于他们以往 10 倍的结果。在大型公司中,这会让平均代码质量出现更快的劣化,而这种劣化被海量产出掩盖。霍茨将其结果描述为:“海量烂摊子的黄金时代,以及高质量瑰宝的黑暗时代。”他还提到有报道称苹果正将 AI 编程工具推向其整个工程组织,并追问:“你觉得未来 2 年里,macOS 会变得更好还是更糟?”

这不关乎自我(ego)

霍茨预见了这样的反对意见:程序员会自然地抵制被替代工具,因为程序往往会成为他们身份的一部分。他认真对待这种担忧并从道理上加以否定。“Google 的 AFL 找到的错误比 LLMs 还多,而没人对此有那种感觉。国际象棋和围棋比以往更受欢迎,”他写道。国际象棋 AI 已经统治人类数十年,但这项游戏反而变得更受欢迎。

霍茨也对行业动机表达怀疑:“我几乎觉得这是一种为了卖代理而进行的某种心理战(psyop)。恐惧失去是让大公司挪动的少数方式之一。不过我觉得在这种恐惧之下,他们会犯下一个巨大的错误。”

两派各自站在哪儿

霍茨现在把自己定位在他所称的“LeCun/Marcus 阵营”——指的是 Meta 首席 AI 科学家 Yann LeCun,以及长期以来对 LLM 持怀疑态度的 Gary Marcus。两人都曾论证:语言模型本质上是更复杂的模式匹配器——它们可以模仿现有代码的分布,但无法从第一性原理去推理真正全新的问题。

“氛围编码”(vibe coding)——用自然语言描述你想要什么,并让 AI 生成实现——在过去一年中迅速爆发。主要的 AI 实验室已将基于代理的编码定位为旗舰产品。微软在 2025 年把 GitHub Copilot 转变为一个完整的代理化系统,CEO 萨提亚·纳德拉(Satya Nadella)将其描述为类似于转向云的、平台层面的转变。

卡尔帕蒂在 2025 年早些时候对代理持怀疑态度,但在新的模型发布后改变了立场。Anthropic 首席执行官达里奥·阿莫代伊(Dario Amodei)在达沃斯表示:一些 Anthropic 的工程师已经停止亲自编写代码,让模型来处理,而他们则在审阅输出。霍茨在尝试同样的方法后说,他发现每一次都会忍不住去做手动修复。

免责声明:以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。

本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com,本站相关工作人员将会进行核查处理回复

(0)
上一篇 2026年5月26日 上午3:04
下一篇 2026年5月26日 上午3:37

相关推荐

风险提示:理性看待区块链,提高风险意识!