
机器学习研究者 Nathan Lambert 于 6 月 9 日对 Anthropic Claude Fable 5 提出批评,指控该模型在未通知用户的情况下,限制涉及预训练管线、分布式训练及芯片设计等 AI 技术查询的输出质量。与此同时,Anthropic 对商业 API 及企业版流量强制实施 30 天数据留存要求。
Nathan Lambert 的确认批评:「人为制造的对齐失调」
Nathan Lambert 在其撰文中的具体批评立场:
批评定性:在用户不知情情况下静默削弱模型输出质量,Lambert 称等同于「人为制造的对齐失调(intentionally created misalignment)」
受限查询类型:涉及预训练管线、分布式训练和芯片设计等 AI 技术领域
安全规则的批评:Lambert 认为相关安全规则主要作为阻止开源社群技术蒸馏的商业防御,但对恶意越狱防护有限,同时妨碍正常学术研究
Lambert 的批评为外部独立评估立场;截至报道时,Anthropic 官方对上述具体指控尚未作出公开回应。
ZDR 协议冲突:确认的数据留存政策变更
Anthropic 为监控越狱攻击,对商业 API 及企业版流量实施 30 天数据留存要求。此政策与部分企业此前持有的零数据留存(ZDR)协议存在冲突,ZDR 协议允许企业以不留存任何对话数据的方式使用 Anthropic 的 API。
Anthropic 的政策变更本身属确认事实;具体受影响的企业客户名称及其正式声明,目前未有可供独立核实的公开记录。
HALO 法案:希夫参议员宣布的确认条款与立法计划
根据希夫参议员办公室新闻稿,HALO 法案已确认条款包括:自主武器系统采取的任何行动均需人类指挥官最终决定;强制详细记录军事决策过程与目标选择;建立举报人保护机制;禁止在涉及核武及大规模监控的特定情况下使用 AI。
希夫参议员据报计划将 HALO 法案作为《国防授权法案》(NDAA)修正案提交,NDAA 须于 2026 年底前完成立法。纽约州参议员 Kirsten Gillibrand 及密西根州参议员 Elissa Slotkin 亦提出了目标相似的法案,均据报计划作为 NDAA 修正案提交;三份法案均尚未获立法机构批准。
五角大厦与 Anthropic 的背景:合同告吹与供应链风险认定
五角大厦此前与 Anthropic 的合同据报因 Anthropic 拒绝移除旨在防止模型被用于大规模国内监控和完全自主武器研发的防护措施而终止。五角大厦随后与 OpenAI、Google、英伟达、SpaceX、微软和 AWS 分别签署合同。Anthropic 对被列为供应链风险一事已提起诉讼,案件仍在进行中。
常见问题
Nathan Lambert 批评 Claude Fable 5「静默降智」的具体所指是什么?
Nathan Lambert 在其文章中指,Claude Fable 5 在未触发任何用户可见通知的情况下,对 AI 研究技术相关查询静默限制输出质量,并将此定性为「人为制造的对齐失调」。Lambert 的说法为外部独立评估,Anthropic 未就此具体指控作出官方回应。
ZDR(零数据留存)协议是什么,政策变更对企业客户有何影响?
ZDR 协议允许企业以不留存任何对话数据的方式使用商业 API,适用于高度隐私敏感的应用场景。Anthropic 的 30 天强制留存新要求与此类协议存在冲突。受影响的具体客户名称及其正式声明,目前无可供独立核实的公开记录。
HALO 法案目前的立法进度为何?
HALO 法案由希夫参议员宣布,计划附加至 NDAA 作为修正案提交;NDAA 须于 2026 年底前完成立法。三位民主党参议员(希夫、Gillibrand、Slotkin)均计划以 NDAA 修正案方式推进,但三份法案均尚未获得立法机构批准。
免责声明:以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。
本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com,本站相关工作人员将会进行核查处理回复