Anthropic 周四宣布,它预计在完成额外的保障措施测试后,“未来几周”扩大其 Claude Mythos AI 模型的访问权限。该公司是在其新 Opus 4.8 模型发布的同时作出上述表态,标志着该公司迄今为止对面向网络安全的该系统将提供更广泛可用性的最明确迹象。自 3 月以来,Anthropic 通过 Project Glasswing 限制了 Mythos 的访问,此前研究人员和政府机构就该模型的自主网络攻击能力发出了警告。该公告发布之际,正值人工智能行业就具备进攻性安全能力的先进系统应如何向客户发布展开更广泛的争论。
当前访问限制
Anthropic 已通过 Project Glasswing(一个为特定科技公司、安全研究人员和政府合作伙伴在受控条件下提供访问权限的项目)限制 Claude Mythos 的分发。该公司最初在 3 月泄露的博客材料中描述 Mythos 为“我们迄今开发过的最强大的 AI 模型”,并将其定位为其 Opus 模型之上的一个层级。Anthropic 表示,该模型“预示了即将到来的一波模型,它们能够以远远超出防御者努力的方式利用漏洞”。该公司没有具体说明在更广泛推出之前还未完成哪些保障措施,或是否所有客户将获得相同的访问等级。就实施细节,Anthropic 未回应置评请求。
已记录的技术能力
英国的 AI Security Institute 发现,Mythos 在测试中自主完成了一个 32 步的模拟企业网络攻击。4 月,Mozilla 报道称,在内部安全评估期间,Mythos 在 Firefox 中识别出了 271 项漏洞。本月早些时候,安全初创公司 Calif 表示,预览版本帮助研究人员开发了一条针对苹果 M5 Mac 芯片的利用链。Anthropic 认为,Mythos 能帮助防御者在攻击者利用漏洞之前识别并修补软件漏洞。安全研究人员和政府机构则警告,相同能力可能会加速网络攻击。
围绕发布策略的行业争论
该模型已成为人工智能行业内部关于先进系统发布的讨论焦点。5 月接受“Core Memory”播客采访时,OpenAI CEO Sam Altman 指责 Anthropic 进行“基于恐惧的营销”,并认为有关网络安全风险的警告可能被用来为限制对强大 AI 系统的访问提供理由。在 Myriad 上——该平台由 Decrypt 的母公司 Dastan 运营——用户截至周四给予 Mythos 在 6 月底前发布 44% 的概率,较当天早些时候的 17.5% 上升。
已确认的下一步
Anthropic 表示,它“在开发这些保障措施方面进展迅速”,并预计“在未来几周内将 Mythos-class 模型带给所有客户”。
FAQ
什么是 Project Glasswing?
Project Glasswing 是 Anthropic 的受限访问项目,在特定条件下为选定的科技公司、安全研究人员和政府合作伙伴提供对 Claude Mythos 模型的受控访问。
Mythos 在测试中识别了哪些漏洞?
Mozilla 报道称,Mythos 在 4 月的内部安全评估中识别出 Firefox 中的 271 项漏洞。英国的 AI Security Institute 记录了该模型自主完成一个 32 步的模拟企业网络攻击。安全初创公司 Calif 表示,预览版本有助于开发一条针对苹果 M5 Mac 芯片的利用链。
Anthropic 首次何时宣布 Mythos?
Claude Mythos 首次在 3 月出现,当时泄露的草稿版 Anthropic 博客材料在网上流出。公司将其描述为“我们迄今开发过的最强大的 AI 模型”,并将其定位为高于其 Opus 模型的新层级。
免责声明:以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。
本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com,本站相关工作人员将会进行核查处理回复