谷歌DeepMind的新型人工智能代理能够像人类一样学习、适应和玩游戏

2025年11月14日上午8:55 • 专题 • 阅读 6478

Google DeepMind 推出周四——一个新的该公司声称，SIMA 2 在虚拟世界中扮演着“伙伴”的角色。随着 SIMA 2 的发布，DeepMind 的目标是超越简单的屏幕操作，迈向能够规划、解释自身并从经验中学习的人工智能。

该公司在其网站上表示：“这是朝着通用人工智能 (AGI) 方向迈出的重要一步，对机器人技术和人工智能具身化技术的未来具有重要意义。”

SIMA（可扩展指导多世界智能体）的第一个版本于2024年3月发布，它通过观看屏幕并使用虚拟键盘和鼠标控制，学习了数百种基本技能。谷歌表示，新版SIMA更进一步，让AI能够独立思考。

“SIMA 2 是我们目前功能最强大的虚拟 3D 世界人工智能代理，”谷歌 DeepMind在 X 上。“由双子座提供技术支持，它不仅能够遵循基本指令，还能在交互式环境中思考、理解和采取行动——这意味着你可以通过文本、语音甚至图像与它对话。”

通过使用谷歌表示，人工智能模型 SIMA 可以解读高层目标，阐述其打算采取的步骤，并在游戏中进行协作，其推理水平是原始系统无法达到的。

DeepMind 报告称，SIMA 2 在虚拟环境中具有更强的泛化能力，并且能够完成更长、更复杂的任务，包括逻辑提示、在屏幕上绘制草图和表情符号。

“由于这项能力，SIMA 2 在各种任务上的表现都明显更接近人类玩家，”谷歌写道，并指出 SIMA 2 的任务完成率为 65%，而 SIMA 1 的任务完成率为 31%。

该系统还能解读指令，并在由……生成的全新3D世界中采取行动。SIMA 2 是 DeepMind 去年发布的另一个项目，它能够根据单个图像或文本提示创建交互式环境。SIMA 2 在测试前不久才首次接触到这些环境，但它却能够自行定位、理解目标并采取有意义的行动。

谷歌写道：“SIMA 2 现在能够更好地执行详细指令，即使是在它从未见过的世界中也是如此。它可以将一个游戏中学习到的概念（例如‘采矿’）应用到另一个游戏中的‘采集’——将相似任务之间的联系联系起来。”

研究人员表示，在学习了人类的演示后，该智能体转而进行自主游戏，利用试错法和Gemini生成的反馈来创造新的体验。其中包括一个训练循环，其中 SIMA 2 生成任务，尝试完成这些任务，然后将自己的轨迹数据反馈到模型的下一个版本中。

虽然谷歌称赞 SIMA 2 是人工智能向前迈出的一步，但该研究也指出了一些仍需解决的差距，包括难以处理非常长的多步骤任务、在有限的内存窗口内工作以及面临 3D AI 系统常见的视觉解释挑战。

即便如此，DeepMind表示，该平台可以作为技能的试验场，这些技能最终可能会应用于机器人领域。.

“我们的 SIMA 2 研究为机器人应用提供了一条强有力的途径，也为现实世界中的通用人工智能 (AGI) 迈出了又一步，”声明中写道。

免责声明：以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。

本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com，本站相关工作人员将会进行核查处理回复