谷歌DeepMind的新型人工智能代理能够像人类一样学习、适应和玩游戏

币搜网报道:

Google DeepMind 推出周四——一个新的该公司声称,SIMA 2 在虚拟世界中扮演着“伙伴”的角色。随着 SIMA 2 的发布,DeepMind 的目标是超越简单的屏幕操作,迈向能够规划、解释自身并从经验中学习的人工智能。

该公司在其网站上表示:“这是朝着通用人工智能 (AGI) 方向迈出的重要一步,对机器人技术和人工智能具身化技术的未来具有重要意义。”

SIMA(可扩展指导多世界智能体)的第一个版本于2024年3月发布,它通过观看屏幕并使用虚拟键盘和鼠标控制,学习了数百种基本技能。谷歌表示,新版SIMA更进一步,让AI能够独立思考。

“SIMA 2 是我们目前功能最强大的虚拟 3D 世界人工智能代理,”谷歌 DeepMind在 X 上。“由 双子座 提供技术支持,它不仅能够遵循基本指令,还能在交互式环境中思考、理解和采取行动——这意味着你可以通过文本、语音甚至图像与它对话。”

通过使用谷歌表示,人工智能模型 SIMA 可以解读高层目标,阐述其打算采取的步骤,并在游戏中进行协作,其推理水平是原始系统无法达到的。

DeepMind 报告称,SIMA 2 在虚拟环境中具有更强的泛化能力,并且能够完成更长、更复杂的任务,包括逻辑提示、在屏幕上绘制草图和表情符号。

“由于这项能力,SIMA 2 在各种任务上的表现都明显更接近人类玩家,”谷歌写道,并指出 SIMA 2 的任务完成率为 65%,而 SIMA 1 的任务完成率为 31%。

该系统还能解读指令,并在由……生成的全新3D世界中采取行动。SIMA 2 是 DeepMind 去年发布的另一个项目,它能够根据单个图像或文本提示创建交互式环境。SIMA 2 在测试前不久才首次接触到这些环境,但它却能够自行定位、理解目标并采取有意义的行动。

谷歌写道:“SIMA 2 现在能够更好地执行详细指令,即使是在它从未见过的世界中也是如此。它可以将一个游戏中学习到的概念(例如‘采矿’)应用到另一个游戏中的‘采集’——将相似任务之间的联系联系起来。”

研究人员表示,在学习了人类的演示后,该智能体转而进行自主游戏,利用试错法和Gemini生成的反馈来创造新的体验。其中包括一个训练循环,其中 SIMA 2 生成任务,尝试完成这些任务,然后将自己的轨迹数据反馈到模型的下一个版本中。

虽然谷歌称赞 SIMA 2 是人工智能向前迈出的一步,但该研究也指出了一些仍需解决的差距,包括难以处理非常长的多步骤任务、在有限的内存窗口内工作以及面临 3D AI 系统常见的视觉解释挑战。

即便如此,DeepMind表示,该平台可以作为技能的试验场,这些技能最终可能会应用于机器人领域。.

“我们的 SIMA 2 研究为机器人应用提供了一条强有力的途径,也为现实世界中的通用人工智能 (AGI) 迈出了又一步,”声明中写道。

免责声明:以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。

本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com,本站相关工作人员将会进行核查处理回复

(0)
上一篇 2025年11月14日 上午8:55
下一篇 2025年11月14日 上午8:55

相关推荐

风险提示:理性看待区块链,提高风险意识!