人工智能的发展如今取决于能够把握物理现实的“世界模型”。

币搜网报道:

机器人和多模态人工智能仍然无法理解物理世界,一位著名研究人员表示,这一缺陷是目前该领域最大的障碍。

被广泛认为是现代计算机视觉先驱的斯坦福大学计算机科学家李飞飞表示,人工智能与物理现实之间的差距已成为该技术最紧迫的问题,并认为弥合这一差距需要围绕空间推理而不是仅仅依靠语言来构建系统。

李在一份声明中表示,人工智能正迅速接近基于文本学习的极限,而未来的发展最终将取决于“世界模型”。周一发布。

“解锁空间智能的核心在于开发世界模型——一种新型的生成式人工智能,它必须应对一系列与以往截然不同的挑战。”李关于 X。“这些模型必须生成空间一致的世界,这些世界必须遵守物理定律,处理从图像到动作的多模态输入,并预测这些世界如何随时间演变或与之互动。”

这些模型到底是什么?

“可以追溯到20世纪40年代初,当苏格兰哲学家和心理学家开展认知科学研究.

在 David Ha 和 Jürgen Schmidhuber 于 2018 年发表论文之后,这一理念在现代人工智能领域再次出现。结果表明,神经网络可以学习环境的紧凑内部模型,并将其用作规划和控制的模拟器。

李认为世界模型很重要,因为机器人和多模态系统仍然难以进行基于现实的空间推理,导致它们无法判断距离和场景变化,也无法预测基本的物理结果。

李写道:“无论是协助科学家在实验室工作,还是帮助独居老人,机器人作为人类的合作者,都能扩大急需劳动力和提高生产力的群体。” 李认为,真实环境遵循着现有机器无法捕捉的规则。

从重力塑造运动到材料影响光线,解决这个问题需要能够存储空间记忆并在二维以上维度对场景进行建模的系统。

9月份,李健熙的公司World Labs发布了测试版。早期世界模型,可根据文本或图像提示生成可探索的三维环境。

该公司声称,用户可以在这些世界中自由漫步,不受时间限制或场景漂移的影响,环境也保持一致,不会变形或崩塌。

李写道:“Marble 只是我们构建真正具有空间智能的世界模型的第一步。随着进展的加速,研究人员、工程师、用户和商业领袖都开始意识到它蕴藏的巨大潜力。下一代世界模型将使机器在空间智能方面达到一个全新的水平——这一成就将解锁当今人工智能系统仍然严重缺乏的关键能力。”

李表示,世界模型的应用案例包括支持一系列应用程序,因为它们使人工智能能够从内部理解环境的行为方式。

创作者可以利用它们实时探索场景,机器人可以依靠它们更安全地导航和处理物体,科学和医疗保健领域的研究人员可以运行空间模拟或改进成像和实验室自动化。

李将空间智能研究与早期生物学研究联系起来,指出人类在发展出语言之前很久就学会了感知和行动。

她写道:“早在文字出现之前,人类就讲述故事——把故事画在洞穴壁画上,代代相传,并基于共同的叙事建立起整个文化。故事是我们理解世界、跨越时空连接彼此、探索人性意义的方式,而最重要的是,它让我们在内心深处找到生命的意义和爱。”

李表示,人工智能需要同样的物理基础才能在现实世界中发挥作用,并强调人工智能的角色应该是辅助人类,而不是取代人类。然而,真正的进步取决于能够理解世界运行规律而非仅仅描述世界的模型。

李说:“人工智能的下一个前沿领域是空间智能,这项技术将把视觉转化为推理,把感知转化为行动,把想象转化为创造。”

免责声明:以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。

本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com,本站相关工作人员将会进行核查处理回复

(0)
上一篇 2025年11月11日 上午7:55
下一篇 2025年11月11日 上午7:55

相关推荐

风险提示:理性看待区块链,提高风险意识!