谷歌DeepMind发布基础世界模型Genie

谷歌DeepMind推出了一个名为Genie的基础世界模型,它能够从图像、照片甚至草图中生成动作可控的虚拟世界。Genie是DeepMind研发的一种先进的AI模型,其核心能力在于通过从未标记的互联网视频数据集中学习,从而理解可控元素和一致的动作,无需依赖于标记数据。这意味着Genie能够在完全没有人类指导的情况下“自学成才”,了解在虚拟环境中哪些部分是可操作的,并能推断出潜在的动作。这些动作不仅局限于虚拟世界,还可以迁移到真实世界的机器人控制系统中。

2024-03-08 768 0 谷歌 DeepMind 基础世界模型 Genie

顶部