生成式人工智能主要以创建令人震惊的可信文本和静态图像而闻名,这种工具也已开始编辑相当逼真的视频剪辑。包括游戏在内的互动体验可能是下一步的发展方向之一。Google的研究可以让人工智能影响虚拟世界的构建,用人工智能来训练人工智能。
Google DeepMind 最近发布了一款人工智能模型 Genie,它可以利用静态图像制作小型互动游戏。Google表示,这项技术背后的基础可以促进其他应用,比如训练人工智能机器人。
Genie是在大约 20 万小时的公开游戏画面(可能来自Google子公司 YouTube)基础上训练出来的。目前还不清楚使用它的人是否会与这些游戏的创作者发生版权纠纷。
值得注意的是,人工智能不需要文本或动作标签来解释它所看到的内容,它只需通过视频帧来解读哪些元素应作为地形,哪些元素应作为可控制的头像。Genie还能解读图像中的三维深度,从而在游戏中模拟视差滚动。
该工具可以根据绘画、草图、渲染图、照片和其他类型的图像构建小型视频游戏关卡。由于Genie可以处理它以前从未见过的图片,因此它还可以根据人工智能生成的内容构建环境,从而为使用一个人工智能的内容在另一个人工智能中创造新事物开辟了前景。
不过,还有改进的余地。与其他人工智能模型一样,Genie也会产生幻觉。此外,最初的迭代版本只能记忆多达 16 个帧,这严重限制了它在保持一致的情况下构建关卡的大小。该模型 1fps 的运行速度也有很大的改进空间。
为确保准确性,Genie 的初步演示侧重于复制 2D 平台游戏。不过,Google表示,可以训练它创建其他类型的游戏和虚拟内容。
例如,Google表示,Genie 可以帮助更有效地训练某些机器人。使用人工模拟进行的训练只能提供有限的场景,而 Genie 可以构建更广泛的虚拟环境和对象,供机器人学习。
通过进一步开发,Genie 可以将交互式布景变成生成式人工智能的下一个主要领域。目前,视频正成为人们关注的焦点,尤其是 OpenAI 在上个月推出了 Sora,它可以制作逼真的 60 秒 1080p 短片。不出所料,人工智能生成的视频并不完美,但它代表了该技术的重大飞跃。