"); //-->
近期,AI 技术在游戏开发领域取得了令人瞩目的进展。
继谷歌的 GameNGen AI 模型展示了使用图像扩散技术生成可玩版《毁灭战士》(Doom)的能力后,一个新研究项目又将目光投向了另一款经典游戏——任天堂的《超级马里奥兄弟》(Super Mario Bros)。
这个项目展示了 AI 如何通过视频生成技术来模拟这款 1985 年发行的经典游戏,为未来的游戏开发开辟了新的可能性。
公开资料显示,MarioVGG 项目主要由 GitHub 用户欧尼·周(Ernie Chew)和布瑞恩·林(Brian Lim)管理,其相关论文由加密货币相关的 AI 公司 Virtuals Protocol 发表。
该项目主要利用机器学习技术,通过研究游戏视频和输入数据,来推断游戏的物理规则和游戏动态。
研究人员使用了一个包含 280 个游戏关卡的公开数据集,游戏画面超过 737000 帧。
为了简化游戏情况,他们只关注两种潜在输入:向右跑和向右跑并跳跃。经过约 48 小时的训练(使用单块 RTX 4090 显卡),模型就能够从静态的初始游戏图像和文本输入生成新的视频帧序列。
MarioVGG 采用了文本到视频生成的方法来重现《超级马里奥兄弟》。模型通过学习游戏画面,能够根据玩家的文本输入(“跑”或“跳”)生成相应的游戏画面序列。
具体来说,模型只需要接收一个初始的游戏画面帧和所需动作的文本描述(例如“跳跃”),然后学习生成一系列可视化描述所需动作的帧。
为了提高效率,研究人员将输出帧的分辨率从原始 NES(注:Nintendo Entertainment System,是任天堂生产的第一代家用游戏机)的 256×240 降低到了 64×48 或 128×96。
此外,他们将 35 帧的视频时间压缩为仅 7 个生成帧,这些帧以均匀的间隔分布,从而创造出比实际游戏画质更粗糙的游戏视频。
尽管采用了这些方法,MarioVGG 模型仍然面临着接近实时视频生成的挑战。研究人员只用了一张 RTX 4090 显卡,需要大约 6 秒钟才能生成 6 帧视频序列,视频长度仅仅超过半秒,这还是在极其有限的帧率下。
研究人员承认这“对于交互式视频游戏来说既不实用也不友好”,但他们希望未来的优化可以改善这一速率。
尽管存在上述限制,MarioVGG 仍然展现出了一些令人印象深刻的特性。
首先,模型能够纯粹从训练数据中学习游戏的物理规则,包括马里奥从悬崖边跌落时的重力效果,以及在遇到障碍物时停止前进。
其次,虽然 MarioVGG 主要关注模拟马里奥的动作,但它也能有效地为马里奥生成新的障碍物,这些障碍物“与游戏的图形语言相一致”。
此外,MarioVGG 能够生成独特的马里奥关卡,只有第一帧输入来自真实游戏状态。
然而,MarioVGG 也面临着一些显著的挑战,比如研究人员观察到,输入动作文本并不总是被模型所遵守。
有时还会出现明显的视觉问题,如马里奥有时会穿过障碍物和敌人、颜色闪烁、在帧之间缩小/增大,或在多个帧中完全消失后又重新出现。
模型并不懂得游戏逻辑,即使在马里奥死掉之后,它还是会继续渲染视频帧,而不是回到最后的检查点。此外,关卡和物体的生成也不可控,只能通过程序化生成。
MarioVGG 项目为未来游戏开发开辟了新的可能性,展示了 AI 如何通过学习视频数据来理解和重现复杂的游戏机制。
研究人员希望这代表着“产生和展示可靠和可控的视频游戏生成器”的第一步,甚至可能在未来“完全使用视频生成模型取代游戏开发和游戏引擎”。
然而,要实现这一愿景,还需要解决诸如实时性能、画面质量、游戏逻辑一致性等一系列挑战。例如,如何在生成的游戏中决定终止状态,这仍然是一个开放的研究问题。
尽管如此,考虑到 MarioVGG 项目仅使用了相对较小的训练数据集和单个消费级图形处理器(GPU,Graphics Processing Unit),其取得的成果已经相当令人印象深刻。
Virtual Protocols 公司在推特上乐观地表示:“无限交互世界的时代已经到来。”
总的来说,虽然视频生成制作游戏的方法还无法完全替代传统的游戏开发方法,但它为游戏产业注入了新的活力,让我们得以一窥 AI 驱动的游戏未来。
这些新项目为游戏设计和开发提供了新的思路,展示了 AI 如何通过学习视频数据来理解和重现复杂的游戏机制。
未来,我们可能会看到,随着技术的发展有望出现更多 AI 辅助的游戏开发工具,甚至是完全由 AI 生成的游戏世界。
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。