达人秀上的人工智能:超现实的头像推动初创公司进入“美国达人”总决赛

在美国达人秀(目前是美国第二受欢迎的黄金时段电视节目)的结局中,有超过 600 万双眼睛注视着实时 AI 化身技术。

Metaphysic 是 11个角逐 100 万美元的演员之一,也是第一个进入AGT决赛的 AI 表演。

被“臭名昭著”的强硬评委西蒙考威尔称为“该系列迄今为止最好的表演”和“我们在这个节目中见过的最独特的东西之一”,该团队的表演包括由舞台上的歌手化身实时的逼真的人工智能动画演示。

在 Metaphysic 的半决赛表演中,三位歌手 — Daniel Emmet、Patrick Dailey 和 John Riesen — 将他们的声音传给了 Cowell 的 AI 化身、裁判 Howie Mandel 和主持人 Terry Crews,表演了歌剧作品“Nessun Dorma”。该团队计划“带回有史以来最伟大的摇滚偶像之一”。

“形而上学在美国达人秀上的历史创造让我们能够在世界上最受关注的舞台之一上展示人工智能的应用,”这家初创公司的联合创始人兼首席执行官汤姆格雷厄姆说,他与合作伙伴一起出现在节目中。-创始人克里斯·乌梅。

(从左到右):Daniel Emmet、Tom Graham 和 Chris Umé 介绍了 Metaphysic 的“美国达人秀”试镜。

“虽然近年来人们对合成媒体的总体认识有所提高,但 Metaphysic 的AGT表演为这项技术如何影响从互联网到娱乐再到教育等一切事物的未来提供了一个前沿席位,”他说。

在提高 AI 意识的同时捕捉想象力

总部位于伦敦的 Metaphysic 成立于 2021 年,正在开发人工智能技术,以帮助创作者构建超现实的虚拟身份和合成内容,超越所谓的恐怖谷。

该团队最初在去年为 DeepTomCruise 病毒式传播,这是一个 TikTok 频道,其中包含演员迈尔斯·费舍尔 (Miles Fisher) 动画汤姆·克鲁斯 (Tom Cruise) 的 AI 化身的视频。格雷厄姆说,这些帖子获得了大约 1 亿次浏览,“让许多人第一次了解了合成媒体令人难以置信的功能”。

通过将其 AI 化身带到AGT舞台,该公司已经能够接触到数百万的观众——在舞台上使用先进的摄像装置和表演者展示该技术是如何实时和实时工作的。

幕后的 AI、GPU 加速

Metaphysic 的 AI avatar 软件管道包括由NVIDIA Research开发的流行 StyleGAN模型的变体。该团队使用 TensorFlow 深度学习框架,依靠 CUDA 软件来加速其在  GPU 上的工作。

“如果没有 NVIDIA 硬件和软件库,我们将无法将这些超现实结果提升到我们所拥有的水平,”Metaphysic 产品创新总监 Jo Plaete 说。“我们的 NVIDIA 硬件平台提供的计算使我们能够以能够快速迭代它们的速度训练更大、更复杂的模型,从而产生最完美的调整结果。”

对于现场表演期间的 AI 模型开发和推理,Metaphysic 使用NVIDIA DGX系统以及其他配备包括 NVIDIA A100 Tensor Core GPU 的工作站和数据中心配置。

“出色的硬件支持帮助我们在需要时快速解决问题,”Plaete 说。“并且接触研究和工程团队有助于我们更深入地了解这些工具以及我们如何在我们的管道中利用它们。”

AGT 之后, Metaphysic 计划在娱乐行业开展多项合作。该公司还推出了一个面向消费者的平台,名为Everyanyone,使用户能够创建自己的超现实 AI 化身。



ISHA SALIAN