在视频中,人群在挤满的夏季音乐节上喧闹。当节拍从扬声器传出时,表演者终于走上舞台:是小丑。小丑穿着他的红色西装,绿色头发和标志性的脸部彩绘,挥舞着拳头,在台上跳舞,沿着跑道跳下来,以便更接近他的一群粉丝。当开始说唱时,小丑屈膝并将自己推离地面,上下跳跃,然后单脚进行360度旋转。看起来轻松自如,但如果你尝试这个动作,你会摔个跟斗。小丑从未如此酷。
然后是另一个视频,NBA全明星乔尔·恩比德从后台走出来,向观众致意,然后完成同样的舞蹈动作。然后,是《兴趣的疯狂》明星拉里·大卫。但在这些场景中,每个表演者的身体都有些不对劲 - 无论是小丑、乔尔·恩比德还是拉里·大卫,表演者的身体摇摇晃晃,而面部表情从不改变。
当然,这一切都是由人工智能生成的,感谢一个名为Viggle的公司。
原始视频显示的是说唱歌手 Lil Yachty 在2021年夏季音乐节上登台 - 根据一个拥有超过650万次观看的YouTube视频的标题,这个入场是“有史以来最困难的登场”。这在四月变成了流行的模因格式,人们将自己喜欢的名人 - 或者自己喜欢的恶棍,比如萨姆·班克曼-弗里德 - 插入到Lil Yachty登场的视频中。
文本到视频的AI工具表现得令人惊讶地出色,但你不能输入“2021夏季音乐节上的Sam Bankman-Fried扮成Lil Yachty”并期望Sora准确理解你的意思。 Viggle的工作方式不同。
在Viggle的Discord服务器上,用户上传一个人做某种动作的视频 - 通常是TikTok舞蹈 - 和一个人的照片。然后,Viggle会创建一个视频,其中那个人模仿了视频中的动作。显而易见,这些视频不是真实的,尽管它们仍然很有趣。但在Lil Yachty的模因走红之后,Viggle变得火爆起来,炒作从未消退。
“我们专注于构建我们所称为的可控视频生成模型,” Viggle创始人杜航告诉TechCrunch。“当我们生成内容时,我们希望精确控制角色的移动方式,或者场景的外观。但当前的工具只专注于文本到视频的一侧,其中文本本身不足以描述所有的视觉细微之处。”
据杜介绍,Viggle有两种主要类型的用户 - 一些人在制作模因,而另一些人则将产品用作游戏设计和视觉特效制作过程中的工具。
“例如,一个动画工程团队可以将一些概念设计,迅速转变成简略但快速的动画资产,” 杜说。“整个目的是看看它们在最终计划的简略草图中的样子和感觉。对他们来说,通常需要花费几天甚至几周的时间手动设置,但利用Viggle,基本上可以立即自动完成。这节省了大量单调重复的建模工作。”
今年三月,Viggle的Discord有几千名成员。到五月中旬,成员数量已经达到180万,随着六月即将到来,Viggle的服务器已经增长到300万人以上。这使其比《VALORANT》和《原神》的服务器加起来还要大。
Viggle的增长表明没有放缓的迹象,只是高需求导致了等待时间对于急性用户来说有点太长。但由于Viggle非常以Discord为中心,因此Discord的开发团队直接与Viggle合作,引导这家成立两年的初创公司度过了快速增长的阶段。
幸运的是对于Viggle来说,Discord之前已经经历过类似情况。MidJourney也在Discord上运营,其服务器上有2030万成员,成为该平台上最大的单一社区。总体而言,Discord每月有大约2亿名用户。
“没有人会准备迎接那种规模的增长,所以在那种病毒传播阶段,我们开始与他们合作,因为他们还没有准备好,” Discord的产品副总裁本·肖肯告诉TechCrunch。“我们必须做好准备,因为目前发送的绝大部分消息都是关于Viggle和MidJourney的,而在Discord上的大量消费和使用实际上都是生成式人工智能。”
对于像Viggle和MidJourney这样的初创公司来说,将他们的应用程序建在Discord上意味着他们不必为用户构建整个平台 - 相反,他们托管在一个已经拥有科技精明观众以及内置内容审核工具的平台上。 对于只有15名员工的Viggle来说,Discord的支持至关重要。
“我们可以专注于构建作为后端服务的模型,而Discord可以利用他们的前端基础设施,基本上可以让我们更快地迭代,”杜说。
在Viggle之前,杜曾是3D工具巨头Autodesk的人工智能研究员。他还为Facebook、Nvidia和Google等公司进行过研究。
对于Discord来说,作为AI初创公司的意外SaaS公司可能会带来一些成本。一方面,这些应用程序将Discord引入新的受众群体,并且对用户指标可能是有利的。但在技术方面,承载如此多的视频可能会很困难和昂贵,特别是当平台上的其他用户正在直播视频游戏、视频聊天和语音通话时。然而,如果没有像Discord这样的平台,这些初创公司可能无法以同样的速度增长。
“对于任何类型的公司来说要扩张都不容易,但Discord是建立在那种规模上的,我们能够帮助他们很好地吸收这一点,”肖肯说。
尽管这些公司可以采用Discord自己的内容准则和使用其内容审核应用程序,但确保300万人的行为始终是一项挑战。即使那些 Lil Yachty 的入场模因在技术上违反了 Viggle的规则,鼓励用户避免未经许可生成真实人物 - 包括名人 - 的形象。
目前,Viggle的救命稻草可能是他们的输出尚未百分之百真实。这项技术确实令人印象深刻,但我们了解更多。那个有点单薄的小丑动画肯定是不真实的,但确实很有趣。