Phenaki 是一个展示通过文本提示生成视频的模型的网站。该网站展示了使用该模型生成的视频示例,如泳在海洋中的泰迪熊和在火星上遛狗的宇航员。该网站还提供了一个交互式示例,用户可以选择一组上下文词汇来创建一个宇航员的视频。Phenaki 使用的模型可以生成几分钟长的视频,而且这些视频在时间上是可变化的。该网站解释说,从文本提示生成视频是有挑战性的,因为需要大量的计算成本、数量有限的高质量文本-视频数据以及视频的长度可变。为了解决这些问题,Phenaki 引入了一种新的因果模型来学习视频表示,它将视频压缩为离散符号的小表示形式。该网站还提供了一份详细描述该模型的论文链接。总的来说,Phenaki 展示了一种通过文本提示生成视频的模型的能力。
数据统计
相关导航
暂无评论...