Meta 创造了一种基于人工智能的新生成器

人工智能 (AI) 文本到图像生成器最近几个月一直是头条新闻，但研究人员已经转向下一个前沿领域：人工智能驱动的文本到视频生成器。据 The Verge 报道，Meta 研究人员公开展示了这种新型发电机。

Meta 的机器学习工程团队提交一个名为 Make-A-Video 的新系统。这个 AI 模型允许用户输入场景的粗略描述，并生成与其文本相匹配的短视频。这些视频显然是人造的，有模糊的物体和扭曲的动画，但仍然是人工智能内容生成领域的一项重大成就。

在他的帖子中 Facebook Meta 首席执行官马克扎克伯格将这项工作描述为“惊人的进步”，并补充说：“创建视频比照片困难得多，因为除了正确生成每个像素之外，系统还必须预测它们将如何随时间变化。”

制作视频：AI

这些片段持续时间不超过五秒钟，没有声音，但涵盖了大量线索。虽然很明显该视频是计算机生成的，但此类 AI 模型的质量将在不久的将来迅速提高。在短短几年内，AI 图像生成器已经从创建几乎无法理解的图片变成了逼真的内容。考虑到该主题领域几乎无限复杂，视频方面的进展可能会更慢，但无缝视频生成奖项将激励许多组织和公司在该项目中投入大量资源。

该公司表示计划发布该系统的演示版，但未说明何时或如何实施。在一篇描述该模型的论文中，Meta 研究人员指出，Make-A-Video 是在图像-字幕对以及未标记的视频片段上进行训练的。

训练内容来源于 WebVid-10M 和 HD-VILA-100M 两个数据集，它们总共包含数百万个视频，跨越数十万小时的视频片段。顺便说一句，这包括股票录像。

研究人员指出，除了模糊的帧和散乱的动画之外，该模型还有许多技术限制。 Make-A-Video 以 16×64 像素的分辨率输出 64 帧视频，然后使用单独的 AI 模型将其调整为 768×768 像素。

你可以帮助乌克兰对抗俄罗斯侵略者。最好的方法是通过以下方式向乌克兰武装部队捐款拯救生命或通过官方页面 NBU.

也很有趣：

Dzherelo边缘

注册

0 评论

嵌入式评论

查看所有评论

其他文章

Meta 展示了根据描述创建视频的 AI

最近的评论