Root NationニュースITニュースメタは、説明に基づいてビデオを作成するための AI を示しました

メタは、説明に基づいてビデオを作成するための AI を示しました

-

人工知能 (AI) のテキストから画像へのジェネレーターは、ここ数か月でニュースの見出しを飾っていますが、研究者はすでに次のフロンティア、つまり AI を利用したテキストからビデオへのジェネレーターに取り組んでいます。 メタ研究者は、そのような新しいジェネレーターを公開しました、と The Verge は報告しています。

Meta の機械学習エンジニアリング チーム 提示 Make-A-Videoと呼ばれる新しいシステム。 この AI モデルにより、ユーザーはシーンの大まかな説明を入力することができ、そのテキストに一致する短いビデオが生成されます。 ビデオは明らかに人工的で、ぼやけたオブジェクトと歪んだアニメーションがありますが、それでも人工知能コンテンツ生成の分野では重要な成果です.

- 広告 ​​-

彼の投稿で Facebook Meta の CEO である Mark Zuckerberg は、この作業を「驚くべき進歩」と表現し、次のように付け加えています。

クリップは 秒以内で、音は含まれていませんが、膨大な範囲の手がかりをカバーしています。 ビデオがコンピューターで生成されたものであることは明らかですが、そのような AI モデルの品質は近い将来急速に向上するでしょう。 ほんの数年で、AI 画像ジェネレーターは、ほとんど理解できない画像を作成するものから、写真のようにリアルなコンテンツを作成するものへと変わりました。 また、主題分野の複雑さがほぼ無限であることを考えると、ビデオの進歩は遅くなる可能性がありますが、シームレスなビデオ生成に対する賞は、多くの組織や企業がプロジェクトに多大なリソースを投資する動機となります.

同社は、システムのデモ版をリリースする予定だと述べていますが、いつ、どのように実装されるかについては明らかにしていません。 このモデルについて説明している論文の中で、Meta の研究者は、Make-A-Video が画像とキャプションのペアとラベルのないビデオ映像でトレーニングされていることを指摘しています。

トレーニング コンテンツは、WebVid-10M と HD-VILA-100M の つのデータセットから派生したもので、これらには何百万ものビデオが含まれており、数十万時間のビデオ映像にまたがっています。 ちなみに、これにはストック映像が含まれます。

研究者は、ぼやけたフレームや散らばったアニメーションに加えて、モデルには多くの技術的制限があることに注目しています。 Make-A-Video は、16×64 ピクセルの解像度で 64 フレームのビデオを出力し、別の AI モデルを使用して 768×768 ピクセルにサイズ変更します。

ウクライナがロシアの侵略者と戦うのを助けることができます。 これを行う最善の方法は、ウクライナ軍に資金を寄付することです。 セーブライフ または公式ページから NBU.

- 広告 ​​-

また興味深い: