Meta は、入力した説明に基づいて短いビデオを作成できる人工知能システムである Make-A-Video を発表しました。 DALL-E と多くの AI が画像を作成するとき、Meta はビデオ上に自身を配置します。
数か月間、このプログラムは、人工知能 FROM-E 2ソーシャルネットワークで大きな成功を収めています。ユーザーが指定したテキストによる説明を使用して画像を自動的に作成できます。 AI プログラムはこれだけではありませんが、メタは、メタ AI 部門とともにビデオで自社を位置づけることでさらに前進することにしました。同社は Make-A-Video により、将来的には誰でも利用できるようにしたいと考えています。 Meta は透明性を目指しており、研究文書を公開します。
テキストからビデオを作成する
Make-A-Video はゼロから開始するのではなく、テキストからビデオを生成するためにテキストからの画像生成テクノロジに依存します。の上プロジェクトページ、「?」ということを学びます。システムは説明付きの画像を使用して、世界がどのように見えるか、そしてそれがどのように説明されることが多いかを知ることができます。?»。
次に、このシステムの背後にある人工知能がビデオを使用して、物体や生物の動きを分析します。 Meta 氏によると、ビデオを作成するには数語または数行のテキストで十分だそうです。超現実的、現実的、または様式化されたものであっても、プロジェクトは実行された実験のいくつかの GIF を公開しました。
Make-A-Video では、1 つまたは 2 つの画像から画像をアニメーション化することもできます。最後に、別のデモンストレーションでは、既存のビデオのバリエーションを作成できることを示しています。現時点では、解像度と品質がかなり低い GIF のみが表示されていますが、特定の例では結果が非常に印象的であることは明らかです。
Meta の Make-A-Video を使用できるようになりますか?
一般に公開されている他の人工知能プログラムと同様に、Meta は自らを保護し、次のことに取り組んでいると述べています。この最先端のビデオ技術を安全に使用できるようにする?»。 Make-A-Video には「?」のフィルターが装備されています。有害なコンテンツが生成されるリスクを軽減する?»また、悪用の可能性を避けるために、生成されたビデオに透かしを付加します。
Meta は Make-A-Video を一般に公開したいと述べているが、公開可能かどうかは発表していない。私たちが知っているのは、メタが次のことを計画しているということだけです。デモ実験を公開する?»。最初は、登録とクレジット システムを備えた DALL-E 2 のようなモデルを想像できます。しかし、より長い時間が経てば、Make-A-Video はメタ アプリケーションに直接統合される可能性があります (フェイスブック、インスタグラム、ワッツアップ、など)。説明から GIF を作成するように関数に依頼できます。