Nvidia チームは、オーディオ環境を変えることができるテクノロジーを発表しました。 Fugatto と呼ばれるこのツールは、書面によるリクエストに基づいて音声、音楽、効果音を作成できます。
後画像とビデオ、人工知能のための音のための部屋。 Nvidia の AI 研究者は、ユーザーが文字通り、存在するもの、そしてこれまでに存在したものすべてを作成できるようにする「サウンド用のスイス アーミー ナイフ」を作成したところです。
唯一の制限としての想像力
Nvidia は新しいツールで猛攻撃を行っています。同社が提供した最初の画像では、ユーザーがテキスト コマンドを入力すると、それに応じてサウンド、音楽、効果音が得られるシンプルなインターフェイスが確認できます。

オーディオテクニカの伝説的なサウンドを体験してください。
私たちの意見: 「オーディオテクニカ ATH-M50xBT2 ヘッドフォンの復元力を気に入らないわけにはいきません。日本のメーカーは多くの耳を喜ばせるヘッドフォンを提供します。帽子。"
このツールは古典的で他の人に考えさせるかもしれませんが、私のように, フガットは、存在しないものを生み出す可能性にオリジナリティを見出します。たとえば、次のようなサウンドを作成するように要求することができます。「サックスが叫び、電子音楽に合わせて吠える犬と一緒に吠える」。依頼の結果が気に入らない場合でも、可能性の幅が広がるメリットがあります。
これに加えて、Fugatto はより古典的なツールを提供しますが、同様に効果的です。テキストコマンドに基づいて音楽の抽出を作成したり、オーディオトラック上の楽器を追加または削除したり、声のアクセントや感情を変更したりすることができます。
これほど正確に応答できると、この新しいテクノロジーを制御できなければ、問題を引き起こす危険性があるのは間違いありません。音と声のプロフェッショナルの間で新たな動き。
Cookie やその他のトラッカーを受け入れていないため、このコンテンツはブロックされています。このコンテンツは YouTube によって提供されています。
これを表示するには、YouTube によるお客様のデータの使用を受け入れる必要があります。この使用は、コンテンツの表示とソーシャル メディアでの共有を可能にし、Humanoid とその製品の開発と改善を促進する目的で使用される可能性があります。パートナー、あなたのプロフィールとアクティビティに基づいてパーソナライズされた広告を表示し、パーソナライズされた広告プロファイルを定義し、このサイト上の広告とコンテンツのパフォーマンスを測定し、このサイトの視聴者を測定します(もっと詳しく知る)
「すべてを受け入れる」をクリックすると、Humanoid とそのパートナー。
あなたはいつでも同意を撤回するオプションを保持します。詳細については、ぜひお読みください。クッキーポリシー。
Nvidia は、このツールを設計するにあたり、音声モデリングからオーディオ ボコーディングに至るまでの領域における自社チームの以前の研究に基づいていることを示しました。
アルス テクニカNvidia が少なくとも 50,000 時間のオーディオを表す一連のオープン ソース オーディオ コレクションに取り組んでいることを指定します。そこで、Nvidia は 25 億のパラメーターを備えたモデルを構築することができ、Fugatto は可能な限り最適なオプションを選択できるようになりました。モデルをさらに改良するために、Nvidia はインド、ブラジル、中国、ヨルダン、韓国の研究者グループで自社を囲んでいると述べています。
現時点では、Nvidia はこのツールのリリース日を発表していませんが、オーディオ愛好家はこのツールを詳しく調べることができます。ラのドキュメントFugatto による。Github で入手できます。