Meta は、AI の新バージョン Llama 3.2 を発表しました。オープンソース、マルチモーダル、スマートフォンで動作可能、音声認識機能を備えたこのツールは、非常に効率的で、何よりもアメリカ企業のすべてのサービスで無料であることが約束されています。
のリリース以来、人工知能について語らないのは困難です。チャットGPT。その証拠に、Meta は年次カンファレンス Meta Connect 2024 でこのテーマに数分間を費やしました。私たちはこのテーマに (オンラインで) 出席するためにわざわざ足を運んだことをうれしく思います。
さらに進むには
LLMとは何ですか? ChatGPT、Google Bard などのエンジンはどのように動作しますか?
2024 年に 3 回目として、Llama はオープンソースのバージョン 3.2 に更新されました。そして、これらは小さな改善ではありません。なぜなら、Meta の AI はついにマルチモーダルになりつつあり、テキストだけでなく画像も扱うことができるからです。特定の写真について質問することもできますが、たとえば写真の修正を依頼することもできます。これは新しいことではありません。グーグルなどOpenAIとりわけ、この種の機能はすでに提供されていますしばらくの間。
ChatGPT と同じように、ジェミニ、ついにラマと音声で会話できるようになり、ラマは有名人の声で応答できるようになります。 Meta は、リール用の自動ダビング ツールも開発しました。インスタグラム、同じ口調を保ちながら、コンテンツ制作者の言葉を直接翻訳するために。
現在利用できる言語が英語とスペイン語の 2 言語のみであるにもかかわらず、Meta Connect 中に行われたデモンストレーションは非常に印象的です。
さらに進むには
YouTube はこの吹き替え AI で言語の壁を突破します
これらすべてにより、コンテンツ作成者はより幅広い視聴者にリーチする機会が得られます。ただし、Llama の新機能は AI Studio ユーザーにも利益をもたらすため、問題が終わったわけではありません。独自の画像でチャットボットを作成できるこのツールをアニメーション化して、実際の仮想アバターを作成できるようになりました。
したがって、レオン マルシャンの AI のダブルとビデオ会話を開始して、水泳やパリ オリンピックについて質問することが可能になると想像できます。繰り返しますが、ステージ上のデモンストレーションは印象的でしたが、コンテンツクリエイターや有名人のエージェントがこのツールをどのように活用するかはまだわかりません。
Llama 3.2 は 4 つのモデルで利用できます。2 つは画像用 (11 億と 900 億のパラメータ)、もう 2 つはテキスト用 (10 億と 30 億のパラメータ) です。この最後の点に関しては、私たちはまだまだです。Llama 3.1 が 4,050 億のパラメータでできることそれには十分な理由があります。これらのライト バージョンは、主にユーザーのスマートフォンやコンピュータ上でローカルに動作するように設計されています。
Llama 3.2 は、さまざまなメタ アプリケーション (ワッツアップ、インスタグラム、フェイスブック、メッセンジャー)…旧大陸を除く。欧州連合人工知能のネジを締めるそしてメタはここで新しいツールをリリースする前に、現地の規制に従う必要がある。