Microsoftによると、OpenAIはAIの主要な新バージョンであるGPT-4をまもなく発表するという。新しい機能の 1 つは、ビデオを処理できることです。
2020 年に OpenAI によって GPT-3 が発表されて以来、この言語モデルはテクノロジー業界で大きな成功を収め、人工知能を巨人が征服すべき新しい領域として確立しました。
推進力となる GPT-3.5 を通過した後チャットGPT, OpenAIは新世代GPT-4モデルのベールを解く準備ができているでしょう。についてなので、ソースはかなり信頼できます。マイクロソフト、スタートアップの歴史的なパートナー。
ビデオとオーディオに重点を置く
具体的には、Microsoft Germany の幹部である Andreas Braun 氏が次のように述べています。来週は、まったく異なる可能性を備えたマルチモーダル モデル (ビデオなど) を提供する GPT-4 を紹介します。」。 Microsoft のアメリカ支社も OpenAI もこれらのコメントを確認していないことに注意してください。 Microsoft の国内支社が言いすぎたり、完全に間違っていたりしたことは、過去にもすでに起こっています。これが公式声明であることは事実であり、無視することはできません。
現在、GPT-3 の主な制限の 1 つは、GPT-3 がテキストでのみ動作することです。これが、OpenAI と Microsoft が次のようなライティング アシスタントを作成した理由です。Bing ou ChatGPT。
Microsoftは来週公開される予定のこの新機能については詳細には触れなかった。現在、Midjourney や Dall-E が画像を生成できるように、ビデオを生成できるようになると理解しています。
しかし、マルチモーダル モデルで最も興味深いのは、AI に対してさまざまな種類のコマンドを混合できることです。 ChatGPT の将来のバージョンでは、画像やビデオを分析して質問に答えることができるようになることが想像できます。たとえば、次の質問をしてください。「この YouTube 動画の何分で話者が結論に入りますか?」 » 問題のビデオへのリンクを提供します。また、長い動画の概要をリクエストできるようにすることも考えています。
Microsoft は最終的に GPT-4 の機能を自社の Bing 検索エンジンに統合する必要があります。ただし、現時点ではこれに関して何も発表されていません。したがって、忍耐強くなければなりません。
愛好家のコミュニティに参加してみませんか?私たちの不和ようこそ、ここはテクノロジーに対する相互扶助と情熱の場所です。