最新の LLM の威力を誇示するため、Google は Gemini が動作するデモビデオを公開しました。実際には、この AI とのやり取りがビデオ内のやり取りと本当によく似ているかのような印象を与えるように操作されていました。
今年はまだ終わっていないグーグル新しい地図を公開しました人工知能:ジェミニ、彼の最後のLLMGPTを超えることを目指していますOpenAI。これを証明するために Google は数字を挙げましたが、それよりも目立ったのは動画でした。残念ながら、疑惑に直面したものの、同社はビデオが改ざんされたことを認めた。 Google はこれを想定していますが、やや遅ればせながらです。
さらに進むには
LLMとは何ですか? ChatGPT、Gemini などのエンジンはどのように動作しますか?
本物とは思えないジェミニのビデオ
Gemini のプレゼンテーションと並行して、Google はマルチモーダル AI (テキスト、画像、ビデオを与えることができる) の入門ビデオを公開しました。彼女は、LLM の最新バージョンである Gemini Ultra を使用しています。 Google はこれを明示していないため、これがユーザーが間もなくアクセスできるバージョンであると人々に信じ込ませることができます。
Cookie やその他のトラッカーを受け入れていないため、このコンテンツはブロックされています。このコンテンツは YouTube によって提供されています。
これを表示するには、YouTube によるお客様のデータの使用を受け入れる必要があります。この使用は、コンテンツの表示とソーシャル メディアでの共有を可能にし、Humanoid とその製品の開発と改善を促進する目的で使用される可能性があります。パートナー、あなたのプロフィールとアクティビティに基づいてパーソナライズされた広告を表示し、パーソナライズされた広告プロファイルを定義し、このサイト上の広告とコンテンツのパフォーマンスを測定し、このサイトの視聴者を測定します(もっと詳しく知る)
「すべてを受け入れる」をクリックすると、Humanoid とそのパートナー。
同意はいつでも撤回できます。詳細については、ぜひお読みください。クッキーポリシー。
手が徐々にアヒルを描いているのがわかり、ジェミニはそれを徐々に識別することができます。彼は絵を描く人の質問に答えて、彼が何を表現しているかを説明します。あなたはできる」。すべて複数の言語に対応しており、待ち時間がかなり短いことから、このツールが強力であることがわかります。双子座はちょっとしたゲームを作ったり、じゃんけんしたり、ボネットーや手品をしたりすることができます。ジェミニが毛糸から画像を生成していることもわかります。
GoogleがAIのデモンストレーションを実施するのはこれが初めてではない。印象的な»。Google Duplex は Google I/O 2018 で発表されたツールですを使用して音声通話を管理できるようになりました。Googleアシスタント, 何もせずに。たとえば美容院の予約をするのに十分です。 5 年後、この機能は廃止され、デモはおそらく現実からかけ離れすぎたものでした。さらに悪いことに:Google は AI を使用する代わりに人間を使用することがありました (わかりましたか?)。
ジャービスや HAL 9000 が毎日そばにあるという幻想は、少なくとも今のところはもうありません。夢はビデオの説明から亀裂が入り始めます。そこには次のように書かれています。このデモでは、簡潔にするためにレイテンシが短縮され、Gemini の出力が短縮されています。» これは、ツールの実際の応答時間がわからないことを意味します。チャットGPT音声少なくとも彼にはまだ良い日々が待っているようだ。
私たちが発見したものGoogle の開発者向けサイト、まず第一に、ジェミニとのやり取りは音声ではなくテキストで行われたということです。したがって、ビデオ内で話している人物は AI に直接話しているわけではありません。そして後者は物体をリアルタイムで見るのではなく、画像を介して観察しました。
示されているさまざまな状況に関しては、LLM を誘導したり、可能な応答を与えたりするための LLM の操作もあります。 Google は、質問をできるだけ詳しく説明することで、LLM が一般的ではなく、よりインテリジェントに見える回答を作成できるように条件付けします。じゃんけんの場合は、じゃんけんの映像が同時に表示されました。太陽系の惑星の順番を決めるゲームで、双子座に指定されたのは「太陽からの距離を考慮し、その理由を説明してください。」。車の例では、質問は「」ではありませんでした。形状から判断すると、どれが一番速く進みますか?"、 もっと "これらの車の中で最も空気力学的なのはどれですか?左側のものですか、それとも右側のものですか?具体的な視覚的な詳細を使用して、その理由を説明します。» これは間違いなく、ジェミニが空気力学について自動的に言及し、その対応を明確にすることを可能にしたものです。
Gemini と GPT-4: (ほぼ) 同様の機能
この印象的なデモンストレーションを考慮すると、Google が OpenAI とその技術に追いついたと簡単に言えます。GPT-4ジェミニと一緒に。舞台裏で同社が GPT-5 に取り組んでいると考えられるかもしれないということを忘れてください。公式ではありませんが。さらに、ほとんどのテストでは、Gemini が GPT を数パーセント上回るだけです。
Gemini Ultra のデモの利点は、GPT-4 を使用してそれを再現できることです。チャットGPTプラス、の有料サブスクリプションチャットGPT。これは、ウォートン大学のイーサン・モリック教授が実験で行ったことです。ブルームバーグ。彼にとって、Google の AI は答えを与えるように操作されていたが、意図を解釈する点では明らかにより効果的であった。しかし、ChatGPT (画像を解釈できる) に画像を与えると、応答は Gemini の応答と同様になるようです。彼にとって、「これらの能力はあなたが思っているほど新しいものではありません”と彼は説明したの上。
イーサン・モリック X 経由 // 出典 :URL
もし Google が単に自分を誇示しようとして自らの足を撃ってしまったらどうなるでしょうか?過去に起こったことと同様に、同社は自社のテクノロジーの 1 つを過剰に販売しました。誰が何と言おうと、デモは少なくとも GPT-4 と同じくらい印象的なものであるため、これは残念です。