Google I/O 中に、Google は、チャットボットのサブスクリプション プランである Gemini Advanced に、LLM の最新バージョンである Gemini 1.5 Pro が登場すると発表しました。このサブスクリプションには他の機能が含まれており、無料ユーザーには後で提供される可能性があります。

Gemini Advanced のロゴ // 出典: Montage Frandroid

今週火曜日、5月14日は、Google I/O 2024が主催する主要なカンファレンス。グーグルソフトウェアのイノベーションについて報告します。今年は、人工知能注目を浴びています。このため、Google は、Gemini Advanced の有料版に変更を加えました。ジェミニ、競合するチャットボットチャットGPT。 Google がますます熾烈を極める ChatGPT Plus と競争できるようにする今後の新機能の概要。

さらに進むには
Gemini: ChatGPT を置き換えようとする Google の AI について知っておくべきことすべて

これまで、Gemini Advanced は「」のみを提供していました。» Gemini 1.0 Ultra: Ultra バージョンは、これまでに Google が提供した最も強力な LLM です。Gemini 1.5 Pro は昨年 2 月に Google から発表されました、Gemini 1.5と完全に並んでいます。その Pro バージョンはベンチマーク テストの 87% で 1.0 Pro を上回っていると当時 Google は誇っていました。より速く、より効率的に、つまりこのバージョンは、Gemini 1.0 Pro の 32,000 トークンをはるかに上回る 100 万トークンを処理できるようになりました。比較のために、GPT-4128,000 個のトークンを処理できるため、必ずしもパフォーマンスが向上するわけではありません。最適化の目的で、OpenAI はタスクで使用されるトークンの数を圧縮しようとします。これは次の場合に当てはまりますGPT-4o、Googleカンファレンス直前の今年5月13日に発表された言語モデル。いずれにせよ、Gemini Advanced は、公開市場で入手可能な最も多くのトークンを備えたチャットボットを提供します。

Cookie やその他のトラッカーを受け入れていないため、このコンテンツはブロックされています。このコンテンツは YouTube によって提供されています。
これを表示するには、YouTube によるお客様のデータの使用を受け入れる必要があります。この使用は、コンテンツの表示とソーシャル メディアでの共有を可能にし、Humanoid とその製品の開発と改善を促進する目的で使用される可能性があります。パートナー、あなたのプロフィールとアクティビティに基づいてパーソナライズされた広告を表示し、パーソナライズされた広告プロファイルを定義し、このサイト上の広告とコンテンツのパフォーマンスを測定し、このサイトの視聴者を測定します(もっと詳しく知る)

「すべてを受け入れる」をクリックすると、Humanoid とそのパートナー

同意はいつでも撤回できます。詳細については、ぜひお読みください。クッキーポリシー

自分の選択を管理する

Gemini 1.5 Pro の利点は、多くの情報 (トークン) を処理できることです。具体的には、1500 ページのテキストまたは 100 通の電子メールを非常に迅速に分析できます。最終的に、Google は次のことを発表します。LLMセラ «1 時間のビデオ コンテンツまたは 30,000 行以上のコード ベースを処理できます。» 最後にこれGemini 1.5 Pro はオーディオをサポートします、オーディオ ファイルとビデオ オーディオ トラックの両方で。グーグルはこう説明した。これにより、ユーザーはシームレスなマルチモーダル分析を利用でき、テキスト、画像、ビデオ、オーディオについての洞察を得ることができます。また、高品質の文字起こしも提供し、入札や投資家会議中の調査、分析、質問への回答など、オーディオおよびビデオ コンテンツの検索に使用できます。»

Gemini のロゴ // 出典: Google

念のため言っておきますが、このバージョンはマルチモーダルと呼ばれます。画像を提供して質問することができます。つまり、チャットボットはこれら 2 つのコンテンツを使用してリクエストに応答します。ただし、Google はこのモデルを最も要求の厳しいユーザー、ひいては毎月サブスクリプションを支払う準備ができているユーザーのために予約しています。

さらに進むには
LLMとは何ですか? ChatGPT、Google Bard などのエンジンはどのように動作しますか?

同社によれば、Gemini Advanced と Gemini 1.5 Pro は 150 か国以上、35 以上の言語で利用可能になる予定です。良いニュースです。フランスは Gemini Advanced が利用可能な国の 1 つであり、Gemini 1.5 Pro が搭載されています。

さらなる「チャットボット」知的"、 もっと "恵み" あなたへ

Google Gemini が大量のデータを処理できる場合でも、それを提供する必要があります。そして、ほとんどの場合、それがユーザーの役割です。これが、Googleがそのスペースからファイルをダウンロードする可能性を追加した理由ですGoogleドライブまたはデバイスから、チャットボットのアドバンスト バージョンで直接。同社は次のように説明しています。たとえば、賃貸契約書のペット ポリシーの詳細を確認したり、複数の長い研究論文から重要な議論を比較したりする場合など、高密度の文書から回答や情報を迅速に得ることができます。»

出典: Google

Google は次に何が起こるかを論理的に考えます。同社は、近いうちに Gemini Advanced がビジュアライゼーションとチャートを構築できるようになるだろうと予測しています。」その場で» あなたが委託したファイル (スプレッドシートなど) から。ユーザー、特に専門家を安心させるために、Google は次のことを思い出させます。Gemini はあなたのファイルを開示したり、トレーニングに使用したりしません私たちのモデル»

Gemini Advanced によって提供される利点は何ですか?

現在、Google は Gemini Advanced を使用する計画を Google One AI Premium と呼んでいますが、この 2 つは最終的には混同されています。このパッケージの料金は月額 21.99 ユーロ (2 か月のトライアル特典付き) で、以下をご覧いただけます。

  • のすべての利点Google One プレミアム;
  • Google アカウントの 2 TB のストレージ (無料ユーザーの場合は 15 GB の代わりに)。
  • Gemini の Google サービスへの統合。
  • Gemini 1.5 Pro を使用します。

Gemini Advanced に追加される機能

同時に、Google は Gemini Advanced サブスクライバーのみに予約されるいくつかの機能を発表しました。

Gemini Live: あなたは The Voice の席に座ります

Googleは今後数か月以内に上級ユーザー向けにライブ機能を展開する予定だ。同社はこのアイデアについて次のように説明しています。Gemini に話しかけて、応答するために使用できるさまざまな自然な声を選択できます。» 簡単に言うと、チャットボットの音声機能であるChatGPT Voiceによく似ています。OpenAI5 つの音声から選択して会話できます。そして、音声モードでの GPT-4o の印象的なデモンストレーション, Gemini Live は応答の途中で中断される場合があります。

ChatGPT Voice のデモ // 出典: OpenAI

さらに、Google は OpenAI とまったく同じ使用例を発見しました。あなたが就職面接の準備をしている、または重要なスピーチのリハーサルをしているとします。ただライブに行って、Gemini に準備を手伝ってもらってください。双子座は、将来の雇用主と話すときに強調すべきスキルや、ステージに上がる前に緊張を落ち着かせる人前で話すヒントを提案します。»

今年後半に登場するもう 1 つの新機能は、ライブ カメラを使用して、周囲に見えるものについて Gemini と対話する機能です。

ジェミニがプレイしますツアーオペレーターバックパッカーズガイド

Googleは自社のチャットボットをあなたのものにしたいと考えているツアーオペレーター、あなたの希望と制約に応じて滞在のプログラムを作成します。まず、Gemini Advanced は、Gmail に問い合わせるだけで、予約した旅行情報 (飛行機、電車) を Gmail から抽出できるようになります。これらすべてを考慮に入れますが、「食事の好みや地元の美術館に関する情報をすべて把握しながら、各停留所がどこにあるのか、あるアクティビティから次のアクティビティに移動するまでにどれくらい時間がかかるのかを知ることができます。»

Google Gemini // 出典 : Frandroid

双子座は相談できるGoogleマップどのレストランで食事をするか、どの美術館を訪れるべきかを知るため。 Google 検索エンジンを使用してアクティビティを推奨します。今後数か月以内に上級ユーザーが利用できるようになるエクスペリエンスです。

Gems を使用すると、チャットボットは複数の人格を持つようになります

Google が立ち上げようとしているもう 1 つの機能、それは Gems です。これらは実際には、自分で作成できるジェミニのパーソナライズされたバージョンになります。ジム仲間、副料理長、プログラミング パートナー、またはクリエイティブ ライティング ガイド»、会社を指定します。設定は非常に簡単なようです。Gem を作成したい内容を記述するだけです。ジェムは与えられた指示に従って少しずつ改善していきます。繰り返しになりますが、機能が追加されます。」すぐ»。

Google サービスが徐々に Gemini に導入されています: YouTube Music が最新のサービスになります

ジェミニでは数か月間、「拡張子»: これらはチャットボットに接続できる Google サービスです。現時点では、Google フライト、Google ホテル、Google マップ、Google Workspace (ドライブ、ドキュメント、スプレッドシートなど) のほかに、YouTube。 Google は Google I/O 導入中に発表しましたYouTube ミュージックチャットボットで。アーティストや詩の一部に言及して、タイトルがわからない音楽を検索するのに十分です。

出典: Frandroid によるスクリーンショット

Google は、間もなく、Google アジェンダGoogleタスクなどグーグルキープ拡張版としてジェミニに到着します。同社はすでに興味深い使用例を持っています。そのため、お子様の学校のスケジュールの写真を撮り、ジェミニに課題ごとにカレンダーのエントリを作成するように依頼したり、新しいレシピの写真を撮って、買い物リストとしてカレンダーに追加したりすることができます。» その他に期待される機能としては、以下のものが挙げられます。メモリ» by ジェミニ :チャットボットに覚えておいてほしい内容を伝える機能。現時点では、これは Google によって公式には発表されていません。


Google ジェミニ