Google は、今週火曜日、5 月 14 日に開催された Google I/O カンファレンスで多くの発表を行いました。その中には、Imagen 3: 画像生成モデルの最新の進化版があります。より優れた解釈とより正確な画像を生成することができます。

出典 : モンタージュ・フランアンドロイド

画像、 ありました画像2、次に Imagen 3:グーグル画像生成モデルを反復し続けます。同社は実際、この期間中に Imagen の 3 番目のバージョンを正式化しました。Google I/O カンファレンス今年5月14日にサンフランシスコから生放送。発表の中には、例えばGoogleが発表したAsk Photos、Gemini を使用した Google フォト機能

Imagen 3 はどのような進歩を遂げましたか?

Google は、品質と詳細レベルの両方の点で、テキストから画像を生成するための最も効率的なモデルとして Imagen 3 を紹介しています。約束: フォトリアリスティック/リアリスティックな画像、そして何よりも「気を散らす視覚的アーティファクトの減少» 特に Imagen 2 と比較してください。もう 1 つの非常に重要な進歩は、テキストの生成です。実際、画像ジェネレータは概念的に文字が 1 つであることを理解できないため、単語を表現することは非常に複雑です。 Google は、自社モデルのテキスト描画機能を大幅に改善したと発表しました。

Imagen 3 は Google I/O 2024 で発表されました // 出典: google

同社はこの進歩について、Imagen 3 の言語解釈が優れているという事実によって説明しています。理解する» 背後にある意図を詳しく見るプロンプト特に、長いメッセージではより詳細が考慮されるためです。

Imagen 3 で生成された画像とその「プロンプト」 // 出典: Google

Imagen 2 と同様、Imagen 3 は英語でのみ使用できます。 Google の AI Test Kitchen で利用できる実験的な AI ツールの 1 つである ImageFX で一部のクリエイターが利用できる AI。後者は、Imagen 3 が Google Cloud 向けのソリューションである Vertex AI で間もなく利用可能になることを指定しています。

この無数の画像ジェネレーターはどのように使用され、どのような統合が行われるのでしょうか?

画像ジェネレーターは、無料のものであっても、ほとんどどこにでもありますが、必ずしもすべてが私たちが使用するアプリケーションに統合されているわけではありません。最も先進的なのは間違いなくマイクロソフトです。彼の副操縦士と一緒に。 Google側では、Imagen 2は、同社のAI Test Kitchenで(制限付きで)利用可能な実験ツールであるImageFXでのみ使用できる。

ImageFX で使用できる Imagen 3 // 出典: Google

Googleが想定する用途の中には、「パーソナライズされた誕生日メッセージの生成、プレゼンテーションのタイトル スライド「特に。そして、統合において、Gemini は数ヶ月にわたって画像を生成できるようにしました。多様性という点では影響がないわけではありません。私たちもそれを知っていますGoogleは画像ジェネレータをGoogleメッセージに統合することに取り組んでいます、息子チャットボットGemini経由。

さらに進むには
欧州選挙: Google の重要な役割

ヨーロッパの法律のせいで、Google は旧大陸での展開が困難になっているため、これらのツールがフランスに到着することを祈りましょう。