ChatGptとSoraから直接画像を生成できるようになりました。それははるかにうまく機能し、無料です

ChatGptはフェイスリフトを獲得しています。Soraは、より美しくてスマートな画像で到着します。

発売以来、ChatGptは常にテキストを書いたり、質問に答えることが認められてきました。しかし、画像の側では、彼は仕事をしていた彼の画像ジェネレーターであるDall-Eと少しぶらぶらしていましたが、本当に感銘を与えませんでした。終わりました! Openaiは斬新さを発表しました:SORA、直接統合された画像ツールchatgptGPT-4Oのおかげで、モデル「オムニモダル「誰がすべてを行うことができます。別の良いニュース:あなたはそうですか?:-)世界はそれを楽しむことができます。

SORA:新しいVisualChatGptエンジン

以前は、画像を生成するために、SORAサイトを通過するか、Dall-Eに満足する必要がありました。これで、すべてがChatGPTインターフェイスで行われ、はるかに流動的です。秘密? GPT-4Oは、テキスト、画像、サウンド、さらにはビデオでジャグリングできるAIのモデルです(今のところ、SORAが固定画像に焦点を当てていても)。

大きな進歩の1つは「」と呼ばれます。バインディング技術専門用語では、基本的に、AIが画像にいくつかのことを求めるときにブラシを混ぜない能力です。たとえば、青い星と赤い三角形が必要な場合、古いモデルは三角形を取り出して三角形をザップすることができます。

そして、それだけではありません。画像のテキストが最終的に読みやすくなります。 Dall-Eでよく見たねじれた文字や理解できない言葉はもうありません。レストランのメニュー、ポスター、コミックのいずれであっても、ソラは見事にそれをやっています。 Openaiチームが働いた」数ヶ月これを改良するために、そしてたとえそれがまだ非常に小さなキャラクターに完璧ではないとしても、それはすでに大きな前進です。

SORAを使用すると、ChatGptは基本的な図面を描くことに満足していません。科学的な経験、一貫したキャラクターを備えたコミックストリップ、またはステッカーの透明な背景を持つロゴなど、より複雑なことを彼に尋ねることができます。

技術的な面では、SORAはSO -CALLEDの「自己回帰」メソッドを使用しています。拡散モデルで突然画像を生成するDall-Eとは異なり(まるでキャンバスにペイントを投げて調整したかのように少し)、SORAは左から右へ、そして上から下に画像を段階的に「描画」します。もう少し時間がかかります - さらに数秒 - しかし、特にテキストと詳細については、結果がより正確になります。 Openaiにとって、この小さな締め切りは、得られた品質を考えると打撃の価値があります。

ボーナスがあります。自分の写真をアップロードして、ChatGptにそれらを変更するように依頼することができます。たとえば、動物をビデオゲーム設定に追加するか、オブジェクトの色を変更します。 「メモリ」により、GPT-4oはアイデアのスレッドを維持し、画像を数回クリックすることができます。

明らかに、このような強力なツールを使用して、可能性のあるドリフトについて質問します。 Openaiは、堅実な保護手段を置いたと主張しています。間違いなくディープフェイク、透かしの削除、不適切なコンテンツに対するフィルター。生成された画像には目に見えるブランドはありませんが、メタデータ(C2PA)を乗り越えて、それらがOpenaiから来ることを証明します。それは完璧ではありませんが、チームは時間の経過とともにそれを改善することを約束します。

とりあえず、ソラはすべてのユーザーにとって無料ですchatgpt、サブスクリプションがなくても。 Dall-eの常連は、特別なモードでそれにアクセスすることができますが、ソラはクローゼットの上にそれを真っ直ぐに置きました。将来的には、OpenAIはこれらの進歩を開発者向けのAPIに統合する予定であり、すでに制限を押し上げるGPT-5について話しています。

chatgpt


Twitchで2人の2人でお会いしましょう、午後6時から午後8時まで、ライブをフォローします後押しするショーFrandroidによって生産。電気自動車、電気自転車、専門家の意見、ゲーム、または証言、誰にとっても何かがあります!