OpenAI の CEO は、その新しい音声バージョンである ChatGPT 音声モードの展開が来週、加入ユーザーに導入されると発表しました。昨年5月に同社がデモンストレーションを行った後、待望のバージョンとなった。
昨年5月、私たちは次のように書きました。映画へようこそ」彼女»。それには正当な理由があります:OpenAI は GPT-4o をデモしたばかりでした、彼の新しいバージョンLLM。しかし、それ以上に印象に残ったのは、これは彼のボーカルバージョンです、非常に高速で、流動的なディスカッションが可能です。もし数人の幸運な人々がこの AI をテストする機会がありましたOpenAIによる失敗の後、同社はこのモードの登場を延期した。しかし、数日以内に、より多くのユーザーがこの新しいツールでチャットできるようになります。チャットGPT。
それはの上そのCEOがOpenAI、Sam Altman 氏は、ChatGPT の音声モード (Advanced Voice) が来週初めに登場すると正式に発表しました。ただし、誰もが恩恵を受けられるわけではないので注意してください。実際、この機能は ChatGPT Plus 加入者向けに予約されています。
ちなみに、これは月額 20 ドルのサブスクリプション プランです。これにより、特に、GPT-4o へのより長いアクセスが可能になり、ファイルを分析したり、Dall-E で画像を生成したり、パーソナライズされた GPT を作成したりすることもできます。長期的には、OpenAI によって GPT-4o 音声モードへのアクセスがすべてのユーザーに無料になると考えられますが、これは今のところではありません。
GPT-4oとの議論で何が変わるのか
この新しい LLM はリソースをより多く消費するため、実行コストが高くなります。大きな利点の 1 つは、ChatGPT がさらに多くのことを可能にするものです。自然» (引用符は重要です) 会話では、これは応答時間です。 OpenAI によれば、それはわずか 320 ミリ秒であり、思い出したようにネオウィン、以前のモデルよりも大幅に減少しています。 GPT-3.5 では 2.8 秒、さらには 5.4 秒です。GPT-4。
すべては非常に自然に見える合成音声です。GPT-4o が声の呼吸やためらいをシミュレートできることがわかっています。さらに、LLM は、特にストーリーを語るように求められた場合に、回答に音響効果を追加できます。これらすべてにより、来週予定されているアドバンスト ボイス モードのリリースが非常に期待されています。
Twitch ショー「SURVOLTÉS」隔週水曜日の午後 5 時から午後 7 時までです。電気自動車や電動自転車、ディベート、インタビュー、分析、ゲームなどについてお話しましょう。

チャットGPT