ChatGPT は絶対確実ではありません。これを改善してエラーを修正するために、OpenAI はエラー検出で経験のある言語モデルである CriticGPT を使用します。
チャットGPTは間違いなく最もよく知られ、現在使用されている言語モデルです。しかし、間違いのない計算機とは異なり、人工知能は絶対に間違いがないわけではありません。さらに、ChatGPT 応答の後には常にメンションが続きます。「ChatGPT は間違いを犯す可能性があります。重要な情報を確認することを検討してください。 »
そこで OpenAI は、ChatGPT によって生成された応答内のエラーを特定して修正するように設計された人工知能モデルである CriticGPT を開発しました。このエラー発見サービスは、これまでで最も先進的なバージョンである GPT-4 モデルに基づいています。
さらに進むには
ChatGPT、Gemini、Copilot にはフランスとヨーロッパに新たな競合相手がいます: Claude AI がついに利用可能になりました
CriticGPT の主な役割は、人間の AI トレーナーのサポート ツールとして機能することです。これらのトレーナーは、ユーザーからの応答の精度を向上させるために取り組んでいます。GPT-4と呼ばれるメソッドを使用して人間のフィードバックからの強化学習(RLHF)。このプロセスでは、トレーナーが ChatGPT の回答を評価および比較し、最適な回答を決定します。
ただし、ChatGPT の精度が高まるにつれて、これらのトレーナーが微妙なエラーを検出することが難しくなります。次に、CriticGPT が介入して、見逃している可能性のあるエラーを特定します。 ChatGPT の応答を分析し、不正確さを強調する批評を提供することで、トレーナーが応答の質を向上させるのに役立ちます。
OpenAI は、エラーを含む多数の応答を分析および批評させることで、CriticGPT をトレーニングしました。これらのエラーの一部は人間によって意図的に挿入されましたが、その他はトレーナーによって以前に特定された ChatGPT のバグでした。
エラー検出器でエラーを見つける
ただし、CriticGPT は次のような AI 問題の影響を受ける可能性があるため、エラー検出器でエラーを追跡することも必要です。幻覚モデルが不正確または根拠のない答えを生成する場合。これら幻覚、 または作話、回答にラベルを付けるときに講師に誤解を与える可能性があります。
OpenAI は現在、トレーナーが長く複雑なタスクを理解し、評価するのに役立つ方法の開発など、CriticGPT の制限を克服するために取り組んでいます。目標は、より広範囲の応答にわたってエラーを検出する CriticGPT の機能を改良し、トレーニング プロセスをより効率的かつ正確にすることです。

チャットGPT