OpenAI によると、GPT AI をトレーニングするために著作権で保護されたコンテンツを使用するのは自然であり、必要なことです。

2024 年は、生成 AI にとって西部開拓時代が終わる年になるかもしれません。ミッドジャーニーが盗作告発に巻き込まれる中、約4,700人のアーティスト、OpenAI企業は直面しなければなりませんChatGPT に関する報道機関からの非難

どちらの場合も、両社は、たとえ著作権で保護されたコンテンツを使用することを意味するとしても、自社の生成 AI を真にインテリジェントで関連性の高いものにするために、インターネット上のコンテンツを大量に使用してきました。裁判所は、これが許容される使用かどうかを判断する必要があります。

英字新聞の記事に載ってましたガーディアンニューヨーク・タイムズからの非常に深刻な告発に対する OpenAI の最初の反応を読むことができます。この分野で Microsoft と提携しているこの新興企業によると、著作権で保護されたコンテンツにアクセスせずに ChatGPT のようなツールを設計することはまったく不可能です。

ChatGPT、Midjourney、Stable Diffusion などの生成 AI ツールは、大規模言語モデル、LLM。インテリジェンスを獲得するには、非常に大規模なデータ コーパスを使用してトレーニングする必要があります。

しかし、特に英国や米国における著作権の原則は、権利所有者の同意なしに作品を商業目的で使用することは不可能であるということです。 OpenAI は、GPT がトレーニングのために参考にした数千の記事の所有者を個別に訪問しませんでした。

現在、著作権がブログ投稿、写真、フォーラムへの投稿、ソフトウェア コードの断片、政府文書など、人間の表現のほぼすべての形式に適用されていることを考えると、著作権で保護された素材を使用せずに今日の最高の AI モデルをトレーニングすることは不可能でしょう。

この推論には、シリコンバレーと同じくらい古い哲学があることが分かります。つまり、イノベーションを起こし、法律を強制的に適応させるほど大きくなるためには、時には法律を無視する必要があるということです。これは、新しい生成 AI 企業が、インターネット上のリソースを違法に使用したことを彼ら自身が認めているが、その違法使用を合法化するよう要求しようとしている対立点である。

言い換えれば、OpenAI は、投資 (たとえば報道機関の場合はジャーナリストの給料) を必要としたコンテンツを自由に活用し、ChatGPT や Dall-E に関するサービスの販売を通じて商業的利益を得ることができるようにしたいと考えています。 。

メディアを尊重するための OpenAI の措置

OpenAIは、自らの立場を公に擁護するのは難しいと感じながらも、メディアを尊重するために講じられた一定の措置を思い出させた。まず第一に、このサービスは GPT がメディアのオンライン データにアクセスするのを防ぐ方法を提供するようになりました。 2023 年の夏からニューヨーク タイムズ紙が使用しているソリューションですが、この日までに AI トレーニングの問題は解決されていません。

さらに、OpenAI は「逆流» ChatGPT で修正できるバグ。これにより、ChatGPT は、問題の出典を引用せずに、ニューヨーク タイムズの有料記事から正確な一語一語の抜粋を提供できるようになります。ニューヨーク・タイムズは、訴訟声明に付随する証拠の中でこの事実を広範囲に文書化した。

最後に、この世間の反応とは別に、OpenAI は主に主要なメディア グループと提携して、今回は著作権の枠組みの中でデータにアクセスする権利を取得しようとしています。同社はすでに以下との契約に成功しているAP通信(AFPに相当する米国)、アクセル・シュプリンガー(ビジネス・インサイダー)。