アメリカの作家が提出した訴状ではOpenAIを訴えている。著者団体は、同社がChatGPTをトレーニングするために、代表する団体の著作物をコピーして使用したと非難している。問題の著者の人気があれば、行動が強化され、AI のトレーニング方法が変わる可能性があります。
トレーニングするチャットGPT、またはむしろ GPT 言語モデル (一種のチャットボット エンジン)。IA)、大量のテキストが必要です。使用される本の中には、文章の量と質を兼ね備えた本が明らかにあります。問題は、これらの本が著作権で保護されていることです。まさにこの点において、OpenAI数人のアメリカ人作家からの告訴を受けて訴訟を起こされている。しかし、懸念はさらに深いようです。これらの作家たちは自分たちの職業を守りたいとも考えています。
それはザ・ヴァージ本日、ニューヨーク州南部地区で提出された告訴状を報告する。著者ギルド、米国で認められた作家の専門組織であり、他の 17 人の作家も参加しています。これらには、ジョージ・R・R・マーティン(ゲーム・オブ・スローンズ)、ジョナサン・フランゼン(訂正)、ジョシュ・グリッシュマン、ジョディ・ピクルト。この訴訟にさらに大きな側面を与えるために、原告らは、この訴訟が集団訴訟として分類されることを望んでいると述べている。
これらの著者は補償金の獲得を望んでいます。」フィクション作品における原告の登録著作権の重大かつ有害な侵害に対して」。彼らはまた、OpenAI が彼らの著作物を使用したであろうという事実にも依存しています。」許可や補償なしで」と読むことができます。告訴状の中で。
原告側の弁護士レイチェル・ゲーマン氏に対し、「原告および被告の提案集団の著作物を含まないもの【オープンAI】全く異なる商品になるだろう」。おそらく彼女は、作者がいなければ ChatGPT のパフォーマンスが低下し、OpenAI の収益も減少するだろうとほのめかしています。現時点では、OpenAI はこの問題に反応しておらず、間違いなく宣伝を優先しているダル-E 3、ChatGPT と Dall-E の合併のようなものです。
OpenAI は ChatGPT をトレーニングするためにインターネットから書籍をハッキングしたのでしょうか?
しかし、この訴訟は単なる著作権侵害にとどまりません。原告らは、OpenAIが電子書籍海賊版サイトから書籍をダウンロードしたと非難している。著者ギルドは訴状の中で GPT を明記しているが、ゴールフレームまたはBERTのグーグル共通クロールを使用します。これは、Web ページと数十億ページのテキスト スニペットのデータ コーパスです。ただし、このツールには海賊版サイトの書籍のテキストが含まれていることが知られています。
問題のもう 1 つのツールは、OpenAI によって作成されたデータセット、Books2 です。この訴状は、AI を専門とする特定の研究者によると、このデータベースには電子書籍最もよく知られている Library Genesis などの海賊版データベースからダウンロードされたものは、すでに何度も著作権侵害に関与しています。一部は由来する可能性がありますZライブラリ、これも特に学術界で非常に有名な Web サイトです。最後に、原告らは、言語モデルのトレーニングに使用されるデータに関する OpenAI の透明性の欠如について不満を述べている。
ChatGPT は小説家を危険にさらす可能性がありますか?
著者ギルドと訴訟を起こした他の約 17 人の著者に対して、LLM (大規模な言語モデル、注ぐ«主要な言語モデルフランス語で)、ChatGPT のようなチャットボット エンジンはそれらを危険にさらします。彼らによれば、LLM は「誰でも、著者に料金を支払うはずのテキストを無料 (または非常に安価) で自動的に生成できるようにします。» もう一つの懸念: これらの言語モデルは、著者に由来する著作物を作成する可能性があります。これらの作品を模倣、要約、言い換えすることにより、これらの作品の市場に損害を与えることになります。»
訴状で思い出されるように、OpenAI CEO のサム・アルトマン氏は米国議会で次のように宣言しました。クリエイターエコノミーの活気を維持する「彼の会社のシステムが欲しいのです」創造性を高め、アーティストやクリエイターの本質的な人間性をサポートし強化するために使用されます。」。生成人工知能のパラドックスも明らかにする発言。 AI はますますトレーニングし、より効率的にするためにコンテンツを必要としますが、そのコンテンツの制作者の弱体化につながります。また、文化産業への損害を避けることは、OpenAI やその他の専門企業の利益にもなります。

チャットGPT