ChatGPTを始めとする生成AIがどんどん普及していますが、その反動というか、当然の流れとして、普及度に比例しAI関連の訴訟も増えてきています。特に著作権侵害やそれに関連する訴訟は多く、今回もOpenAIを相手に、直接および間接的な著作権侵害、著作権管理情報の削除、不公正な競争、過失、不当利得を理由にした訴訟が米国地方裁判所でおこりました。この訴訟も含め現在進行中の著作権関連のAI訴訟における判決は、AI開発と著作権法に大きな影響を及ぼす可能性があります。
ーーー
Paul Tremblay と Mona Awadという2人の作家が、OpenAIを相手取って米連邦地裁に集団訴訟を起こしました。この訴訟には、以下のような幅広い主張が含まれています:
- 直接的な著作権侵害:(i)OpenAIの大規模言語モデル(基本的にGPT-1、GPT-2、GPT-3、GPT-3.5、GPT-4)のトレーニングデータセットに使用するために、OpenAIに自分たちの著作物のコピーを作成する許可を与えていないが無断で使用されたことによる侵害行為があった。
- LLMが出力する各出力は、原告の著作物から抽出された表現情報に基づくものであるとして、LLMが出力する各出力について著作権が侵害されている。
- 設計上、OpenAIのLLMのトレーニングプロセスでは著作権管理情報が保存されていないため、著作権管理情報が削除されている。
- カリフォルニア州ビジネス・職業法典(California Business and Professional Code)に基づく不正競争。
- OpenAIは原告に対して注意義務(duty of care)を負っており、原告およびクラスメンバーの著作物を無断で収集、維持、管理し、その上でシステム(ChatGPTを含む)をトレーニングしたことにより、これに違反している。
- 原告の著作物へのアクセスを利用してChatGPTを訓練し、それによって原告およびクラス構成員から著作物の利益を奪ったことによる不当利得があった。
このような「包括的」な請求に対するアプローチは、この種の事件として初めて法廷で検証されるものということを考えれば、当然のことかもしれません。しかし、アメリカにおいてこのAIに関する著作権は複雑で、一筋縄ではいかないことが多いです。例えば、米国では、トレーニング用データセットにこれらの作品を使用することが、フェアユースの原則の下で認められ、著作権を侵害しない可能性が少なくありません(つまり、フェアユースの例外が適用され著作権侵害が成立しない可能性が十分ある)。
トレーニングデータを著作権法上どう取り扱うべきか意見は真っ二つに割れている
著作権者は、トレーニングデータにおける著作物の使用には著作権者の許諾が必要であり、対価を支払うべきであるという見解を堅持していますが、AI開発者の中には、著作物の使用という性質上、許諾や対価の支払いは必要なく、著作物は単に「データ」として使用されているだけであり、人間が著作物として消費したり享受したりするものではないという見解をとる人もいます。
裁判が進めば、その判決結果に応じて何らかの指針が見えてくることになりそうですが、現在はその過渡期であり、今回の集団訴訟以外にも類似した訴訟が数多く起きており、それらすべてに目が離せない状況です:
- Copilotを訓練するためにGitHubのコードが使用されたことに関する、GitHub、マイクロソフト、OpenAIに対する米国の集団訴訟
- Stability AI、Midjourney、DeviantArtに対する、学習データにおける芸術作品の使用に関する米国の集団訴訟
- Getty ImagesがStability AIに対して起こした、学習データにおける芸術作品の使用に関する米国での訴訟
- マイクロソフトとOpenAIに対する、プライバシーを中心とした米国の集団訴訟
- トレーニングデータにおける芸術作品の使用に関する、Getty ImagesによるStability AIに対する英国での訴訟
などがあります。
関連記事:AIコードジェネレーターが及ぼす可能性のある法的な問題とその解決、AI自動生成ツールは「侵害」するのか?3つの訴訟に注目、ジェネレーティブAIは著作権を侵害しないと作れないのか?