現在SNSに掲載された著作権侵害コンテンツはDMCA通知という取り下げを求める枠組みによって迅速に侵害行為を止めることができます。しかし、AIの技術発展に伴い、AIが主流となっていくAI時代のネット社会にはDMCAがうまく機能しないという懸念があります。1990年代に発案されたDMCAの枠組みではAI技術の発展と著作権による十分な保護の両立は難しいとされる中、まったく新しい法的な枠組みが求められる時期に来ているのかもしれません。
ネット社会での著作権保護の仕組みを確立したDMCA
1990年代、現在と同様、インターネットはコンテンツで動いていました。しかし、著作権侵害の責任を問われる可能性があるため、インターネットの運営に必要なサービスを提供しようとする人々の意欲を削いでしまうという問題がありました。また、インターネットは、一般市民が創造的な作品のデジタルコピーを無制限に作成・配布できるという、これまで知られていなかった、著作権の観点からすれば終末的ともいえる能力を提供したという点でも問題がありました。
最終的に、インターネットのコンテンツ問題は、デジタルミレニアム著作権法(DMCA)によって解決されました。DMCAは、セーフハーバー、通知、テイクダウンの枠組みを通じて、サービスプロバイダーと著作権者のインセンティブを一致させました。事実上、DMCAは、(a)コンテンツが侵害されていることを認識しておらず、(b)侵害コンテンツの存在を認識した上で、そのコンテンツを削除したり、アクセス不能にしたりした場合には、インターネットを運営する技術を運営する企業が、ユーザーコンテンツの侵害に対して責任を問われない仕組みを確立しました。途中、いくつかの紆余曲折はあったものの、この法的枠組みが最終的に現在の制度につながりました。権利者は侵害が検出された際に適切なサービス・プロバイダーに通知することでコンテンツを管理することができるようになり、 サービス・プロバイダーは、侵害を認識したコンテンツを削除する限り、法的な確実性と技術革新の余地を得ることができるようになりました。
AIと既存の著作権法の限界
今日のAIは、1990年代のインターネットと同じようなコンテンツ状況に直面しています。90年代のインターネットと同様、今日のAI技術は機能するためにコンテンツを必要としています。例えば、ChatGPTは約3000億語のコーパスを用いて学習され、MidJourneyとDALL-E画像生成アプリは約60億の画像とテキストのペアのデータセットを用いて学習されました。同様に、1990年代のインターネットのように、今日のAIテクノロジーは、アーティストやその他のコンテンツ所有者にとって、ほとんど存亡の危機に瀕していると考えられています。
類似点はさておき、今日のAIモデルと1990年代のインターネットには、法的観点から見て決定的な違いがあります。初期のインターネットは、クリエイティブな作品を特定可能なコンテンツの断片として保存し、侵害があれば削除できました。しかし、今日のAI技術はそうではありません。特定の創造的な作品を保存する代わりに、創造的な作品は人工知能モデルの訓練に使用され、個々の作品は数十億(OpenAIのGPT-4の場合は数兆)のパラメータの値に広がる無限の変化に反映されます。このため、現在の技術を考慮すると、ChatGPTやMidJourneyのような生成AIから侵害項目を削除する唯一の方法は、問題の項目なしでAIをゼロから再トレーニングすることです。
しかし、このようなモデルのトレーニングにかかる費用は、数百万ドルに上ることもあります。特に、異なるアーティスト、作家、出版社、その他の権利者が複数の独立した削除通知を提出する可能性を考慮すると、これはDMCAスタイルの通知と削除スタイルの解決策を実行不可能にします。
一方、DMCAスタイルの責任保護がなければ、今日のAI製品が、かなりの量の非ライセンスのサードパーティの素材を含むデータセットで主に訓練されたと思われ、大量の訴訟の下に埋もれ、破壊される可能性があることは容易に想像できます。
AI技術の発展と著作権による十分な保護の両立は不可能?
要するに、過去20年間、オンライン・サービス・プロバイダーを著作権責任から隔離してきた法制度は、AIのオンライン・プロバイダーには、原則的にさえ適用できないです。さらに、AIを自社製品に組み込むオンライン・サービス・プロバイダーが増えるにつれ、潜在的な侵害請求は、テクノロジー産業とコンテンツ産業の間の現在の比較的平和な共存さえも損なう可能性があります。
おそらく、これはあるべき姿なのでしょう。しかし、権利者たちは、小規模なクリエイターがDMCAの通知と削除の部分を使って侵害を取り締まる能力について懸念を表明しており、米国著作権局自身も、サービス・プロバイダーと権利者の間の意図されたバランスが崩れていると結論づけています。
その一方で、AIの継続的な開発を広範な著作権責任と両立させる方法を見出すのは困難です。特に、侵害訴訟を引き起こしたデータに取って代わるにふさわしく、かつAIのトレーニング用に完全にライセンスされたデータセットが現在のところ存在しないからです。その結果、AIと著作権の対立を解決するためには、技術的な革新と法的な革新の両方が必要であることは間違いなさそうですが、これらの競合する利害の間でどのような均衡が達成されるかはまったく明らかではないのが現状です。
参考記事:Will AI Destroy the DMCA Copyright Compromise? – Frost Brown Todd | Full-Service Law Firm