著作物をAIトレーニングデータとして取り扱う際の主要国における法的枠組みへの取り組みとその状況

AIに関わる知財問題として注目されている1つの話題は、AIモデルの学習データとして著作権保護された作品を使用することです。このテーマに関しては、引き続き論争が続いていますが、個々では、この慣行が引き起こす潜在的な問題、そしてこれらのジレンマを解決するために現在行われている並行的な取り組みについて議論します。このような利用の状況は、世界のほとんどの地域で未解決の問題であるだけでなく、この問題を誰がどのように解決するかも未解決の問題です。可能性としては、世界の一部で統一された結果による規制、法律、訴訟、利害関係者間の商業的合意などが考えられますが、そのような動きはまだありません。

このような知的財産における不透明な部分が残る2024年において、生成AIに関する動きは以下のようなものがあります:

  1. AIツールを作成するために、開発者はしばしば大量のデータをモデルに投入する「トレーニング」プロセスに従事します。多くの場合、著作権で保護された作品がこの「トレーニングデータ」に含まれます。生成AIツールが商業化され、利益を生むようになるにつれ、一部のクリエイターは、生成AIツールを研ぎ澄ますために自分の作品が使用されることは、著作権者としての権利を侵害するとして、この慣行を問題視しています。
  2. 米国著作権局、ホワイトハウス、議会など、さまざまな当局がこの問題の重要性を認識しています。2023年12月にニューヨーク・タイムズ紙が生成AI企業に対して起こした訴訟をはじめとする主な裁判例も、AI開発者が学習プロセスにおいて著作物をどのように利用するかに影響を与える可能性があります。
  3. 世界の他の当局も同じ問題に直面しています。日本は、立場が変わりつつあるとはいえ、この問題に正面から取り組んでいます。一方、欧州連合(EU)は、汎用AIモデルの開発者に対し、著作権の有無にかかわらず、当該モデルの学習に使用されたすべてのデータの使用に関する透明性報告書の公表を義務付けようとしています。
  4. AIモデルを訓練するための著作物の使用に関するガイドラインの実施に規制当局や法律家が時間をかければかけるほど、開発者とクリエイターがこの問題に関して商業的な取引を試み、この問題を解決する方法として自主規制を選択する可能性が高くなります。ニューヨーク・タイムズ紙の訴訟は、そのような商業的交渉が行われていることを明らかにしました。

AI学習データとしての著作物

生成AIツールは、データプライバシー、労働力の混乱、消費者保護など多岐にわたる領域で、規制当局にさまざまな複雑な問題を提起してきました。しかし、世界中の規制当局が特に懸念している問題のひとつは、著作権法に対するAIの位置づけです。

多くの人が、質問に答えたり、ジョークを飛ばしたり、詩を作ったりする生成AIツールの能力に驚いています。多くの場合、AIツールがこのような結果を達成できるのは、科学者が大量のデータをコンピュータモデルに送り込み、データに基づいて「パターンを見つけたり、予測を行ったり」するようモデルに指示する「トレーニング」として知られるプロセスのおかげです。AIモデルを訓練するためのデータセットを作成するために、研究者はインターネットフォーラム、書籍コーパス、オンラインコードリポジトリなど、さまざまなデータソースを「スクレイピング」してきました。

生成AIツールが商用化される以前は、モデル学習のためのデータスクレイピングの著作権への影響を懸念する人はほとんどいませんでした。しかし、商業化され、利益を生む生成AIツールの出現により、この問題は、複数の訴訟、議会公聴会、著作権局からの問い合わせを生み出し、論争に発展しています。

今回は、AIモデルによる著作権保護されたコンテンツの利用をどのように管理するのが最善かという差し迫った問題に対する新たな解決策を調査します。

日本:AI開発者に力を?

一つのアプローチは、モデル開発において著作物を利用する自由を開発者に与えることです。多くの人は、これが日本のAIと著作権に対するアプローチだと解釈しています。

2018年の著作権法改正では、「データ分析に利用するためであれば、どのような方法であっても、また必要と考えられる範囲であれば…著作物を利用することが許される」とされました。この規定を、AI開発者は著作権者の許諾を得ることなく、AIモデルの学習に著作物を利用できると解釈する人もいます。このような解釈から、日本は 「諸外国に比べてAI学習に好意的である」と評する人もいます。

しかし、現在の法解釈がクリエイターの利益を害しているという不満もあり、AIと著作権に対する日本のアプローチに変更があるかもしれません。2023年12月、日本の文化庁はAIと著作権に関する報告書案を発表しました。この報告書では、AIモデルの学習に保護されたコンテンツを無許可で使用することが著作権法違反となるとの解釈を支持しています。文化庁は2024年3月にこの問題に関するガイドラインを発表する予定です。

ヨーロッパ:著作権保護コンテンツの透明性要件

2023年12月、欧州議会の交渉担当者はAI法について合意に達しました。2021年4月に初めて提案されたAI法は、「自然人の健康と安全または基本的権利に対するリスク」に基づいてAIの利用を特別に規制するものです。

2023年12月のAI法の条文では、汎用AIモデルによって引き起こされる潜在的な害に対処するため、そのようなモデルの提供者に対して、「AI事務局が提供するテンプレートに従って、汎用AIモデルの訓練に使用されるコンテンツに関する十分に詳細な要約を作成し、公開する」ことを求めています。AI法の以前のバージョンは、そのようなモデルの開発者から「著作権のあるトレーニングデータ」の使用に関する詳細な要約を要求していましたが、AI法のこの最新バージョンは、その著作権の状態に関係なく、すべてのトレーニングデータの開示を義務付けています。

AI法は、トレーニングデータに関する透明性要件を利用して、著作権者が自分たちの作品がデータマイニングされるのを防ぐ権利を行使できるようにしています。2023年12月のAI法に付随する解説によると、EUの規則では、「一定の条件の下で、テキストマイニングおよびデータマイニングを目的とした、著作物またはその他の主題の複製および抽出」が認められています。この制度の下では、著作権者は、自分の作品がそのような方法でデータマイニングされることをオプトアウトする義務があります。この「オプトアウトの権利」が適切な方法で明示的に留保されれば、汎用AIモデルのプロバイダーは、そのような著作物に対してテキストマイニングやデータマイニングを行いたい場合、権利者から許諾を得る必要があります。

アメリカ:AIと著作権のジレンマ解決に向けた三省庁と市場での取り組み

AIと著作権に関する政府機関と著作権局の取り組み

米国では、2023年8月に、米国著作権局が、生成AIの出現がもたらすガバナンスの課題にどのように対処すべきかについての意見募集を公表しました。とりわけ、著作権局は、「AIモデルを訓練するための著作物の使用 」に対処するために、「立法的または規制的な措置が必要かどうか」について意見を求めました。この照会に対する意見募集は、2023年12月6日に締め切られました。

2023年8月の照会は、著作権局によるこれまでの取り組みとともに、将来の立法改革のための材料を提供することを意図しています。著作権局の照会に基づくAIと著作権に関する政策提案は、早ければ2024年夏に行われる可能性があります

関連記事:著作権局がAI関連の著作権問題について意見を募集中 – Open Legal Community 

また、ジョー・バイデン大統領が2023年10月に発表した「人工知能の安全、安心、信頼できる開発と利用に関する大統領令」は、著作権局に「AIを使用して制作された著作物の保護範囲や、AIトレーニングにおける著作物の扱いなど、著作権とAIに関連する潜在的な行政措置について大統領に推奨事項を出す」よう指示しています。これらの推奨事項は、遅くとも2024年7月末までに大統領に出されることになっています。

関連記事:大統領令に見えるアメリカ政府のAI規制の枠組み – Open Legal Community 

AIと著作権に関する議会提案

行政府や著作権局と並行して、議会の議員もAIがもたらす著作権の問題に取り組んでいます。

2023年12月22日、連邦議会AIコーカスの副議長であるドン・ベイヤー下院議員(民主党、バージニア州選出)と共同議長であるアンナ・エシュー下院議員(民主党、カリフォルニア州選出)は、AI基礎モデル透明性法( AI Foundation Model Transparency Act)を提出しました。この法律では、特定のAIモデルの開発者は、「著作権所有者またはデータライセンス所有者が著作権またはデータライセンス保護を行使するのを支援するために必要な情報」を含め、モデルの学習に使用したデータのソースを開示する必要があります。

議員や委員会が断片的なAI法案を提案する中、議会指導部は包括的なAI法案を目標に掲げています。2023年9月から12月にかけて、チャック・シューマー院内総務(ニューヨーク州選出)が率いる超党派の上院議員グループは、上院全体で「AIインサイトフォーラム」を開催しました。これらのフォーラムの目的は、「数ヶ月」以内に効果的な超党派のAI法案を作成するために必要な専門知識を上院内で開発することです。

2023年11月29日、シューマー上院議員は 「透明性、説明可能性、知的財産、著作権」に関するフォーラムを開催しました。同議員はフォーラムの冒頭演説で、「AIシステムの透明性を促進し、クリエイターの権利を保護するために議会が果たすべき役割がある」と主張しました。

現行法では裁判所が判断?

2023年12月27日、ニューヨーク・タイムズ紙は「タイムズ紙と競合する人工知能製品を作成するためにタイムズ紙の著作物を違法に使用した」として、大手生成AI企業を提訴しました。訴状によると、被告らは「モデルやツールを開発するためにタイムズのコンテンツを無断で使用した」と主張しています。訴状によると、交渉による合意に達するための数ヶ月に及ぶ試みが行き詰まった後、出版社は訴訟を起こしました。

ニューヨーク・タイムズ紙は、被告らが「タイムズ紙のコンテンツを無報酬で使用し、訓練に使用したインプットを忠実に模倣した製品を作成した」ことは、フェアユースによって保護されておらず、著作権侵害にあたると主張しています。

原告、被告ともに知名度が高いことから、この裁判が裁かれた場合、最終的には最高裁に上告されるだろうと予測する専門家もいます。それが事実であるかどうかにかかわらず、この訴訟の結果は、ニュース業界だけでなく、AIモデルのトレーニングにコンテンツを使用しているすべてのクリエイターにとって重要な意味を持つ可能性があります。行政府や立法府による規制がない場合、この訴訟や関連する訴訟で決定的な判決が下されれば、AIモデルの学習データとして著作権保護された作品を使用することに関する業界基準が設定されるかもしれませんし、一連の基準を成文化するきっかけになるかもしれません。

解決策としての自主規制?

政府機関、議会、裁判所とは別に、AI学習データとしての著作物の利用がもたらす問題に対する最終的な解決策は、市場からもたらされるかもしれません。

提訴に先立ち、ニューヨーク・タイムズ紙は、コンテンツの利用をめぐってAI生成企業と数カ月にわたる交渉を行いました。この交渉が成功していれば、結果的に他の出版社やコンテンツ制作者のモデルとして利用されたかもしれません。ニューヨーク・タイムズの訴訟が進むにつれ、(訴訟当事者も含め)市場合意を妨げるものは何もなくなっています。

AIはとてつもないスピードで進化していっています。それに比べ、規制、立法、訴訟に基づく解決策は、時間がかかっている点は否めません。おそらく、規制当局がこの問題に対する公共政策の解決策を作成し、実施するのに時間がかかればかかるほど、クリエイターやAI開発者が独自の取り決めを行う可能性は高くなるでしょう。

参考記事:(Un)fair Use? Copyrighted Works as AI Training Data — AI: The Washington Report | Mintz 

ニュースレター、会員制コミュニティ

最新のアメリカ知財情報が詰まったニュースレターはこちら。

最新の判例からアメリカ知財のトレンドまで現役アメリカ特許弁護士が現地からお届け(無料)

日米を中心とした知財プロフェッショナルのためのオンラインコミュニティーを運営しています。アメリカの知財最新情報やトレンドはもちろん、現地で日々実務に携わる弁護士やパテントエージェントの生の声が聞け、気軽にコミュニケーションが取れる会員制コミュニティです。

会員制知財コミュニティの詳細はこちらから。

お問い合わせはメール(koji.noguchi@openlegalcommunity.com)でもうかがいます。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

OLCとは?

OLCは、「アメリカ知財をもっと身近なものにしよう」という思いで作られた日本人のためのアメリカ知財情報提供サイトです。より詳しく>>

追加記事

paper-documents
訴訟
野口 剛史

クレーム解釈は審査履歴と明細書の内容が重要

連邦巡回控訴裁判所(CAFC)は、連邦地裁が最終的に非侵害と判断した2つの特許のクレーム解釈について、1つの解釈は審査履歴に裏付けされているとして肯定し、もう1つの解釈は明細書に裏付けされていないとして否定しました。

Read More »