AI, 著作権

ジェネレーティブAIに用いられる入力データに関する著作権問題

02/23/2023

人工知能（AI）は、アートワークの制作、ソフトウェアの開発、文章の執筆の方法を大きく変えることが期待されている技術です。この大きな変化は、これらの作品の知的財産権保護、特に著作権保護をめぐる多くの新しい法的問題をもたらします。新たな法的問題の分析は、ジェネレーティブAIシステムの2つの重要な要素、すなわち入力データと出力データとの関連で理解することができます。そこで今回は、1つ目の「入力データ」について著作権の観点から考察していきます。

著作権法で保護されている入力をジェネレーティブAIシステムは使用できるのか？

米国では、この問題はフェアユース・ドクトリンに基づいて評価されています。Authors Guild v. Google, Inc.の判決（「Google Books事件」）は、この分析に光を投げかけています。グーグルは、書籍のデジタルコピーをスキャンし、その検索機能を一般に公開しました。この事件の原告は、これが著作権侵害にあたると主張。しかし、第2巡回控訴裁は、最終的にグーグルの行為はフェアユースと見なされ、侵害には当たらないとの判決を下しました。

「グーグルが著作権で保護された作品を無断でデジタル化し、検索機能を作り、その作品からのスニペットを表示することは、侵害にあたらないフェアユースである。コピーの目的は高度に変換的であり、テキストの公開は限定的であり、啓示はオリジナル作品の保護された側面の重要な市場代替物を提供するものではない。そして、Googleの商業的性質と利益動機は、フェアユースの否定を正当化するものではない。

と判例の中で書いています。

Google Booksの判示は、その事例の事実に基づくものですが、著作物をジェネレーティブAIシステムの入力として使用することは、フェアユースの下で保護されるという考えを支持しているように思われます。ジェネレーティブAIは、それらの作品を使用して、新しい作品に変換する（生成する）ことができます。さらに、ジェネレーティブAIシステムによって生成された新しい作品において、原著作物の表示は、認識できないとは言わないまでも、最小限である可能性があります。ここで重要なのは、本判決は、ジェネレーティブAIのいかなる応用においても、著作物を使用することを容認するものではない、ということです。ジェネレーティブAIシステムによって生み出された作品は、市場における重要な代替物となる可能性があり、これはフェアユースには不利に働きます。著作権で保護された作品が、市場で直接競合する芸術を生み出すジェネレーティブAIシステムの入力データとして使われたとしたらどうでしょうか。人気のあるジェネレーティブAIモデル、Dall‧Eを以下のように使用した場合を考えてみましょう。

左側では、Dall‧Eは「フォトリアリスティックなスタイルで馬に乗る宇宙飛行士」の画像を生成するよう依頼されました。右側では、Dall‧Eは「馬に乗る宇宙飛行士」の画像を生成するよう依頼されましたが、今度は「アンディ・ウォーホルのスタイルで」生成するよう依頼されました。

このように、ジェネレーティブAIは、特定のアーティストに倣ったコンテンツを生成することが可能です。これは、あるアーティストの作品の市場価値に大きな影響を与える可能性があります。一夜にして、ソフトウェア・プログラムが、特定の芸術家のスタイルで何千ものユニークな作品を生成し、特定の芸術作品のスタイルの供給が大幅に増加する可能性があるのです。Google Booksのケースとは異なり、著作物のこの種の使用は、ジェネレーティブAIシステムの入力として使用される著作物の商業的な代替となることを意図した出力を生成する可能性があります。このシナリオでは、フェアユースは適用されないかもしれません。

ジェネレーティブAIの入力データに関する問題はすでに訴訟になっている

これに関連して、マイクロソフトとOpenAI（上の画像を作成した生成アートプログラム「Dall‧E」を含む、いくつかのAIプログラムを開発した研究会社）は、2人のソフトウェア開発者がカリフォルニア州北部地区で起こした集団訴訟に対して抗弁しているところです。この訴訟は、OpenAIのもうひとつのプログラムである「Copilot」を巻き込んでいます。Copilotは、平易な言葉で書かれたユーザーの記述に基づいてコンピューター・コードを生成し、GitHubなどのリポジトリにある何十億行ものコードで学習されました。原告は訴状の中で、CopilotがGitHubに保存されているライセンスコードの「逐語的コピー」を定期的に出力していると主張しています。注目すべきは、訴状が著作権侵害を主張していない代わりに、両社がデジタルミレニアム著作権法（17 U.S.C. § 1201-1205（DMCA））を含む連邦法に違反したと主張している点です。また、訴状では、各種ライセンスやGitHubの利用規約に関する契約違反も主張されています。現時点では著作権侵害を主張していないにもかかわらず、この訴訟は、著作物に対するAIプログラムのトレーニングの合法性に関して答えを出すことを約束するものです。特に、Copilotは保護されたコードをコピーし、そのコードの一部をそのまま表示するのは合法なのか？という点は著作権法の観点からとても興味深い問いです。

ジェネレーティブAIに関連する法的課題として、Stability AI Ltd.、Midjourney Inc、およびDeviantArt Inc.に対して、カリフォルニア州北部地区で集団訴訟が提起されたことが挙げられます。被告は、それぞれ画像生成AIツールにテキストを提供しています。原告側は、ジェネレーティブAIシステムを「21世紀のコラージュツール」と位置づけ、同意なしに作品を使用することでアーティストの権利を侵害していると主張しています。同様の訴状は、ゲッティイメージズがStability AI に対してロンドンの高等法院に提出し、Stability AI がゲッティイメージズの所有する著作権を含む知的財産権を侵害したと主張しています。

国によっては特定の用途に対して著作権保護が及ばない「例外」を設けている

米国以外の国では、テキストおよびデータマイニングのアプリケーション（TDM）における著作物の使用について、明確な指針を示しています。TDMには、パターン、傾向、その他の有用な情報を特定するために、計算技術を使用して大量のデータを分析することが含まれます。TDMは、人工知能システムの訓練など、さまざまな目的で利用されています。TDMに使われるデータに関して著作権の適用範囲外、つまり著作権保護の例外として取り扱っている国は、イギリス、欧州連合、日本、シンガポールなどがあります。しかし、現時点でイギリスの例外は非商業的な目的にのみです。しかし、現在進行中の政策協議の進展を見ると、英国のTDMの例外が近いうちに商業目的を含むように拡大される可能性を示唆しています。

大規模データアプリケーション（AIを含む）における著作物の利用をめぐる政策の変化は、急速に発展するAI産業に対抗するためには、最新の法的指令が必要であるという各国政府の認識を示しています。

明確な回答は出せないのが現状

ジェネレーティブAIシステムが、著作権法で保護されている入力データを使用できるかどうか、現時点では答えは明らかではありません。一方では、著作権で保護された作品の表示を最小限に抑えながら、入力データから新しい作品が生み出されています。他方で、ジェネレーティブAIシステムの使用方法は多岐にわたります。これらのシステムのユーザーは、保護された作品の一見同一のコピーを作成したり、市場代替を目的とした作品を作成したりすることもできてしまいます。