AIが身近になりつつある今日、AIに関する特許も増えていますが、AIを教育するデータの資産的な価値にも注目が集まっています。データ自体が価値をもつようになった今こそ、データの資産保護について考えてみます。
AIの教師データ(学習データ)として有効なデータセットを持っている場合、そのデータ自体に価値が生まれてきます。このようなデータセットは関連するAI開発をおこなっている企業にライセンスすることもできるし、自社の関連技術の開発に使うこともできるでしょう。
このようにデータそのものに資産的な価値がある場合、どう保護していったらいいのでしょうか?
まず考えるのは特許ですが、残念ながら特許はこのようなデータの保護には向いていません。特許として保護されるものは「発明」なので、データセットをそのままの形で保護することはできません。
次に考えられるのが著作権です。しかし、アメリカでは、事実だけでは著作権で保護されません。AIに使われるデータの多くは単なる事実(例:特定の画像に写っている物体がネコかイヌか)に過ぎないので、そのようなものを著作権で保護するのは難しいです。
また、保護すべきデータは画像データとは限らず、Internet of Thingsなどのデバイスから得られる温度データや交通量データなども考えられますが、これらも同じように「単なる事実」であるという問題があります。
しかし、データの保護であれば、著作権上の「データベースの保護」が活用できる場合があります。詳しくは、この記事とFeist Publications, Inc. v. Rural Telephone Service Co., 499 U. S. 340 (1991)を参照。
著作権上の「データベースの保護」を得るための重要な点は、十分に創造的かつ独創的なデータの配列や選択であること。その場合、編集物として著作権で保護されますが、保護の範囲は限定されていて、事実上のコンテンツは保護されないという問題もあります。
ヨーロッパにはデータベースの法的保護( Database Directive)というものがありますが、これとはアメリカにおける「データベースの保護」は異なるので注意が必要です。
最後に、AI関連データを企業機密(trade secret)として扱うことも可能です。
だか、企業機密として取り扱う場合、データの取り扱いに注意が必要です。企業機密を保護するためには機密保持のための合理的な努力(reasonable efforts to maintain its secrecy)が求められるので、データへのアクセス、アクセスする人との契約上の縛りや信頼関係などが求められます。データが漏洩したこと、それを不当に使われたことをどう知るのかは大きな課題です。
多くの企業にとってAIに関するデータの価値が上がっていく中、データを資産として適切に保護する必要性が高まってきています。しかし、知的財産として保護する場合、課題が多く存在するのも事実で、データ自体を保護するには工夫が必要になってきます。