USPTOのOpen dataは十分に活用されていない

USPTOは様々なデータを公開していますが、あまり活用されていないようです。うまく活用すれば便利なものがたくさんありますが、あまり知られていないので、今回は代表的なサービスを3つ紹介します。

Open dataへのトラフィックはごくわずか

USPTOには毎月約6.8Mのトラフィックがありますが、その中でOpen dataダウンロードリクエストはわずか200件でした。また、最も人気のあるサービスでもトラフィックの2%にとどまっています

しかし、Open dataには便利なものがあるので、今回は、Patent Examination Data System (PEDS) API、Global Dossier、Patent Trial and Appeal Board (PTAB) APIを紹介します。

Patent Examination Data System (PEDS) API

このPEDSはPAIR Bulk Data serviceの後継者として作られました。2017年に始まり、定期的にアップデートがなされています。現時点でのバージョンは1.60でサーバーは900万件もの特許レコードをリクエストしています。

PEDSは使いやすいUIを持っていますが、それに加えRESTful APIを通して、開発者が簡単に特許関連のデータを収集できるようにしています。ここで提供されているデータは、patent bibliographic data, patent term data, examiner information, attorney or representative information, applicant informationなどです。

PEDSから得られるデータはJSONやXMLなどのstructured formatsで提供されています。また、ローカルの特許データベースやDocketシステムを更新する際に、PEDSを使って更新することもできます。また、PEDSはattorney docket numberでも検索やフィルターが可能です。

PEDSで提供されるデータは毎日アップデートされます。

Global Dossier

2015年から、USPTOはGlobal Dossierも提供しています。このGlobal Dossierは、無料で、安全で、包括的な特許出願情報がそろうサービスです。Global Dossierでは、公開されている特許出願と権利化された特許のfile wrapperをPDF形式で見ることができます。これは、アメリカだけにとどまらず、IP5 Officesつまり、アメリカ、中国、ヨーロッパ、韓国、日本のものにアクセスすることができます。また、Global Dossierは、WIPOに出願された国際出願にもアクセスできます。また、英語への機械翻訳も提供されます。

Global Dossierで提供されるデータも、DEDSと同じように毎日アップデートされます。

Patent Trial and Appeal Board (PTAB) API

USPTOはPTABにおける手続きに関するPDFやbibliographic dataへのアクセスも提供しています。このサービスは、PTAB Bulk Data Systemと呼ばれています。PTAB Bulk Data SystemはPEDSと同じように、使いやすいUIを持っていますが、それに加えRESTful APIを通して、開発者が簡単に特許関連のデータを収集できるようにしています。ここで提供されているデータは、application appeals, post-grant proceedings, inter partes reviewsなどです。

PEDSで提供されるデータはリアルタイムでアップデートされます。

その他のAPIs Services

他にもUSPTOが提供しているサービスはいろいろとあるので簡単に紹介します。

  • Office Action Citations API that services requests for “detailed information derived from the Office actions issued by patent examiners to applicants during the patent examination process.”
  • Office Action Rejection API that services requests for “reasons for any rejections, objections, or requirements and includes relevant information or references” extracted from Office Actions issued by an examiner.
  • USPTO Enriched Citation API that is one of the “first production implementations of the usage of artificial intelligence (AI) for data extraction at the USPTO” and services requests to locate “the statutes used by examiners, the claims rejected based on prior art, the particular prior art references cited, and specific relevant sections in the cited prior art references used.”
  • PatentsView is a web UI that leverages near real-time USPTO data to provide customizable charts and other patent data visualizations.

Open data に関するリソースや詳しい情報は、ここから確認することができます。

活用

特に、特許システムを開発しているベンダーはこのようなツールを積極的に使うべきです。USPTOが無料で提供しているデータを活用できれば、第三者から有償で得ているデータを減らして開発コストを抑えることもできるかもしれません。

また、審査官の統計、審査官別の権利化率、特許権利者情報などなど、USPTOのOpen dataを活用すれば様々なツールを開発することができます。ある程度のプログラミング知識が必要なので、万人向けとは言えませんが、知財ツールを開発する上で、USPTOのOpen Dataはとても重要な役割を果たしています。

まとめ

まだまだ活用が十分になされていませんが、USPTOのOpen Dataはとても重要な役割を果たしています。知財ツールを現在開発しているところ、もしくは、知財ツールを新たに開発したいと思っているところはUSPTOのOpen dataを一度見て、ビジネスアイデアを考えてみるのもいいかもしれません。

まとめ作成者:野口剛史

元記事著者:Andrew J. Freyer and Benno M. Guggenheimer. Brownstein Hyatt Farber Schreck LLP (元記事を見る

OLCの米国知財ニュースレター

最新まとめ記事を
毎週メールボックスにお届け

登録すると、週1回、最新まとめ記事の概要とお知らせを受け取ることができます。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

OLCとは?

OLCは、「アメリカ知財をもっと身近なものにしよう」という思いで作られた日本人のためのアメリカ知財情報提供サイトです。より詳しく>>

追加記事