近年、生成AIの発展により、さまざまな分野での活用が期待されています。その中で特許業界でも、生成AIの利用によって業務の効率化や品質向上が図れるのではないかと注目されています。そこで今回は、アメリカの特許出願におけるオフィスアクション(OA)対応に生成AIを活用できるかどうかを検証しました。
最初に結論を言うと、それなりのものができたと思います。
しかし、すべてAIで自動生成することは現実的でなく、1つのプロンプトですべての作業ができるわけでもありません。そのため実務レベルで生成AIを使うには、経験とノウハウが必要になってきます。今回は、この経験則が必要な部分を実際の特許出願を用いて重点的に検証してみました。
なるべく詳細に検証結果を記していたら情報量がとても多くなってしまいました。そこで今回は『準備編』として、今回の検証に至るまでの経緯、そして、生成AIに取り込むデータについての検証を中心とした内容を話します。その後、次回以降で、生成AIを使ったOA・先行文献・クレームの検証とOA対応の実務を紹介していく予定です。
今回の検証に至るまでの経緯
自分自身も生成AIを日常的に使うようになり、その利点や弱点を徐々に理解するようになりました。しかし、知財の分野におけるAI活用はまだ始まったばかりで、知財プロフェッショナルの中でも生成AIをどのように使ったらいいのかわからない人が多いと思います。
そこで提案したいのが『アメリカのOA対応への生成AIの活用』です。
生成AIを他言語の媒体に使うことはとても有効な手段ですし、全く関係ない業務をしていたとしても、今回の検証で紹介されている「AIと人間の作業分担に対するアプローチ」や、「取り扱う作業や案件の選択」などは、実務で生成AIを導入する際に活用できるポイントです。このような実践的なコンテンツで知財の業務に特化した内容のものはあまりないと感じたので、今回の取り組みを始めました。
なお今後AIを用いた検証については、「検証記事」という新しいカテゴリーで特集されていきます。
なぜアメリカのOA対応に生成AIを使うべきなのか?
今回アメリカのOA対応を対象に検証しようと思った背景には理由が3つあります。
1つ目は期待される費用対効果の高さです。アメリカの代理人費用は高額です。しかし、業務の多くを日本で行うことで、現地代理人の作業軽減ができれば、代理人費用を抑えることが期待できます。2つ目は言語の壁の高さです。英語のOAを取り扱うには英語のスキルが必要ですが、生成AIを使うことで担当者の英語スキルのハードルが低くなることが期待されます。最後の理由は、情報の機密性が低いことです。特許明細書を作成するときとは異なり、アメリカでOAが発行される時にはすでに出願が公開されているというケースがほとんどです。そのため、技術内容に関する秘匿性をそれほど気にせずに生成AIを使える環境が整っています。
このようにアメリカのOA対応という業務は生成AIとの相性がよく、導入した際の恩恵も大きいという特徴があります。
どのようにAIと人間がやる作業を分担するべきか?
最初は生成AIにすべて自動でOA対応をしてもらおうとしましたが、うまく行きませんでした。
適切な情報を提供し、明確なプロンプトで指示すれば、OA対応のドラフトは提案してれます。しかし、担当者がOAの内容を正確に理解しないと生成AIが作り出すOA対応の評価ができず、また検証の結果、生成AIはクレーム補正はあまり得意でないことがわかりました。
そのため、知財の知識を持った担当者がおこなう作業と、生成AIにサポートしてもらう作業を細かく分けて、それぞれの得意分野で力を発揮してもらうというハイブリット方式を採用しました。どのようにAIがやる作業と人間がやる作業を分担するべきかという課題は実践を通してでしか学べない部分なので、単なるプロンプトの紹介だけでなく、この作業分担に対する思考プロセスも検証では意識をしてコメントしています。
まずは簡単な特許出願の検証から始める
今回の検証に用いた案件はシンプルな発明で、OA対応も単純なものです。
そのため生成AIを使わなくても十分対応可能な案件だと思います。しかし、実務的に簡単な案件だからこそ、生成AIの活用部分に重点を置いた検証ができたのだと思います。
検証ではうまくいった「正解」だけでなく、実際に手を動かしていたときに直面した生成AIならではの問題や試験的な使い方も紹介しています。またプロンプトによる生成AIの使い方だけでなく、普段の実務における作業プロセスにどのように生成AIを用いるかを意識して検証しています。その中で、どの作業をAIにサポートしてもらい、どの作業を(生成AIに頼らないで)担当者が手作業で行うべきかについても解説しているので、参考にしていただければ幸いです。
今後様々な特許出願のOA対応に関して生成AI活用の考察を進めていきます。その中でより汎用性の高い米国OA対応における生成AIの活用に関する知見を蓄積して、皆さんと共有できたらと思っています。
まだ1件目の検証ですが、英語のOA対応にも関わらず、生成AIを用いることでほぼすべての作業を日本語ですることが可能でした。長期の円安、そしてアメリカにおける物価高と権利化にかかる費用の増加で、アメリカにおける権利化コストを見直しているところが多いと思います。そうなると必然的により多くの作業を日本側で行うという発想になりますが、生成AIを使うことによって、担当者の英語スキルのレベルを緩和することができ、よりフレキシブルに新しい人材をコストの高いアメリカOA対応に当てることで、コストダウンを図ることができるようになるかもしれません。この点だけでも生成AIを導入する検討を進めることに価値はあるのかなと思いました。
少し長くなりますが、以下の検証では、再現性を重視して実際に使用したプロンプトや生成AIからのアウトプットも掲載しています。この機会にぜひ自分で手を動かして生成AIの可能性を試してください。
求められるOA対応の基準
生成AIを用いてOA対応を行う上で、どのような基準でOA対応の品質を評価すべきでしょうか。ここでは拒絶理由に対する優れた回答が満たすべき条件について考えてみます。
基準その1:すべての拒絶理由への対応
まず優れたOA対応は、拒絶理由通知に記載されているすべての拒絶理由に漏れなく対応していなければなりません。審査官が指摘した問題点を一つでも見落とすことは不備になる可能性があるので、大前提としてすべての拒絶理由を解消するようなクレーム補正・主張が行われていなければなりません。
生成AIを活用する際も、担当者は原本である拒絶理由通知の内容を確認し、その全体像を正確に把握した上で、最終的にアウトプットされたOA対応が、それぞれの拒絶理由に適切に対応できているかを確認する必要があります。
基準その2:理論的な主張に基づく反論
拒絶理由に対して(クレーム補正をおこなわずに)反論する場合、単に審査官の指摘に反発するだけでは説得力に欠けます。優れた反論は、関連する法規や判例、技術常識等に基づいた理論的な主張に裏付けされている必要があります。
生成AIを用いて反論主張をおこなう時も同じで、必要に応じて担当者が関連情報を適切に入力し、AIが生成した反論内容が論理的で説得力のあるものになっているかを吟味しなければなりません。特に、生成AIは一見説得力のある表現ではあるものの内容に間違えが含まれているものを生成することもあります。そのため担当者の能力とチェック体制がOA対応の質に大きく影響を及ぼします。
基準その3:クレーム補正の際のサポートの提示と拒絶解消の理由説明
拒絶理由を解消するためにクレームを補正する場合、補正事項が明細書や図面に記載された範囲内でサポートされていることを示す必要があります。また、補正によってどのように拒絶理由が解消されるのかを明確に説明しなければなりません。
生成AIを活用してクレーム補正案を考慮する際は、AIが生成した補正案がサポート要件を満たし、その補正によって拒絶理由が解消されることが明確に説明されていることを慎重に確認しなければなりません。
この検証では、最終的なOA対応の書面が以上の3つの条件を満たすかを評価しています。案件ごとにOA対応の方法や表現は様々ですが、この3つの条件は必ず満たす必要があるので、統一された指標としてこの基準を採用しています。
追加評価要素:実際のOA対応書類との比較
この検証ではすでに権利化されている案件を用いて生成AIの可能性を考察しています。そのため、過去に実際に提出されたOA対応の書類を見ることができます。実際の特許弁護士が対価を得て作成した書類なので、問題集で言うところの「答え」に当たるものです。
このような理由から過去に実際に提出されたOA対応をベンチマークとし、検証において作成されたOA対応と比較し、本質的な内容の違いや形式的な違いを生成AIで分析し、最後に類似値を数字化しています。
リアルタイムで対応しなければいけない実際の案件ではこのようなことはできませんが、「答え合わせ」による教訓や生成AI活用のアプローチの改善点などが見いだせると思うので、このような比較を行うことにしています。
次の章では、実際にどのような特許を対象に検証を行ったのかを紹介します。
今回対象とした特許
今回はFordの特許 US11932154B2を選びました。この特許は2024年3月19日に許可された比較的新しい特許です。
展開可能なワークデスクを持つ車両に関する発明

発明の名称は「Vehicle having deployable work desk」で、車両内に搭載された収納可能な作業用デスクに関する発明です。具体的には、車両のキャビン内のダッシュボードに支持され、ダッシュボードの上の収納位置とダッシュボードから外側に伸びる展開位置との間で移動可能なデスクを備えた車両が開示されています。このデスクは、複数の相互接続されたパネルを含み、パネルにはダッシュボードの少なくとも一部に沿って曲がるようにトラックと係合するように構成された金具が設けられています。また、デスクは収納位置と展開位置との間で移動する際にトラックに沿って可動になっています。
このように可動部分はあるものの機械的な発明で、概要と図を参照しただけでも比較的簡単に発明の要点がわかるような特許となっています。
審査履歴は1回のOA対応で特許査定
この特許の審査履歴を確認したところ、わずか1回のOA対応で特許査定に至っていることがわかりました。また審査履歴から拒絶理由の内容や実際に出願人がおこなったOA対応の内容を確認したところ、技術面でも特許法における実務面でも複雑な要素は何もなく特許査定になっていたことが確認できました。
このように発明の内容が明確で拒絶理由への対応もシンプルな案件は、生成AIを用いたOA対応の検証に適していると考えられます。AIの能力を評価する上で、まずはこのような比較的扱いやすい案件で検証してみようと思います。
次の章では、実際に生成AIを使ってOA対応を行う上での一般的な注意点について見ていきます。
生成AIを使う上での注意点
生成AIを特許業務に活用する場合、この検証では触れないいくつかの重要な注意点があります。
今回の検証ではすでに審査が終わり権利化された特許の公開情報を元に生成AIを実務で活用する上での考察をおこなっています。そのため取り扱う情報はすべて開示されており、出願人や発明に関する非公開情報は何も知りません。そのためすべてを公開しても何も問題ないのですが、実際にクライアントから依頼された案件の場合は当然ながら様々な制約が存在します。
そのような制約をすべて網羅するものではありませんが、ここではAIを使用する上での実務ガイドライン、実際の案件で行う際に気をつけること、そして、想定している担当者のスキルレベルについて言及します。
AIを使用する上での実務ガイドライン
生成AIは非常に強力なツールですが、最終的にはその出力内容を人間が評価し、責任を持つ必要があります。米国特許商標庁(USPTO)は2024年4月11日に「Guidance on Use of Artificial Intelligence-Based Tools in Practice before the USPTO」と題するガイダンスを発行し、USPTOにおける手続きに関連してAIツールを使用する際の法的・倫理的な考慮事項を明確化しました。このガイダンスは、実務家がAIを責任ある方法で活用するための指針を提供することを目的としています。
したがって、生成AIを用いてOA対応を行う際は、このガイドラインに従う必要があります。そのためにもOA対応では、まず担当者自身が拒絶理由の内容を正確に理解し、AIが生成した内容が適切であるかを十分に確認する必要があります。
実際の案件におけるその他の注意点
実際の案件で生成AIを使用する際は、様々な配慮が求められます。特に、以下のような点には十分な注意と配慮が求められます:
- 生成AIを使用することによる情報の漏洩リスクへの対策
- 顧客や技術データの適切な管理
- 生成AIの使用について顧客への開示と許可の取得
- アメリカ現地代理人との円滑な連携
- 所内での知見の共有と継続的な学習
この中でも特に生成AIを使用することによる情報の漏洩リスクへの対策は万全にしておきましょう。と言っても、今回のようなアメリカ出願の場合、最初のOAを受け取る時点でほぼすべてのケースにおいて特許出願は公開されています。公開されていれば、明細書の中身や拒絶理由通知の内容はだれでも見れるので、今回の検証で取り扱うデータを生成AIに取り込むことで情報漏えいが発生するリスクは少ないです。
しかし、特許というとても重要で(公開までは)機密性の高い情報を取り扱うので、関連情報の取り扱いには細心の注意を払い、顧客の理解と同意を得ながら生成AIの活用を進めることが重要になるでしょう。
このような課題に関しては、以前記事を書いたニューヨーク州の弁護士会による倫理ガイダンスがいい参考資料になると思います。原文のレポートは80ページにも渡る長文ですが、日本語で要点をまとめた記事を書いているので、参考にしていただければ幸いです。
想定している担当者のスキルレベル
生成AIはツールの1つに過ぎないので、実際の案件ではOA対応を行う担当者のスキルレベルも重要な要素の1つになってきます。
この検証では当業者として「一般的なスキル」を持つ人を担当者とし、以下のようなスキルレベルを想定しています。
- 特許法の基礎的な知識を持っており、過去に拒絶理由の対応をしたことがある
- アメリカの特許法に関してはよくある拒絶理由とその解消方法について理解している
- 発明の分野における基礎知識は持っているが、案件の発明内容の詳細に関する事前知識は持っていない
- 拒絶理由の内容や引用文献の詳細に関する事前知識は持っていない
- 英語は理解できるが、日本語の方が作業効率が圧倒的に良い
- 生成AIはChatGPTなどをたまに使い、その特性と弱点に対して大まかな理解がある
生成AIに関する項目以外、通常の業務で求められる基礎知識とあまり変わらないと思います。また生成AIに関しても、高いレベルの知識は求められておらず、その仕様と利点・弱点を知っていればいいので、簡単なトレーニングと慣れでクリアーできるスキルレベルになっていると思います。
今回の特徴としては、アメリカのOA対応をすることになるのですが、それほど高い英語スキルが求められていない点でしょう。生成AIを用いることで、英語の文献であっても日本語でその情報源について理解を深めることができるため、通常は必須とされてきた高い英語力は必要ありません。もちろん、英語力が高いことに越したことはありませんが、成果物に対する影響度としては生成AIなしの作業よりも小さいと言えるでしょう。
その代わりと言ってはなんですが、新しく重要になってくるスキルは、生成AIのアウトプットを鵜呑みにせず、常に批判的に検討する姿勢です。生成AIは便利なツールで、賢く使うことで業務作業を改善することができます。しかし、OA対応を含む特許・知財に関わる業務は、成果物の正確性が重要になります。そのため、生成AIのアウトプットをそのまま使用するのではなく、専門家としての知識と経験に基づいて内容を精査し、必要な修正を加えることが不可欠となります。
また、生成AIを効果的に活用するには、適切なプロンプトを設計し、AIとの対話を通じて目的に合った結果を導き出すスキルも求められます。これには、特許・知財分野の深い理解と、AIの特性や限界を把握することが重要です。
さらに、生成AIの発展に伴い、特許・知財業務のあり方自体も変化していくことが予想されます。新たな技術に柔軟に適応し、AIと人間の強みを組み合わせた革新的な業務プロセスを構築していくことが、これからの専門家に求められるスキルといえるでしょう。
生成AIは強力なツールですが、それを使いこなすには人間の知恵と経験が欠かせません。特許・知財分野の専門家は、AIと共に歩みながら、より高度な業務の実現を目指していく必要があるのです。OLCでは知財プロフェッショナル向けのAI関連記事も数多く掲載しています。ぜひ参考にしてみてください。
使用した生成AI
今回の検証では、OpenAIのChatGPTを使用し、言語モデルはGPT4を使っています。
今回は知名度が一番高いChatGPTを使用しましたが、生成AIは常に新しいものが発表され、その性能も日進月歩で良くなっていくので、今後は様々なツールを使ってみようと思います。直近では、ChatGPTの最新言語モデルのGPT4oや、GPT4を超えていると一部で評価されているAnthropic のClaude 3 Opusなどを検証することを予定しています。
プロンプトとアウトプットの表示について
この検証では再現性を重視して実際に使用したプロンプトや生成AIからのアウトプットも掲載しています。しかし、実際のプロンプトやアウトプットを全文この記事に記載すると膨大な情報量になるので、必要に応じて検証する上で重要な部分のみをこの記事で紹介し、全文に関してはGitHubで公開する形式を取っています。
原則、この本文におけるプロンプトの記載は以下のような形式になります:
「ここにプロンプトが表示されます」
次に生成AIからのアウトプットの記載は以下のような形式になります:
「ここに生成AIからのアウトプットが表示されます」
このように本文とは異なる表示フォーマットとなるので見やすいと思います。また、どちらも本文で一部しか掲載していない場合でも、全文を記載したGitHubのリンクがすぐ下に置いてあります。
検証におけるOA対応の作業の流れ
今回は生成AIを使ったアメリカOA対応の書類作成ですが、作業の大まかな流れは生成AIを使用しない通常の業務作業プロセスとそれほど違いはありません。
具体的には、以下のような作業プロセスになります:
- 拒絶理由通知の理解
- オリジナルクレームの理解
- 引用文献の理解
- OA対応の戦略と具体的な補正案の考察
- クレーム補正案の作成
- Remarksにおける主張や補正に関するコメントの作成
これらの作業プロセスの1つ1つで生成AIが優れている部分を特定し、生成AIを用いて作業の効率化を図っていきます。
USPTOから入手できるPDFは生成AIに不向き?
生成AIを用いてOA対応を行う際、まず最初に行うべきことは使用するAIツールが拒絶理由通知の内容を正確に理解することです。しかし、USPTOから入手したPDFデータをそのまま生成AIに読み込ませると、思わぬ落とし穴にはまる可能性があります。そこでここではPDFデータを扱う際の注意点について解説します。
PDFの内容を生成AIが正しく読み取れない可能性がある
一般的にアメリカのUSPTOから発行された拒絶理由通知は現地代理人からPDF形式で受け取ることがほとんどだと思います。
PDFはドキュメント形式で人間には読みやすい情報フォーマットですが、テキストデータの埋め込み方次第では生成AIにとっては扱いづらい情報になってしまうようです。特に、USPTOから入手したPDFは、ChatGPTをはじめとする生成AIツールでの読み込みに関して問題が多発する傾向にあります。

例えば、今回考察するFordの特許の拒絶理由通知を見てみましょう。この拒絶理由通知は公式の審査履歴が閲覧できるUSPTOのPatentCenterから入手しました。具体的には、Fordの特許案件の審査履歴から最初の拒絶理由通知(Non-Final Rejection)を探し、リンクされているPDFをダウンロードしました。

一見すると通常のよく見る拒絶理由通知ですが、この拒絶理由通知のPDFをChatGPTにアップロードしたところ、おかしな挙動が見受け取れました。(ChatGPTではモデルをGPT4にした場合、赤丸で囲ったクリップアイコンが表示されるので、それをクリックすると任意のファイルがアップロードできます。)
以下のようなプロンプトでアップロードしたPDFの内容を確認しました。
添付ファイルはあるアメリカ特許出願の拒絶理由通知です。添付された情報を元に、どのような拒絶が出されているのかを日本語で解説してください
このプロンプトに対するChatGPTの回答は以下の通りです:
拒絶理由通知には、出願された特許クレームが先行技術によって新規性がない(35 U.S.C. § 102)とされていることが記載されています。この通知では、特定の先行文献が指摘されており、それに基づいて各クレームが先行技術と重複している部分が詳細に説明されています。また、一部のクレームについては、先行技術との類似性により、非自明性の欠如(35 U.S.C. § 103)も指摘されています。これらの理由に基づき、審査官は特許を拒絶しています。
これに対して、対応策としては、拒絶理由を克服するための修正案を提出する、あるいは先行技術との相違点を明確にすることにより、クレームの新規性や非自明性を主張することが考えられます。
一見アップロードした拒絶理由通知に関して説明しているように見えますが、具体的なクレーム番号や先行文献が示されておらず、一般的な拒絶理由の説明に留まっています。これはChatGPTがPDFの内容を正しく読み取れていないことを示しています。
また、ChatGPTが返してきた内容が実際のPDFに書かれている拒絶理由の内容と全く異なるものであることは、実際にPDFの拒絶理由通知を見れば簡単にわかります。
例えば、実際のPDFを確認すると、3ページ目にClaim 19に対する「Claim Objections」とClaims 1-3, 10-11, 17-19に対する「Claim Rejections – 35 US4C § 103」が書かれており、特定のクレームに対して拒絶理由が述べられていることがわかります。また、11ページに行くとClaims 4-6, 9, 12-15, 20は許可可能なクレームとして記載されていることがわかります。
しかし、ChatGPTの回答を見ると、このような特定のクレームに関わる情報は何も記載されておらず、全く関係のない新規性に関する記載があると回答していました。
このような簡単な検証から、今回USPTOから直接入手したPDFデータをChatGPTにそのまま読み込ませても、ChatGPTが正しく内容を理解していないことがわかりました。
このようにChatGPTをはじめとする生成AIに情報をPDF等の添付ファイル形式で提供する場合、生成AIがアップロードしたファイルのデータに問題なくアクセスできているかを確認する必要があります。この確認を怠って、生成AIがデータにアクセスできていない状態で作業を進めても正確でない回答が返ってきてしまいますので、注意してください。
PDFの中身をコピーする場合でも注意が必要
PDFの内容をAIが読み取りやすい形式にする方法の一つとして、PDFの内容をコピーしてワードなどに貼り付けて、PDFのテキストデータだけ手作業で抽出するという手段があります。この手段はシンプルで有効的な方法の1つですが注意も必要です。
例えば、今回の拒絶理由通知のOAをPDFビューアーで開き、そのテキストデータをコピーしてワードに貼り付けた時のデータの一部は以下のようになっています。

1つ目の赤枠で囲ったところは、書類のヘッダー部分で、ページが変わる事に文章の間に追加されます。また、今回のOAでは図が挿入されているためか、2つ目の赤枠で囲った部分のように、図近くのテキストデータのフォーマットがおかしくなっています。そして、矢印で示しているように、文の句切れでない部分で改行されてしまっている箇所も多々あります。
この程度の乱れであれば、生成AIの認識にそれほど大きな影響を与えません。しかし、なるべくクリーンで生成AIが取り扱いやすいデータを提供することは大切な心構えなので、PDFのデータのコピペではこのような文の乱れが起こる可能性があることを知っておくことは大切です。
次の章では、今回の検証で使った生成AIにとって扱いやすいデータ形式について説明します。
生成AIフレンドリーな情報ソース
USPTOから入手したPDFの拒絶理由通知をそのまま読み込ませても、生成AIが正しく内容を理解できないことがわかりました。そこで、USPTOから取得できる拒絶理由通知のフォーマットの中で一番生成AIと相性がいいフォーマットを検証してみましょう。

USPTOは今回検証する拒絶理由通知に関して4つのフォーマットを提供しています。PDFは検証済みなので、ここでは他の3つのフォーマットを見ていきます。
安定のDOCXフォーマット

まず最初はDOCXフォーマットですね。これはワードのデフォルトフォーマットで、皆さんも頻繁に使っているので説明は不要でしょう。開くとOAの文章部分が表示され、フォーマットも維持されていて、文字のコピーも簡単んです。
特に何も特別なプログラムや作業をすることなく、OAの重要な部分のテキストデータを取得できるので、DOCXフォーマットはデフォルトで提供されている情報の中では一番使いやすいフォーマットだと思います。

PDFの時と同じように、DOCXファイルをそのままChatGPTにアップロードし、その内容に関する簡単な質問をしてみました。

すると具体的でPDFの拒絶理由通知の内容に沿った回答が生成されたので、ChatGPTがDOCXフォーマットの拒絶理由通知を理解していることがわかります。
PNCフォーマットは画像データのみ

2番目はPNCファイルですが、これは拒絶理由通知の中で参照されている図に関する画像データでした。なので拒絶理由通知の本文に関わるものではありません。
XMLフォーマットもコピペするといける

XMLフォーマットの拒絶理由通知は、タグ情報が含まれていて一見読みづらいですが、赤枠で囲っている部分のように拒絶理由通知の情報が構造化されて収まっています。(上の画像はXMLフォーマットの拒絶理由通知をGoogle Chromeのブラウザで開いたものの一部です。)
XMLは、データの構造を記述するためのマークアップ言語です。HTMLと似ていますが、XMLはデータの構造と意味の記述に特化しており、設定ファイル、ウェブサービスの通信、オフィス文書のフォーマットなど、幅広い用途で使用されています。
XMLファイルもちゃんと拒絶理由に関するテキストデータが含まれているのですが、ファイルをそのままChatGPTにアップロードすると、ChatGPTが読み取れないというトラブルが発生しました。

そこで、Google Chromeで一度XMLファイルを開き、そのデータだけを抽出して同じ質問をしたところ、ちゃんと答えが返ってきました。


回答を見ると、具体的でPDFの拒絶理由通知の内容に沿った回答が生成されたので、ChatGPTがxmlフォーマットの拒絶理由通知を理解していることがわかります。
生成AIにベストなドキュメントの構造はマークダウンフォーマット
このようにDOCXでもXMLフォーマットでも、ChatGPTは拒絶理由通知の中身を理解することができました。しかし、生成AIに与える情報の構造として一番ベストなのはマークダウン(Markdown)フォーマットです。
その理由は、プログラミングのドキュメンテーションで多様されているフォーマットで、テキストボックスにコピーしても文章構造を示す情報が維持されるため、生成AIが文章構造を理解しながら、情報を処理できるところにあります。
例えば、以下の部分をDOCXとマークダウンで比較してみましょう。

DOCXフォーマットではワードなどの専用のソフトでは上記の画像のように、中央揃えの段落、行頭文字段落番号、太文字などの文章構造が正しく表示されています。

しかし、この部分をコピーしてChatGPTなどの生成AIの入力画面に入れると、そのようなフォーマット情報が失われます。そのため文章構造が少し分かりづらくなります。

その一方で同じ文章をマークダウンにすると、上記のように対応する書式に応じて簡単な記号が追加された状態で表示され、文章構造が維持された状態で情報を取り扱うことができます。
このようなマークダウンはプログラミングのドキュメンテーションでも多様されているので、ChatGPTなどの生成AIもマークダウンで構造化されたデータの取り扱いに長けています。
今回検証しているOAはPDFにしても11ページ程度で、複雑な文構造ではないので、DOCXでもマークダウンでも今回行った検証の結果に大差はないと思われます。しかし、より膨大な情報を生成AIに読み込ませたり、文章構造が複雑な情報を正確に読み取らせたい場合は、データを一度マークダウンフォーマットに直してから生成AIに提供することをおすすめします。
便利ツール:DOCXをMarkdownへ変換できるPacdoc
ちなみに、DOCXをMarkdownに変換するツールは多々ありますが、個人的にはPacdocを使っています。PacdocはコマンドラインでDOCXをMarkdownに変換するので、ターミナル画面での操作に慣れていないと少しハードルが高いです。しかし、日本語でもpandocでWordファイルをMarkdownへ変換する方法のチュートリアルはたくさんあるので、慣れると簡単に取り扱うことができます。また、PacdocはDOCXからMarkdownに変換できるオンラインツールも公開しているので、気軽に試したい方はそちらを使ってみるのもありでしょう。
今回検証で使用するOAはマークダウン形式に変換したものを採用
せっかくなので、今回はDOCXのフォーマットの拒絶理由通知をPacdocを使ってマークダウンフォーマットに変換したものを活用したいと思います。また参考までに、1st_OA.docxというMarkdownの元データとなるDOCXフォーマットのOA、1st_OA.md というマークダウンフォーマットのOA、そして、マークダウンファイルの内で参照されている画像が保存されているmediaフォルダーをDropboxにアップしたので、自分でマークダウン形式にフォーマットする際に活用してみてください。

マークダウンフォーマットのOAに対しても同様の質問をしたところ、似た答えが返ってきたので、ChatGPTが適切にマークダウンフォーマットの情報を理解していることがわかります。
このように、生成AIを効果的に活用するためには、AIが読み取れる適切なデータを準備し、データを整える作業が不可欠です。そして、本格的にAIを使った作業に入る前に、与えた情報をAIが正しく理解できているか確認することを忘れないようにしましょう。
次の検証記事では、準備したマークダウンフォーマットの拒絶理由通知を用いて、生成AIで拒絶理由をより深く理解する方法を検証していきます。
続きはこちら↓