Knowledge Partners 特許業務法人【名古屋の特許事務所】

Blog

弁理士の仕事をAIが奪う話

Blog > テクノロジー > 弁理士の仕事をAIが奪う話 ブログ村

 AIは人類にとって脅威なのでしょうか?
 今さら?と思えますが、AIが人間の仕事を奪うという話は未だに頻繁に話題になりますので私も少し乗っかってみたいと思います。
 有名なのは、野村総合研究所が発表したこれですね。弁理士の仕事の92.1%はAIに取って代わられるという予想もあるとか。
 根拠を探ってみましたがウェブサイトからはたどり着くことができませんでした。また、分析に利用されたデータとして 労働政策研究・研修機構「職務構造に関する研究が挙げられていましたが、この研究は、各職業に必要なスキルや知識のアンケートをとって集計したもののようです。この集計結果は、業務の具体的な内容を示しておらずAIで代替可能かどうかの議論に値する情報を全く含んでいないと思えるのですが、分析の元データは本当にこのデータなのでしょうか?

 ウェブサイトに開示されていた情報だけでは発表の内容を深く分析できないので、この発表結果は気にしないことにしてここでは弁理士の業務の代替可能性を技術的に検討してみます。
 まず、弁理士の業務を特許明細書作成業務に絞ります。弁理士の業務と言えばまずこれでしょう。先行技術文献の検索業務など他の業務もありますが、検索業務等に依拠している弁理士の数は少なく、弁理士の業務の代替可能性を考える際に特許明細書作成業務を分析することが必須と思えます。ちなみに、私自身は、検索業務のような作業系の業務はすぐにでもAIに代替されてほしいと思っています。

 現在AIと呼ばれているモノで実現性のあるモノといえば機械学習でしょうか。例えば、ニューラルネットワークに特許明細書業務を学習させるとか、強化学習で良い明細書を書けるようにするとかが想定されるのでしょうか?無理としか思えません。機械学習を進めるためには正解が必要だからです。具体的に実現しようとすれば、何が正解なのか定義しなければなりません。例えば、発明者の書いた発明提案書を明細書に変換するニューラルネットワークを考えてみましょう。この例であれば、発明者の書いた発明提案書と理想的な明細書とを対応づけた教師データを使ってニューラルネットワークに学習させることになりますね。この時点で不可能としか思えません。ある入力情報に対応する理想的な明細書なんてモノは世の中に存在しませんし、既存のデータから正解を創ることはできません。
 既存のデータ、例えば、発明提案書と出願済明細書とのセットを教師データとすれば学習は可能かもしれませんが、このセットは正解でしょうか。必ずしも正解ではなく、場合によっては品質が良くない明細書も多く存在するのではないでしょうか。こんな教師データを使って学習しても、意味のない学習しかできません。
 特に請求項は、出願人の個別の事情や発明の内容に応じてカスタマイズされる必要があります。そんなことが可能な教師データがどこにあるのでしょうか?判例でしょうか?判例に挙げられた請求項が、正解だとは思えませんし、そもそも圧倒的に数が足りません。
 上述のニューラルネットワークは私の勝手な予想であり、実際には別の理由で代替可能性が議論され得るのかもしれませんね。発明提案書を入力し、出願済明細書を出力する処理が可能であるという前提がそもそもファンタジーですし。例えば、汎用人工知能が完成すれば弁理士の業務をAIが実行することができるでしょうか?できるかもしれませんし、できないかもしれません。いずれにしても、汎用人工知能が具体化する道筋が見えていない現在においてその完成を予想し、しかも弁理士の業務が代替される可能性を予想するのは、ロジカルな話になり得るでしょうか。私にはタイムマシンが実現するか否かを予想するのと同程度の話にしか思えません。
 弁理士の業務の代替性をまじめに考えるのであれば、少なくとも、どのようなデータを使って学習させるのか明らかにするとか、業務を代替可能にする技術的アプローチを具体化するとか、そのような議論が必要なのではないでしょうか。私自身は、正解のデータを用意できる業務であれば代替される可能性が高いと思いますが、正解のデータを用意できない業務が近い将来に代替されると思えないです。

ブログ村

AIによる「音声認識」使ってみました。

Blog > テクノロジー > AIによる「音声認識」使ってみました。 ブログ村

 年末に予定していたとおり、休み期間中にVoice Kit をいじってみました。
 年末年始、我が家ではボードゲームがブームでした。「カタンの開拓者たち」というボードゲームなのですが、非常に完成度が高く子供も大人も夢中になって楽しむことができます。このゲームは、2つのサイコロを振り、出た数の和を使って進行していきます。このため、2つのサイコロを振って出た数の和が戦略上とても重要になります。うちの子供たちは、当初、2つのサイコロを振って出た数の和を確率で推定できるということを知らず、説明してもよくわからない様子でした。そこで、出た数の和を記録してみることにしてみました。ゲーム中にサイコロを振って出た数の和を全て記録していくのです。1ゲームではサイコロを振る回数がさほど多くなく、確率を正確に反映していないため、数ゲームにわたって記録を続けないと有意な結論を導けません。
 ですが、毎回記録するのは面倒くさい。サイコロを振るたびにペンを使って数値を書き留めるだけなのですが、ゲーム中にこれを続けるのがすごく面倒くさい。
 そこで、Voice Kitの登場です。
 ゲーム中、サイコロを振るたびに2つのサイコロの数の和を発話し、発話回数を記録することにしました。Google Cloud Speechというサービスを使うと、マイクを介してraspberry PIが録音した音声をテキスト化してくれます。そこで、サイコロの数の和をテキスト化し、和の値を示すテキストである場合にその数値の発話回数を1プラスすれば、最終的に和の数がどの頻度で出現したか分かります。例えば、和が7の場合、「number seven」と発話し、7の発話回数を1プラスします。この処理を繰り返し、最後にその和を表示させるプログラムを作成しました。
 結果、数値の記録がだいぶ楽になりました。音声入力でも若干面倒には思えましたが、それでもペンで記録するよりはずいぶんとましです。音声入力が終了した時点で電子データ化されているため集計も楽でした。
 今回は、以上のような極々簡単な内容で音声認識技術を体験してみました。音声認識サービスが有用と思われる場面はたくさんあると思いますが、今回のように、あるタスク(ボードゲーム)を実行しながら別のタスク(サイコロの目の集計)も実行する場合、その一方を音声入力のみで実施可能にするサービスは非常に有用と思われます。
 そして、このようなニーズはそこら中にありそうです。GoogleのサービスやVoice Kit を使えば、「こうなっていれば便利かも」というアイディアを実現するための装置を非常に簡単に試作し、有用性を判断したり、より本質的なニーズを発掘したりすることができます。従って、音声認識を行うためのAI技術などを持っていなくても音声認識を使った発明することが可能です。。。。
 今後、音声認識に関する発明が増えるかもしれませんね。

ブログ村

 おかげさまで最近大変多忙にしておりまして、ブログの更新が滞っていました。少なくとも年度末まではこのペースが続きそうですのでしっかり仕事を続けますが、合間を見つけてブログの更新も続けねばと思っているところです。
 年末年始にはまとめてお休みがとれそうですので、人工知能関連技術の学習を再開するきっかけを作ろうと思っています。冬休みの宿題として。

 みなさん、AIY Projectsってご存知でしょうか。
https://aiyprojects.withgoogle.com/
Do-it-yourself artificial intelligenceだそうです。
  私は以前からこのプロジェクトに興味を持っており、AIを動かすコンピュータ(raspberry PI)とVoice Kitを注文してありました。最近になって届きましたので、冬休みに少しいじってみたいと思っています。
 ウェブサイトによると「このプロジェクトのtook kitは我々や我々のコミュニティの問題を解決するために提供されている」とのことです。Pythonを扱える技術者なら、ささっとアプリケーションを作れそうです。誰でも安価に高度な技術を利用できるってすばらしいですね。
 Voice Kitは自分で組み立てたスピーカー、マイク一体型の装置から入力された音声でGoogle Assistantを利用したり、音声をテキスト化したり、音声でLEDを点灯させたり、いろいろなことができるようです。要するに音声入力によるアプリケーションを作ることができるということですかね。
 冬休みだけでは時間が足りないかもしれませんが、Voice Kitで遊びながら実際に開発を体験しつつ、音声認識技術を利用した特許についても考えていこうと思っています。

ブログ村

STAP細胞の米国特許の審査状況(Final OA後のInterview)

Blog > テクノロジー > STAP細胞の米国特許の審査状況(Final OA後のInterview) ブログ村

 週末(7月15~17日)の間にブログを書こうと思っていたのですが、運悪く特許庁のJ-PlatPatがメンテのため使えず、書こうと思っていた記事に必要な情報を入手できない。他にも週末にJ-PlatPatを使ってやることがあったのですがそれもできない。ちょうど、有料の特許データベースの契約を検討中だったのですが、そちらが加速しそうな感じです。

 気を取り直して、J-PlatPatが使えなくても書ける記事を急遽模索してみました。ちょっと安易ですが、日本の特許データベースがだめなら米国の特許データベースを使って書ける記事にします。

 今回は、STAP細胞の米国特許について取りあげます。STAPというのは、刺激惹起性多能性獲得(Stimulus-Triggered Acquisition of Pluripotency)のことで、少し前に大いに話題になったものです。

 あのときは論文の内容の信憑性が話題になりましたが、もちろん特許出願もなされており、米国や日本も含めて9か国に出願されているようです。STAP細胞についての米国特許出願(14/397080)の状況をUSPTOのPAIRで調べたところ、このような記録(重要なイベントのみ抜粋)となっていました。

10-24-2014 Transmittal of New Application
01-08-2015 Preliminary Amendment
07-06-2016 Non-Final Rejection
01-06-2017 Affidavit-traversing rejections or objections rule 132
01-06-2017 Applicant Arguments/Remarks Made in an Amendment
05-18-2017 Final Rejection
06-30-2017 Applicant Initiated Interview

 最初の拒絶理由通知に応じて意見書と発明者(バカンティ氏)の宣誓供述書が提出されました。しかし、審査官の心証は覆らず、2017年5月18日にファイナルの拒絶理由通知が出されました。
 最初とファイナルの拒絶理由通知で審査官が使用した根拠条文は以下のものです。

【35U.S.C.112】(a)The specification shall contain a written description of the invention, and of the manner and process of making and using it, in such full, clear, concise, and exact terms as to enable any person skilled in the art to which it pertains, or with which it is most nearly connected, to make and use the same, and shall set forth the best mode contemplated by the inventor or joint inventor of carrying out the invention.

【35U.S.C.101】Whoever invents or discovers any new and useful process, machine, manufacture, or composition of matter, or any new and useful improvement thereof, may obtain a patent therefor, subject to the conditions and requirements of this title.

【35U.S.C.102】A person shall be entitled to a patent unless

(b) the invention was patented or described in a printed publication in this or a foreign country or in public use or on sale in this country, more than one year prior to the date of the application for patent in the United States, or

 審査官はSTAP細胞の論文が取り下げられたことや否定的な再現試験の結果を当然知っており、112条(明細書が実施可能要件を満足しない点)と101条(発明がうまく働かない結果、有用性が認められない点)について突いてきています。これだけ発明の再現性(反復可能性)について否定的な状況だと見過ごすわけにいかなかったのでしょう。こういう事件を担当する審査官は大変ですね。

 ちなみに、私が担当した案件で一度だけ日本の審査官に『このような発明品は実在しないから発明が不明確であると』と指摘されたことがあります。出願人もまじめに出願しているのだから『実在しない』なんて失礼にも程があると憤りを感じましたが、証拠写真を提出して『本当にあるよ!』と反論して済ませました。バカンティ氏の宣誓供述書も概ね『STAP細胞は本当にあるよ!』という内容なんだと思いますが、簡単には信用してもらえないということのなでしょうか。

 話をSTAP細胞の拒絶理由通知に戻すと、102条についてはiPS細胞の中山先生の特許(MEF細胞を毒素(toxin)に曝すことで多機能細胞が生成できるとの記載)が引用されています。ちなみに最後に行われたメインクレームの補正は以下の通りで、哺乳動物体細胞に与えるストレスの一つとして毒素(toxin)を含んでいます。

  1. A method to generate a pluripotent cell, comprising subjecting an isolated mammalian somatic cell to a stress, wherein the stress is an environmental stimulus selected from the group consisting of
                  trauma, mechanical stimuli, chemical exposure, ultrasonic stimulation, oxygen-deprivation, radiation, exposure to extreme temperatures, dissociation, trituration, physical stress, hyperosmosis, hypoosmosis, membrane damage, toxin, extreme ion concentration, active oxygen, UV exposure, strong visible light, deprivation of essential nutrition, or and unphysiologically acidic environment;

    and selecting a cell exhibiting pluripotency.

 以上のようなファイナルの拒絶理由通知の後のイベントとして、ついこの前の6月30日に『Applicant Initiated Interview Summary (PTOL-413)』というステータスが記録されていました。このInterview Summaryを見てみると、以下のような記載となっていました。

Applicant’s representative discussed the retracted publication by the applicant’s and potential narrowing claims.  The examiner agreed with that the narrowing claims might overcome the enablement rejection depending on how much the claims narrowed and what is in the specification.

 電話インタビューの結果、クレームを減縮することにより拒絶理由が解消し得ることに審査官が同意しているようです。102条についてはクレーム減縮が有効であるように思います。しかし、112条と101条の拒絶理由の適否は、STAP細胞の再現性にかかっており、クレーム減縮で解決できるような質のものでないように思います。また、電話インタビューの記録にあるように、拒絶を克服できるか否かは『depending on・・・what is in the specification』となっています。いまさらニューマターを導入することなく、明細書の記載をどうにかできるのか疑問に思います。

 どのようにクレーム減縮がなされるのか、本当にクレーム減縮で拒絶理由を解消できるのか非常に気になるところです。

ブログ村

google アシスタント

Blog > テクノロジー > google アシスタント ブログ村

google アシスタントを試してみました。

 

 最近自分のスマートフォンでgoogle アシスタントが使えるようになりましたので、少し試してみました。
 google アシスタントは、音声または文字によって質問を入力すると、google先生が回答を返してくれるプログラムです。スマートフォンの場合には音声入力を手軽に利用できますので、音声入力を使いながらgoogle アシスタントを試してみました。
 質問を音声で入力してみたところ、ほぼ完璧に入力文を認識しました。もはや音声認識精度に驚く時代ではないのかもしれませんが、実際に試してみると、ものすごく高い精度にやっぱり驚いてしまいます(ただし、例外もありました)。

 「日本の面積を教えて」、「特許って英語でなんていう?」などと言った質問には即座に完璧に答えてくれます。便利ですねえ。
 では、特許業界のアシスタントとして使えるでしょうか?
「特許権の存続期間を教えて」、「特許権の無効理由を教えて」などいろいろ質問してみましたが、認識した文書をgoogle検索した結果が返ってきただけでした。さすがに無効理由から条文を教えてくれるとか、条文に規定された無効理由を教えてくれるなんてことはありませんでした。こんなことができる時代は来るのでしょうか。

 いろいろ試していくうちに、興味深いことも分かってきました。google アシスタントが私のこと(私のスマートフォンのデータ)を知りすぎているため、音声認識や提示内容に無用なバイアスがかかってしまうことがあるようです。
 例えば、私の名前を音声認識させようとしたのですが、何度やっても失敗しました。認識結果が妻の名前になってしまうのです。音は全く違うのですが。。。私のスマートフォンに私の名前よりも妻の名前の方が多く保存されていたからなのでしょうか?例えば、メールの宛先など。理由は定かではありませんが、この例のように、いつまでも期待した認識結果にたどり着かないことがありました。
 さらに、自分の知識外のことを知るためにgoogle アシスタントに聞いているのに、自分が知っていて当然の情報を返してくることがありました。例えば、「AIで有名な人を教えて」という質問にジェフリーヒントンさんのことを書いたウェブサイトを返してきたので、続けて「ジェフリーヒントンさんの特許出願を教えて」と入力してみました。できればgoogle patentsの検索結果を出力してほしかったのですが、Wikipedia の次に私たちのウェブサイトのブログのページを提案してきました。私たちはスマートフォンでの表示が適正であるのか否かを定期的にチェックしますので、おそらくchromeに履歴が残っていたのでしょう。しかし、それらは私たちが熟知していることなので、むしろ提案不要なのです。自分の知識外のことを知るためにgoogle アシスタントに聞いているのですから。

 google アシスタントは多くの場面で有用であり、試していてとても楽しかったですし、その多才ぶりに驚きました。今後も使いたいと思いますが、上述のように、一部においては改善が期待されるようです。google関連のサービスはものすごい速さで進歩しますので、いつの間にか改善してしまうかもしれません。定期的にウォッチしていこうと思います。

ブログ村

 先週の記事に便乗します。KickStarterにこんなもの(リンク)がありました。上海のUnihertzという企業が提案している小さいスマホです。ディスプレイはわずか2.45インチだそうです。現在主流のスマホのデグレードモデルであると思います。技術革新が盛りだくさんという類の商品ではありません。

 このようなコンセプトの商品を見ると、クレイトン・クリステンセン著の『イノベーションのジレンマ』を思い出さずにはいられません。この著書では、先行企業(巨大企業)が後発企業(新興企業)に逆転されてきた過去の実例を挙げ、その際に起きていた現象やメカニズムが詳しく説明されています。一言で説明するのは難しいのですが、『先行企業が現状の利益を維持するべく従来製品の高機能化・高性能化に注力している間に、高機能化・高性能化とはコンセプトの異なる後発企業の代替製品が多くの需要者に受け入れられ、市場が席巻されてしまう』というような話です。今回のスマホの話に当てはめると、先行企業がスマホのカメラ等の機能の改良に注力している間に、機能をそぎ落とした小型スマホが多くの需要者に支持され、市場が席巻されてしまうというようなことが将来起こるかも知れないというようなことです。ただ、『イノベーションのジレンマ』は技術経営の分野で常識レベルのことですので、当然、スマホの先行企業は対策を打っていることと思いますが...

 ここで、話をKickStarterに戻します。KickStarterのようなクラウドファウンディングの大きな特徴の一つとして、インターネット上に存在する多数の投資家が、ほぼ需要者と同じ目線を持っていることが挙げられると思います。需要者のニーズに適っている企業や商品に対して投資が集まりやすくなるので、全体的に見れば効率的な投資や技術開発が実現するのではないかと思います。また、クラウドファウンディングの投資状況を解析することにより、需要者のニーズの動向を掴むことができるようにも思います。例えば、需要者のニーズが従来製品の高機能化・高性能化に向かっているのか、それとは異なる方向に向かっているのかを先行企業が早期に察知できるのかも知れません。

ブログ村

 Tensor Flowのロゴ(例えばこのリンク)を見るといつも弁理士の役目を思い出します。このロゴはある方向から見るとT、別の方向から見るとFに見えるのですが、私は弁理士としていつもこういうスタンスで打ち合わせに臨まなきゃいかんと思っています。発明は見方を変えると全く違う姿になるぞと。。。

 さて、日本の特許業界は繁忙期なので今回は小ネタです。

 Tensor Flow。人工知能に興味のある方なら一度は耳にしたことがあると思います。実際に触ったことがある方も多いかもしれません。オープンソース化から1年ちょっと経過したようです。Tensor Flowに限らず、人工知能開発のための各種のライブラリが無料で公開されています。私は、Tensor Flow公開のニュースを聞くまで、このようなライブラリの無料公開が行われていることを知りませんでしたので、ニュースを聞いてちょっとした衝撃を受けました。Tensor Flowを使えば、素人(例えば私)でもアイディアと少しのプログラミング知識だけで、身近な問題を解決する技術を開発することができるのではないか?
 ちょっと前まで、技術開発は専門知識を身につけた人材が開発環境の整った開発部に属することで初めて実現される、ある種の特権のようなものであったと思うのです。ですが、誰でも無料でライブラリを使えるならば、人工知能開発の少なくとも一部についての障壁は存在せず、誰でも開発者になれるように思えます。ソースデータをネットで収集し、Tensor Flowを使って機械学習を行えば、結構いろいろできるように思います。

 実際、ネット上には「Tensor Flowで○○をやってみた。」といった内容の記事がたくさんアップされています。開発の障壁が下がった世界。一般人としてはとても良い世界のように思えます。ちょっとしたアイディアから意味のあるものをつくり出すことができる可能性があるわけですから。

 一方、特許業界人としてその世界を見ると、かなり大変な状況なのではないかと思います。人工知能関連技術は他の技術と比較して、進歩性ありとされる技術のレベルが極めて速い速度で上がっていくように思えるからです。専門的な知識を持った開発者が自社の設備を使って開発を進める一方、専門的な知識を持っていない人でも自分のアイディアをちょっと試してみることができる。そして、ある程度の成果が得られた場合に、それをネットで公開する人も多い。それって進歩性判定の基礎となる公知文献が、極めて速い速度で増えていくことになるのでは?少なくとも、自動車のエンジン開発等、特殊な環境が必須になる一般の分野と比較して遥かに進歩性のレベルが上昇しやすいように思えます。大変な時代になってしまったと思います。特許業界人としては。人工知能関連技術を開発し、特許化する意志のある企業はものすごい速さで出願していく必要があるように思えます。
 先日、海外企業(特に米国企業、中国企業)に比べて日本企業による人工知能関連の出願が遅れているというニュースが報じられていました。日本企業もがんばってほしいなあ~。

ブログ村

人口知能開発の疑似体験から考える特許化戦略4

Blog > テクノロジー > 人口知能開発の疑似体験から考える特許化戦略4 ブログ村

 第1回のエントリはこちら
 第2回のエントリはこちら
 第3回のエントリはこちら
ニューラルネットワークに関連した開発においては、
 1.入力データ、出力データの選定
 2.ニューラルネットワークの構造決定
以上、2つのステージでたくさん発明がうまれそうです。
1.においては、目的を達成するためにどのような入力(または出力)とすべきか。これを決定すること自体が重要な発明と言えます。今回の開発では、「文書表現上の癖」や「論理展開上の癖」で執筆者を高精度に推定可能であると検証できたこと自体が発明と言えます。
 最近はやりのディープニューラルネットワークであれば、どのような入力データが目的達成のために重要であるのか考えることなく、多数のデータを入力してディープニューラルネットワークによる学習を進めることで有用な結果が得られる可能性があります。
 しかし、そうであっても、目的の達成に大きく寄与する入力データが多数の入力データの中のどれなのかを特定することが重要であると私は考えます。特許請求項は必須の要素のみを書くべきだからです。

 

   必須の入力データAを特定できた場合の権利化戦略としては、種々の戦略が考えられます。ここではいくつかピックアップして書きたいと思います。
●まず、学習済のデータで推定を行う装置を以下のような請求項として表現した場合の戦略をいくつか挙げたいと思います。
「入力データAを取得する取得部と、
 機械学習済の情報に基づいて前記入力データAを出力データBに変換する変換部と、
 出力データBに基づいて○○を推定する推定部と、を備えるC装置。」
・入力データA(場合によっては出力データBも)が特徴であり、機械学習の過程は特徴としない。
 第1回~第3回のエントリで体験したように、入力データを決定することが発明であり、目的を達成するための重要なファクターといえます。また、機械学習を進めるための具体的な技術は汎用的な技術で充分というケースは多いと考えられます(第1回~第3回のエントリで示した例もこれに該当するように思えます)。
・学習済のデータで推定を行い、出荷後には学習しない装置においては、機械学習を行う学習部を構成要件に含めないような請求項にすることが重要になると考えられます。学習部が構成要件に含まれると、出荷前に学習し、出荷後に学習しない装置を直接侵害で差し止めること等が不可能になります。
・ただし、「機械学習済の情報に基づいて」という文言で不明瞭とならないように請求項または明細書で対策をする必要があるでしょう。機械学習を進めるための具体的な技術が汎用的な場合は、汎用的であることを明細書で説明し、発明の特徴でないならばそのことを明細書で説明して実施可能要件を充足するようにしておくべきです。
・機械学習後のパラメータ、例えば、重み係数やバイアス等は、機械学習によって作成されるため、プロダクトバイプロセスの審査基準に適合する内容になるように明細書を書いておくと好ましいと考えます。
・発明の特徴は入力データAにあるため、入力データの特徴を上位概念から下位概念に展開するのが好ましいと考えます。第1回~第3回のエントリでの例であれば、句読点の統計、接続詞の統計、文末表現の統計など、切り口はたくさんありそうです。

 

●次に、学習を行うことが可能な装置を以下のような請求項として表現した場合の戦略をいくつか挙げたいと思います。
「サンプル入力データaと正解データbの組に基づいて前記サンプル入力データaを前記正解データbに変換するパラメータを機械学習する学習部と、
 入力データAを取得する取得部と、
 前記パラメータに基づいて入力データAを出力データBに変換する変換部と、を備えるD装置。」
・ユーザーが学習と変換(入力データAの出力データBへの変換)を実施できる製品が販売されるのであれば、このクレームが有効でしょう。
・学習部を備える学習装置(取得部と変換部を備えていない装置)という請求項も検討の価値があります。
・サンプル入力データaと正解データbの組は必須の組のみを独立請求項に書き込み、開発過程で検討した他の組(例えば、正解率の向上に寄与したが、最も重要ではないような組)は従属請求項で展開すると良いと考えられます。
・利用者が装置に学習させるのであれば、方法の請求項も有効と考えられます。

 

●最後にニューラルネットワークの構造ですが、ニューラルネットワークの構造が新規であり、かつ、進歩性があれば特許はとれると考えられます。しかし、この場合は慎重に請求項を作成する必要があると考えられます。ニューラルネットワークの構造を特徴とした請求項が権利化された場合であっても、第三者の被疑製品がその請求項を利用していることを立証することが困難である場合が多いからです。
 ニューラルネットワークの構造は外部から見てブラックボックスになる場合が多いと予想されるため、ニューラルネットワークの構造自体を特許にしても有効ではない場合は多いと考えられます。第三者の被疑製品がその請求項を利用していることを立証することが事実上不可能であれば、侵害品対策のために出願しても意味がありません。他の事情(例えば、遅かれ早かれ学会で発表してしまうなど)がなければ、出願の可否から検討すべきと考えます。
・ニューラルネットワークの構造で特許を取る必要があるならば、当該ニューラルネットワークの構造を利用する装置を解析した場合に、観測できる特徴を見つける必要があると考えます。特許出願前の打ち合わせでは、観測できる特徴を見つける作業を行う必要があります。発明者様に特徴を見つけるための解析等をお願いすることも多くなるように思われます。

 

 なお、ニューラルネットワークの構造ではありませんが、機械学習で最適化されたパラメータを出願するのは有効と考えられます。例えば、機能材料の組成や材料作成の際の温度、圧力等の最適数値範囲を機械学習で特定し、当該数値範囲を請求項とすることが考えられます。
 この場合、数値範囲内の実測結果と数値範囲の境界での実測結果を明細書に記述することが通常の実務ですが、機械学習によって数値範囲を導出した過程を明細書に記述することで明細書の記載要件(実施可能要件等)を充足することは可能でしょうか?
 機械学習によって数値範囲が得られ、その範囲での効果が論理的であれば、機械学習の過程を示すことで特定の数値範囲の発明を実施可能に明細書が記述されていることに間違いはなく、記載要件が充足するケースが出てきても良いと私個人は感じます。審査官、裁判官がどのように判断するのか今のところ不明ですが、興味深いトピックのように思えます。

ブログ村

人口知能開発の疑似体験から考える特許化戦略3

Blog > テクノロジー > 人口知能開発の疑似体験から考える特許化戦略3 ブログ村

 第1回のエントリはこちら
 第2回のエントリはこちら
 第1回、第2回のエントリでは、ニューラルネットワークで明細書執筆者を高い精度で推定できたことを示しました。ただし、第1回、第2回では入力データを変化させるだけでした。ニューラルネットワークの開発では、ニューラルネットワークの構造も大きなテーマになると考えられます。ニューラルネットワークの構造としては、層の数やノードの数がまず検討対象となるでしょうが、よく知られているように、初期値を変化させるのも重要でしょうし、各種の最適化方法の利用(第1回、第2回は全てSGDでした)を検討しても良いと思います。


 いろいろな手法が考えられますが、まずは層をよりdeepにすることが考えられます。今回の開発では項目数(入力ノードの数)が最大で18個しかありませんので、deepといってもたいした数の層は必要ないと予想できます。とりあえず、「3.文書表現上の癖と、論理展開上の癖の双方」のtrainingデータとtestデータを利用し、隠れ層を2層(ノードは13個、8個)として学習しました。結果は、98%の正解率。90件のtestデータについて2件不正解ということになります。非常に高い正解率です。本件については、ディープニューラルネットワークは必要ないと言えますね。そりゃそうですよね。入力ノードが少なすぎますから。ディープニューラルネットワークの開発を疑似体験するためにはサンプルが不適切でした。まあでも入力データが執筆者の推定に適したデータであったからここまで正解率が向上したとは言えるでしょうか。


 当初は、自己符号化器などを利用しながら少しずつ正解率を向上させたいと思っていました。モダンな(といっても自己符号化器が話題になったのは10年前ですが)技術を学習したいと思っていましたから。また、単なるニューラルネットワークではなく、同一層においてあるノードの出力を他のノードに入力するなど、ネットワークの構造にも各種の工夫があり得ます。
 しかし、ここまでの結果から判断すると、現在のサンプルではニューラルネットワークの構造や各種のテクニックの有用性を判断できるほどサンプル数がないと考えられます。これ以上の改善の余地はあるのかもしれませんが、仮に、正解率が100%になったとしても、ニューラルネットワークの構造の変更等が効果的であったのか偶然なのか、サンプル数が少なすぎて判断できません。そこで、自己符号化器などを利用した開発は、将来別の案件で試してみたいと思います(今のところ、word2vecやQ学習での開発を体験できれば良いなと考えています)。


 さて、第1回~第3回までで、ニューラルネットワーク関連の開発過程を疑似体験しましたので、次回は開発過程で生じ得る発明の特許化について考えてみたいと思います。

 第4回のエントリはこちら

ブログ村

人口知能開発の疑似体験から考える特許化戦略2

Blog > テクノロジー > 人口知能開発の疑似体験から考える特許化戦略2 ブログ村

 第1回のエントリはこちら
 第1回のエントリでは、疑似開発したニューラルネットワークで明細書執筆者を高い精度で推定できたことを示しました。
 開発過程では、以下の3パターンの入力データに基づいてニューラルネットワークの学習を行いました。
 1.文書表現上の癖
 2.論理展開上の癖
 3.文書表現上の癖と、論理展開上の癖の双方
以下、それぞれのパターンについて具体的に述べていきます。

 ●「1.文書表現上の癖」
 第1回のエントリで述べたパターンです。このパターンでは、学習前に各明細書について以下の11個の項目を数値化しました。
  メインクレーム行数、メインクレーム文字数、サブクレーム平均行数、サブクレーム平均文字数、クレーム1行あたりの「、」の数、クレーム1行あたりの文字数
  明細書1段落あたりの「、」の数、明細書1段落あたりの平均文字数、明細書1文あたりの「、」の数、明細書1文あたりの文字数、明細書全文の文字数
 学習の詳細は以下の通りです。
・trainingデータ:11個の項目の数値と執筆者を対応づけた300件のデータ
・testデータ:11個の項目の数値と執筆者を対応づけた90件のデータ
・隠れ層:ノード数7の1層
・ミニバッチ:10~50程度
・最適化方法:確率的勾配降下法(stochastic gradient descent)
・イタレーション:50000回
trainingデータで以上の学習を行い、学習後のニューラルネットワークで90件のtestデータの執筆者を推定したところ、正解率は88%でした(図1)。

図1

 

●「2.論理展開上の癖」
 このパターンでは、学習前に、各明細書について以下の7個の言葉の数を計測しました。
  「しかし」、「なお」、「すなわち」、「また」、「さらに」、「ればよい」、「そして」
 私自身は、文書を論理的に展開するために、「主張、解説、論証、例示」という順序で明細書内の文章を書くことが多いです。この順序で文章を書く場合、「解説」の前に「すなわち」が現れます。このような論理展開上の癖は、執筆者毎に異なるため、段落の最初の部分や最後の部分の単語を統計処理すれば執筆者が特定できると考えました。
 学習の詳細は「1.文書表現上の癖」と同様です(ただし、隠れ層のノード数は5個)。
trainingデータで以上の学習を行い、学習後のニューラルネットワークで90件のtestデータの執筆者を推定したところ、正解率は79%でした(図2)。

図2


 以上のように、「1.文書表現上の癖」を入力データとした場合に88%、「2.論理展開上の癖」を入力データとした場合に79%の正解率が得られました。この結果は私の直感と違いましたので、少し戸惑いました。私自身で執筆者を推定する場合には、句読点の数等よりも執筆者特有の論理展開が現れるか否かに着目するからです。
「2.論理展開上の癖」の方が、単に入力データの項目数が少ないために正解率に差が出ているだけかもしれませんが、それでも、執筆者の推定に「1.文書表現上の癖」が有効であることは分かりました。今回の成果に基づいて本気で特許出願をするのであれば「1.文書表現上の癖」を入力データとするという観点で権利化することは外せないでしょう。さらに、比較すると多少正解率が少なくなるものの、「2.論理展開上の癖」であっても79%もの正解率が得られるため、特許出願するならば「2.論理展開上の癖」を入力データとするという観点で出願することにもなるでしょう。

 「1.文書表現上の癖」「2.論理展開上の癖」の一方を入力データにした場合に有意な正解率が得られたため、双方を入力データにするとより正確な推定が可能であると考えられます。そこで、
●「
3.文書表現上の癖と、論理展開上の癖の双方」
 についても学習を行いました。「1.文書表現上の癖」「2.論理展開上の癖」のそれぞれで利用した入力データを結合してtrainingデータとtestデータを作成しました。学習の詳細は「1.文書表現上の癖」と同様です(ただし、隠れ層のノードは11個)。trainingデータで以上の学習を行い、学習後のニューラルネットワークで90件のtestデータの執筆者を推定したところ、正解率は93%でした(図3)。90件のtestデータの中の84件は執筆者を正確に推定できたことになります。

図3

 
 明細書の執筆者を推定するための入力データとして「1.文書表現上の癖」「2.論理展開上の癖」「3.文書表現上の癖と、論理展開上の癖の双方」が有効であることは実証されました。
一方、ニューラルネットワークの開発においては、ネットワークの構造を最適化することが必須になると考えられます。次回は、ネットワークの構造を変化させた結果を報告します。

 第3回のエントリはこちら
 第4回のエントリはこちら

ブログ村

次ページへ »