Knowledge Partners 特許業務法人【名古屋の特許事務所】

Blog

AIによる「音声認識」使ってみました。

Blog > テクノロジー > AIによる「音声認識」使ってみました。 ブログ村

 年末に予定していたとおり、休み期間中にVoice Kit をいじってみました。
 年末年始、我が家ではボードゲームがブームでした。「カタンの開拓者たち」というボードゲームなのですが、非常に完成度が高く子供も大人も夢中になって楽しむことができます。このゲームは、2つのサイコロを振り、出た数の和を使って進行していきます。このため、2つのサイコロを振って出た数の和が戦略上とても重要になります。うちの子供たちは、当初、2つのサイコロを振って出た数の和を確率で推定できるということを知らず、説明してもよくわからない様子でした。そこで、出た数の和を記録してみることにしてみました。ゲーム中にサイコロを振って出た数の和を全て記録していくのです。1ゲームではサイコロを振る回数がさほど多くなく、確率を正確に反映していないため、数ゲームにわたって記録を続けないと有意な結論を導けません。
 ですが、毎回記録するのは面倒くさい。サイコロを振るたびにペンを使って数値を書き留めるだけなのですが、ゲーム中にこれを続けるのがすごく面倒くさい。
 そこで、Voice Kitの登場です。
 ゲーム中、サイコロを振るたびに2つのサイコロの数の和を発話し、発話回数を記録することにしました。Google Cloud Speechというサービスを使うと、マイクを介してraspberry PIが録音した音声をテキスト化してくれます。そこで、サイコロの数の和をテキスト化し、和の値を示すテキストである場合にその数値の発話回数を1プラスすれば、最終的に和の数がどの頻度で出現したか分かります。例えば、和が7の場合、「number seven」と発話し、7の発話回数を1プラスします。この処理を繰り返し、最後にその和を表示させるプログラムを作成しました。
 結果、数値の記録がだいぶ楽になりました。音声入力でも若干面倒には思えましたが、それでもペンで記録するよりはずいぶんとましです。音声入力が終了した時点で電子データ化されているため集計も楽でした。
 今回は、以上のような極々簡単な内容で音声認識技術を体験してみました。音声認識サービスが有用と思われる場面はたくさんあると思いますが、今回のように、あるタスク(ボードゲーム)を実行しながら別のタスク(サイコロの目の集計)も実行する場合、その一方を音声入力のみで実施可能にするサービスは非常に有用と思われます。
 そして、このようなニーズはそこら中にありそうです。GoogleのサービスやVoice Kit を使えば、「こうなっていれば便利かも」というアイディアを実現するための装置を非常に簡単に試作し、有用性を判断したり、より本質的なニーズを発掘したりすることができます。従って、音声認識を行うためのAI技術などを持っていなくても音声認識を使った発明することが可能です。。。。
 今後、音声認識に関する発明が増えるかもしれませんね。


ブログ村