職業能力開発技術誌 技能と技術 Vol.48 2013年6号 通巻第272号
32/54

-30-技能と技術 2/2013ロエレクトロニカ社のCコンパイラを採用した。4.1.3 音声認識モジュールについて 今回利用した音声認識モジュールは,音声認識開始前に,以下3つのモードのいずれかを選択する必要がある。① 特定話者モード(SDモード) SVモードと合わせて任意のフレーズを32個登録できる。フレーズを登録学習させた話者と,一致する話者でないと認識ができないモード。② 不特定話者モード(SIモード) あらかじめ登録されている計25個のフレーズ(ワードセットは3種類)に対して,話者を特定せず認識できるモード。あらかじめ登録されているフレーズを表6に示す。 SIモードでは,音声認識開始前にワードセットNo.の指定が必要である。③ 話者特定モード(SVモード) 登録したフレーズを最大5人の話者で区別して認識できるモード。同一フレーズでも話者を区別して認識可能。 音声認識モジュールは,エンドユーザへ以下のような反応を返す。 * 認識成功(Recognition OK) 認識成功とは,学習登録したフレーズもしくはあらかじめ登録されているフレーズ(例えば「上」)を,話者が発声し一致した場合である。 * 認識失敗(Recognition Error) 認識失敗とは,制限時間内に話者が発声しないような無音声な場合,もしくは発声したが音声認識モジュールが認識できない雑音レベルだった場合である。 * 誤認識(Error) 誤認識とは,認識失敗と異なり,話者が発声したフレーズとは想定外の学習登録したフレーズもしくはあらかじめ登録されているフレーズで認識した場合である(例えば,「上」と発声したのに「下」で認識した)。4.1.4 音声認識モジュール各モードの動作検証 平成24年11月2日(金)に対象者宅で,音声認識モジュールの各モードの動作検証を行った。下位コントローラーが未完成だったため,音声認識モジュールと付属のアプリケーションソフト(EasyVR)を利用し検証した。① 特定話者モード(SDモード)の動作結果 本来ならフレーズ登録した話者のみ認識するモードだが,フレーズ登録者以外の話者でも認識成功してしまった。② 不特定話者モード(SIモード)の動作結果 あらかじめ登録されているフレーズであれば,不特定の話者で認識した。ここで意図的にあらかじめ登録されているフレーズを含む歌を,対象者宅のTVから流した結果,認識成功してしまった。③ 話者特定モード(SVモード)の動作結果 フレーズ登録したそれぞれの話者で認識した。しかしながら,フレーズ登録した話者であっても,声のトーン,イントネーション,フレーズ時間(話す速度)によって誤認識および認識失敗することがわかった。 以上の結果から,テーブルを上昇下降する「上」と「下」があらかじめフレーズとして登録されている不特定話者モード(SIモード)を,下位コントローラーで採用することとした。4.2 不特定話者モード(SIモード)処理手順 音声認識モジュールは,PICマイコンのUARTによる通信方法で制御できる。認識処理の流れを図18に示す。 ①認識開始コマンドでSIモードおよびワードセットを指定する。図18ではワードセットNo.2を指ワードセットNo.登録フレーズ1アクション,進め,曲がれ,走れ,見ろ,攻撃,止まれ,こんにちは2左,右,上,下,前,後ろ3ゼロ,イチ,ニ,サン,ヨン,ゴ,ロク,ナナ,ハチ,キュウまたはク,ジュウ表6 SIモード登録フレーズ

元のページ 

10秒後に元のページに移動します

※このページを正しく表示するにはFlashPlayer10.2以上が必要です