* 研究内容 - 音声認識 [#xf67d5d7] ** はじめに [#d2dc5acb] > 音声認識とは,人が話した音声をコンピュータに理解させて文字データにすることです.~ この技術によって,音声でロボットやコンピュータの操作を行うことができます. ** HMM音声認識 [#a0ef36c7] > 音声認識は一般的に,音響的特徴をもつ音響モデルと言語的特徴をもつ言語モデルの2つについて別々に研究されます.~ 本研究室でよく研究されている音声認識技術であるHMM音声認識は,音響モデルをHMM(隠れマルコフモデル)と呼ばれる確率モデルに基づいてモデリングしています. ** 研究分野 [#a783d056] *** 連続音声認識 [#j6f1afbe] > 音声を解析して文章に変換します.~ より高い音声認識精度を得るための研究です. //> 音声を解析して文字データにすることで, //音声を入力インターフェースにする技術です. *** 話者適応 [#s7b73313] > 人間の声質は性別や年齢によって様々な特徴を持っており,様々な声質を 高い精度で認識することは難しいですが, 子供向けのシステムなら子供向けに,女性向けのシステムなら女性向けに 音声認識システムを特化することでより高性能なシステムが期待できます.~ 特定の話者へのシステム特化に関する研究です. //> 性別や年齢の違いによって声の特徴が異なりますが、 //この違いに影響されずに音声認識を行うための研究です。 *** 話者識別 [#ge277210] > 入力された音声から誰の声であるかを識別したり,登録されている話者かどうかを判別する技術です.~ セキュリティシステムや会議での話者ごとの音声自動アーカイブ化などに利用される研究です. //** 研究テーマ例 [#c6beaec5] //- 声による話者認識を利用したセキュリティシステムの構築 //- 不特定話者連続音声認識システム構築のための話者適応化手法に関する研究 //- 高速な音声認識のための階層化された確率・統計モデルに関する研究 //- [[顔動画像と音声を用いた個人識別 -より頑健なセキュリティシステムの実現- マルチモーダル音声合成のための任意テキストからの唇動画像生成>https://www.sp.nitech.ac.jp/~demo/]]