![]() |
音声認識とは,人が話した音声をコンピュータに理解させて文字データにすることです.
この技術によって,音声でロボットやコンピュータの操作を行うことができます.
音声認識は一般的に,音響的特徴をもつ音響モデルと言語的特徴をもつ言語モデルの2つについて別々に研究されます.
本研究室でよく研究されている音声認識技術であるHMM音声認識は,音響モデルをHMM(隠れマルコフモデル)と呼ばれる確率モデルに基づいてモデリングしています.
音声を解析して文章に変換します.
より高い音声認識精度を得るための研究です.
人間の声質は性別や年齢によって様々な特徴を持っており,様々な声質を 高い精度で認識することは難しいですが, 子供向けのシステムなら子供向けに,女性向けのシステムなら女性向けに 音声認識システムを特化することでより高性能なシステムが期待できます.
特定の話者へのシステム特化に関する研究です.
入力された音声から誰の声であるかを識別したり,登録されている話者かどうかを判別する技術です.
セキュリティシステムや会議での話者ごとの音声自動アーカイブ化などに利用される研究です.