![]() |
音声認識とは、人が話した音声をコンピュータに理解させて文字データにすることです。音声認識技術によって、音声でロボットやコンピュータの操作を行うことができます。
音声認識は一般的に、音響的特徴をもつ音響モデルと言語的な特徴をもつ言語モデルの2つについて別々に研究されます。本研究室でよく研究されているHMM音声認識は、音響モデルを隠れマルコフモデル(HMM)と呼ばれる確率モデルに基づいて音声認識を行うことです。
音声を解析して文字データにすることで、音声を入力インターフェースにする技術です。
性別や年齢の違いによって声の特徴が異なりますが、この違いに影響されずに音声認識を行うための研究です。
入力された音声から誰の声であるかを識別したり、登録されている話者かどうかを判別する技術です。セキュリティシステムや会議での話者ごとの音声自動アーカイブ化などに利用されます。