【南角・橋本研究室】 - ホーム/研究内容/音声認識の履歴(No.5)

履歴一覧
差分を表示
現在との差分を表示
ソースを表示
ホーム/研究内容/音声認識へ行く。
- 1 (2008-05-09 (金) 00:59:49)
- 2 (2008-05-09 (金) 15:42:32)
- 3 (2008-05-13 (火) 20:21:03)
- 4 (2008-05-19 (月) 15:59:42)
- 5 (2008-05-21 (水) 14:40:01)
- 6 (2008-10-07 (火) 12:36:26)

研究内容 - 音声認識

はじめに

音声認識とは、人が話した音声をコンピュータに理解させて文字データにすることです。音声認識技術によって、音声でロボットやコンピュータの操作を行うことができます。

HMM音声認識

音声認識は一般的に、音響的特徴をもつ音響モデルと言語的な特徴をもつ言語モデルの2つについて別々に研究されます。本研究室でよく研究されているHMM音声認識は、音響モデルを隠れマルコフモデル(HMM)と呼ばれる確率モデルに基づいて音声認識を行うことです。

研究分野

連続音声認識

音声を解析して文字データにすることで、音声を入力インターフェースにする技術です。

話者適応

性別や年齢の違いによって声の特徴が異なりますが、この違いに影響されずに音声認識を行うための研究です。

音声による個人認識

入力された音声から誰の声であるかを識別したり、登録されている話者かどうかを判別する技術です。セキュリティシステムや会議での話者ごとの音声自動アーカイブ化などに利用されます。

研究テーマ例

声による話者認識を利用したセキュリティシステムの構築
不特定話者連続音声認識システム構築のための話者適応化手法に関する研究
高速な音声認識のための階層化された確率・統計モデルに関する研究
顔動画像と音声を用いた個人識別 -より頑健なセキュリティシステムの実現- マルチモーダル音声合成のための任意テキストからの唇動画像生成