* 音声対話・音声言語理解 [#vcc8287f]

&ref(test.png,nolink,center,400x250);

音声や画像の合成に関する分野 †
音声対話は,人間から与えられた発話に対して,コンピュータが応答を
返すために必要となる技術です.この技術を用いることで,人間とコン
ピュータがコミュニケーションを取ることが可能となります.音声を用いるシステムであるため,キーボードやマウスを用いるよりも操作が直感的であり,利用者の負担を軽減させる事ができる利点があります.また,音声対話システムの構成は複雑なので,幅広く研究が行われています.
さらに,本研究室で開発された音声認識や音声合成の技術を利用して,名工大2号館1階に大学内の教員情報や天気予報などの情報案内などを行う「名工大音声情報案内端末」
を設置しています.このシステムの設置を通じて,本研究室の成果を使って社会に貢献すると同時に実際の環境における性能のテストなども行っています.

    * テキスト音声合成
    * 話者補間
    * 固有声
    * 歌声合成
    * 感情音声合成
    * 唇合成
    * 手話動画像合成
** 分野 [#h3006ec7]
- 音声対話システムの構築
- 応答選択
- 話し言葉認識


音声や画像の認識に関する分野 †
** 具体的なテーマ例 [#u04dfd45]

    * 連続音声認識
    * 音声による個人認識
    * 顔画像による個人認識
    * リップリーディング
    * 手書き文字認識
    * ジェスチャー認識
    * 手話認識
    * バイモーダル個人認識
- 音声情報案内端末の構築
- 人間からの質問発話に対して頑健な応答文選択手法


符号化に関する分野 †

    * 低ビーットレート音声符号化


具体的なテーマ例 †

    * 声による話者認識を利用したセキュリティシステムの構築
    * 不特定話者連続音声認識システム構築のための話者適応化手法に関する研究
    * 高速な音声認識のための階層化された確率・統計モデルに関する研究
    * 隠れマルコフモデルに基づくテキスト音声合成システムの実現 -喜んだり悲しんだりするコンピュータを目指して-
    * 声質変換システムの構築に関する研究
    * 固有声に関する研究
    * 歌声合成に関する研究
    * 極低ビットレート(100 bit/s)音声符号化システムの構築
    * 顔動画像と音声を用いた個人識別 -より頑健なセキュリティシステムの実現-
      マルチモーダル音声合成のための任意テキストからの唇動画像生成
    * 自動リップリーディング(読唇)のための動画像認識モデルに関する研究
    * 個人識別 / リップリーディングのための顔画像からの自動パーツ抽出
    * ジェスチャー認識/手話認識に関する研究
    * 手話動画像合成に関する研究
    * 擬人化エージェント





トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS