[[ホーム/研究内容/音声対話]]
* 研究内容 - 音声対話・音声言語理解 [#vcc8287f]

* 音声対話 [#a4a49359]
CENTER:&ref(mei-chan.jpg,nolink);

&ref(test.png,nolink,center,500x300);
** はじめに [#q261a170]

音声や画像の合成に関する分野 †
> 音声対話は,人間から与えられた発話に対してコンピュータが応答を
返すために必要となる技術です.~
この技術を用いることで,人間とコン
ピュータがコミュニケーションを取ることができます.~
//音声を用いるシステムであるため,キーボードやマウスを用いるより
//も操作が直感的であり,利用者の負担を軽減させる事ができる利点があります.
また,音声対話システムの構成は複雑なので幅広く研究が行われています.~
//さらに,本研究室で開発された音声認識や音声合成の技術を利用して,
//名工大2号館1階に大学内の教員情報や天気予報などの情報案内などを
//行う「名工大音声情報案内端末」
//を設置して,本研究室の成果を使って社会に貢献すると同時に実際の
//環境における性能のテストなども行っています.

    * テキスト音声合成
    * 話者補間
    * 固有声
    * 歌声合成
    * 感情音声合成
    * 唇合成
    * 手話動画像合成
** 分野 [#h3006ec7]


音声や画像の認識に関する分野 †
*** 話し言葉認識 [#z419ad5d]

    * 連続音声認識
    * 音声による個人認識
    * 顔画像による個人認識
    * リップリーディング
    * 手書き文字認識
    * ジェスチャー認識
    * 手話認識
    * バイモーダル個人認識
> 話し言葉は,書きことばと違って言い誤りや言い淀み,話し方など
によって認識の性能が左右されます.~
このような話しことばに対して認識の性能を向上させようとする研究
が話し言葉認識です.


符号化に関する分野 †
*** 応答選択 [#f67d8fda]

    * 低ビーットレート音声符号化
> システムは,人間から与えられた質問に対してどのような応答を返
すのが適切かを選びます.~
どのような基準で応答を行えばシステムの性能が向上するのかを考え
る研究が応答選択です.


具体的なテーマ例 †
*** 音声対話システムの構築 [#fe5d5ad6]

    * 声による話者認識を利用したセキュリティシステムの構築
    * 不特定話者連続音声認識システム構築のための話者適応化手法に関する研究
    * 高速な音声認識のための階層化された確率・統計モデルに関する研究
    * 隠れマルコフモデルに基づくテキスト音声合成システムの実現 -喜んだり悲しんだりするコンピュータを目指して-
    * 声質変換システムの構築に関する研究
    * 固有声に関する研究
    * 歌声合成に関する研究
    * 極低ビットレート(100 bit/s)音声符号化システムの構築
    * 顔動画像と音声を用いた個人識別 -より頑健なセキュリティシステムの実現-
      マルチモーダル音声合成のための任意テキストからの唇動画像生成
    * 自動リップリーディング(読唇)のための動画像認識モデルに関する研究
    * 個人識別 / リップリーディングのための顔画像からの自動パーツ抽出
    * ジェスチャー認識/手話認識に関する研究
    * 手話動画像合成に関する研究
    * 擬人化エージェント
> 本研究室で開発された音声認識・音声合成の技術を利用した,大学内
の教員情報や天気予報などの情報案内などを行う「名工大音声情報案
内端末」を名工大2号館1階に設置して,社会に貢献すると同時に実環
境におけるシステム性能のテストなどを行います.

//** 具体的なテーマ例 [#u04dfd45]
//- 音声情報案内端末の構築
//- 人間からの質問発話に対して頑健な応答文選択手法





トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS