- 追加された行はこの色です。
- 削除された行はこの色です。
* 画像処理 [#l05ef6b7]
* 研究内容 - 画像処理 [#b2ec8749]
音声や画像の合成に関する分野 †
** 分野 [#d66b5ea7]
* テキスト音声合成
* 話者補間
* 固有声
* 歌声合成
* 感情音声合成
* 唇合成
* 手話動画像合成
- 唇動画像合成
- 手話動画像合成
- 顔画像による個人認識
- リップリーディング
- 手書き文字認識
- ジェスチャー認識
- 手話認識
- バイモーダル個人認識
↑
音声や画像の認識に関する分野 †
** 研究テーマ例 [#p70fc6e7]
* 連続音声認識
* 音声による個人認識
* 顔画像による個人認識
* リップリーディング
* 手書き文字認識
* ジェスチャー認識
* 手話認識
* バイモーダル個人認識
- [[顔動画像と音声を用いた個人識別 -より頑健なセキュリティシステムの実現- マルチモーダル音声合成のための任意テキストからの唇動画像生成:https://www.sp.nitech.ac.jp/~demo/]]
- [[自動リップリーディング(読唇)のための動画像認識モデルに関する研究:https://www.sp.nitech.ac.jp/~demo/demo1/]]
- 個人識別 / リップリーディングのための顔画像からの自動パーツ抽出
- [[ジェスチャー認識/手話認識に関する研究:https://www.sp.nitech.ac.jp/~demo/jesture.pdf]]
- 手話動画像合成に関する研究
↑
符号化に関する分野 †
* 低ビーットレート音声符号化
↑
具体的なテーマ例 †
* 声による話者認識を利用したセキュリティシステムの構築
* 不特定話者連続音声認識システム構築のための話者適応化手法に関する研究
* 高速な音声認識のための階層化された確率・統計モデルに関する研究
* 隠れマルコフモデルに基づくテキスト音声合成システムの実現 -喜んだり悲しんだりするコンピュータを目指して-
* 声質変換システムの構築に関する研究
* 固有声に関する研究
* 歌声合成に関する研究
* 極低ビットレート(100 bit/s)音声符号化システムの構築
* 顔動画像と音声を用いた個人識別 -より頑健なセキュリティシステムの実現-
マルチモーダル音声合成のための任意テキストからの唇動画像生成
* 自動リップリーディング(読唇)のための動画像認識モデルに関する研究
* 個人識別 / リップリーディングのための顔画像からの自動パーツ抽出
* ジェスチャー認識/手話認識に関する研究
* 手話動画像合成に関する研究
* 擬人化エージェント