【徳田・南角・橋本研究室】 - ホーム/研究内容の履歴ソース(No.2)

* 研究内容 [#zba81399]

> 徳田・李研究室では，人とコンピュータ，コンピュータとコンピュータとのコミュニケーションをめざして，マルチモーダル情報空間におけるヒューマンインターフェースに関する研究を行っています．~
主に音声や画像を扱っており，研究テーマによって大きく３つのグループに分けられます．~

** 研究テーマ [#meeef75c]

*** 音声や画像の合成に関する分野 [#t5a6d284]

- テキスト音声合成
- 話者補間
- 固有声
- 歌声合成
- 感情音声合成
- 唇合成
- 手話動画像合成

*** 音声や画像の認識に関する分野 [#db70554a]

- 連続音声認識
- 音声による個人認識
- 顔画像による個人認識
- リップリーディング
- 手書き文字認識
- ジェスチャー認識
- 手話認識
- バイモーダル個人認識

*** 符号化に関する分野 [#uc317279]
- 低ビーットレート音声符号化

** 具体的なテーマ例 [#hb6c9376]

- 声による話者認識を利用したセキュリティシステムの構築
- 不特定話者連続音声認識システム構築のための話者適応化手法に関する研究
- 高速な音声認識のための階層化された確率・統計モデルに関する研究
- 隠れマルコフモデルに基づくテキスト音声合成システムの実現 [[-喜んだり悲しんだりするコンピュータを目指して-:https://www.sp.nitech.ac.jp/~demo/emotion_demo.ppt]]
- [[声質変換システムの構築に関する研究:https://www.sp.nitech.ac.jp/~demo]]
- [[固有声に関する研究:https://www.sp.nitech.ac.jp/~demo]]
- 歌声合成に関する研究
- [[極低ビットレート(100 bit/s)音声符号化システムの構築:https://www.sp.nitech.ac.jp/~demo/demo2/]]
- 顔動画像と音声を用いた個人識別 -より頑健なセキュリティシステムの実現-~
[[マルチモーダル音声合成のための任意テキストからの唇動画像生成:https://www.sp.nitech.ac.jp/~demo/]]
- [[自動リップリーディング（読唇）のための動画像認識モデルに関する研究:https://www.sp.nitech.ac.jp/~demo/demo1/]]
- 個人識別 / リップリーディングのための顔画像からの自動パーツ抽出
- [[ジェスチャー認識／手話認識に関する研究:https://www.sp.nitech.ac.jp/~demo/jesture.pdf]]
- 手話動画像合成に関する研究
- 擬人化エージェント

* 表彰 [#sa21fd51]

- 日本音響学会 粟屋潔学術奨励賞 (受賞者:全炳河)('06)
- 日本音響学会 粟屋潔学術奨励賞 (受賞者:李晃伸)('02)
- (社)電子情報通信学会「第57回 論文賞」('00)
- (社)電子情報通信学会「第7回 猪瀬賞」('00)
- (財)電気通信普及財団「第16回 電気通信普及財団賞 (テレコムシステム技術賞)」('00)
- 日本音響学会 粟屋潔学術奨励賞 (受賞者:宮島千代美)('99)
- (財)電気通信普及財団 テレコムシステム技術学生賞 (受賞者:小石田 和人)('98)