* 研究内容 - 画像処理 [#b2ec8749]
** はじめに [#qdc79609]
 〜人間が人や物を目で見て認識し,理解する〜~
 普段我々が意識せずに行っていることですが,コンピュータやロボットにこの仕組みを行わせるには
どうすればよいのでしょうか? この問題に対して,本研究室では特に
セキュリティシステムや福祉分野への応用を目指して研究活動を行っています.
** 研究分野 [#f46c13d7]
*** 唇動画像合成 [#gb553b52]
 好きな文章を入力すると,その通りに唇の動画像を生成してくれる技術です.~
 [[デモはこちら:https://www.sp.nitech.ac.jp/~demo/gtalk_lip/splip.php]]
*** 手話動画像合成 [#db056943]
 好きな文章を入力すると,その通りに手話の動画像を生成してくれる技術です.
*** 顔画像による個人認識 [#l04f4397]
 人間の顔をセキュリティシステムの個人認証に用いることを考えます.~
 相手が人間なら,いわゆる「顔パス」が通用しますよね? でもコンピューターにとっては簡単なことではありません.また,顔画像の背景が変わったり,照明が暗かったり,顔の位置がずれることなどは多々あります.
その際,認証エラーが起こらないための頑健なシステム実現を目指してゆきます.
*** リップリーディング [#nff58b6f]
 いわゆる読唇術をコンピューターに行わせるための技術です.~
 福祉分野での応用が期待されます.~
 [[デモはこちら:https://www.sp.nitech.ac.jp/~demo/demo1/]]
*** 手書き文字認識 [#c212b354]
 最近の携帯ゲーム機では自分の書いた文字を使ってゲームができますよね?~
 あれってすごいですよね.そういった手書きの文字を,高精度でコンピューターに認識させる仕組みに関する研究です.
*** ジェスチャー認識・手話認識  [#g6948053]
 聴覚障害者と健常者とのスムーズなコミュニケーションを,コンピュータを援用しながら行うための研究です.~
 [[詳細はこちら:https://www.sp.nitech.ac.jp/~demo/jesture.pdf]]
*** バイモーダル個人認識 [#e91008f7]
 「マガーク効果」いう現象が知られています.この現象は,人間同士の会話において
聴覚情報だけでなく,視覚情報がいかに重要かを物語っています.本研究室では
音声認識で培った技術と画像認識の技術を組み合わせて,より精度の高い認識
システムの実現を目指します.~
(ここにマガーク効果のデモへのリンクを貼る?)
** 研究テーマ例 [#i36ee5c4]


** 分野 [#d66b5ea7]

- 唇動画像合成
- 手話動画像合成
- 顔画像による個人認識
- リップリーディング
- 手書き文字認識
- ジェスチャー認識
~ 人間同士のコミュニケーションにおいて,音声による表現だけでなくジェスチャー
を加えて表現することによって,より深く,正確に相互理解を深めている.なぜなら
ジェスチゃーには,身体状態の外見を表しているだけでなく,人間の意思や感情など
の内面的な情報を多く含んでいることがあるからである.~
 また近年では,人間とコンピュータが対話する場面も増えてきている.また,コン
ピュータと対話するためには入力インタフェースとしてキーボード,マウスなどがあ
げられるが,まだそれらを扱いきれない人もたくさんいる.このことから,より柔軟
性の高い高度なインターフェースが求められてきているが,その一つの対策として最
近では音声認識により音声による入力が用いられるようになってきている.しかし音
声のみでは正確性に欠けるところがあるため,人間同士のコミュニケーションと同じ
く,その音声とともにジェスチャーによる個人の特徴をコンピュータが認識できるよ
うになれば,より正確に,人間同士が行なうコミュニケーションと同様のコミュニケー
ションを人とコンピュータ間でできるようになる.このような理由から,コンピュー
タによるジェスチャー認識は重要であると考えられる.
- 手話認識
~ 現在, 日本には約36 万人の聾者がいると言われている. 彼らの対話手段の1 つとし
て手話が挙げられるが, 聴者の中で手話を使える人は少なく, 双方の対話に隔たりがで
きてしまう. このようなときに, コンピュータを介することによって相互の対話を支援
する目的から, 手話認識システムに関する研究を行っている.
- バイモーダル個人認識
~ 個人認識技術では, これまでに, 声, 顔, 指紋, 網膜, 筆跡などのバイオメトリック情
報と呼ばれる人間のもつ個人特有の情報を利用した個人認識の研究が行なわれてきた.
しかし, 単一特徴のみを用いての認識では結果が不安定になる. 音声などの聴覚情報の
みを用いた場合, 周囲の様々な雑音により認識率が低下し, また, 顔画像などの聴覚情
報のみを用いた場合は, 照明などの撮影環境による明るさや位置のずれなどが認識率に
影響する. このような問題の対処として,聴覚情報に視覚情報を加えたバイモーダル
情報を用いた個人認識の研究を行っている.

** 研究テーマ例 [#p70fc6e7]

- [[顔動画像と音声を用いた個人識別 -より頑健なセキュリティシステムの実現- マルチモーダル音声合成のための任意テキストからの唇動画像生成:https://www.sp.nitech.ac.jp/~demo/]]
- [[自動リップリーディング(読唇)のための動画像認識モデルに関する研究:https://www.sp.nitech.ac.jp/~demo/demo1/]]
- 個人識別 / リップリーディングのための顔画像からの自動パーツ抽出
- [[ジェスチャー認識/手話認識に関する研究:https://www.sp.nitech.ac.jp/~demo/jesture.pdf]]
- 手話動画像合成に関する研究





トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS