* 研究内容 - 画像処理 [#b2ec8749]
* 研究内容 - 画像処理 [#u8bed548]

** 分野 [#d66b5ea7]
** はじめに [#jce7f247]
> 普段,人間は意識せずに人や物を目で見て認識します.~
しかし,コンピュータやロボットにこの仕組みを行わせるにはどうすればよいのでしょうか?~
この問題に対し,本研究室ではセキュリティシステムや福祉分野への応用を目指して研究活動を行っています.

- 唇動画像合成
- 手話動画像合成
- 顔画像による個人認識
- リップリーディング
- 手書き文字認識
- ジェスチャー認識
~ 人間同士のコミュニケーションにおいて,音声による表現だけでなくジェスチャー
を加えて表現することによって,より深く,正確に相互理解を深めている.なぜなら
ジェスチゃーには,身体状態の外見を表しているだけでなく,人間の意思や感情など
の内面的な情報を多く含んでいることがあるからである.~
 また近年では,人間とコンピュータが対話する場面も増えてきている.また,コン
ピュータと対話するためには入力インタフェースとしてキーボード,マウスなどがあ
げられるが,まだそれらを扱いきれない人もたくさんいる.このことから,より柔軟
性の高い高度なインターフェースが求められてきているが,その一つの対策として最
近では音声認識により音声による入力が用いられるようになってきている.しかし音
声のみでは正確性に欠けるところがあるため,人間同士のコミュニケーションと同じ
く,その音声とともにジェスチャーによる個人の特徴をコンピュータが認識できるよ
うになれば,より正確に,人間同士が行なうコミュニケーションと同様のコミュニケー
ションを人とコンピュータ間でできるようになる.このような理由から,コンピュー
タによるジェスチャー認識は重要であると考えられる.
- 手話認識
~ 現在, 日本には約36 万人の聾者がいると言われている. 彼らの対話手段の1 つとし
て手話が挙げられるが, 聴者の中で手話を使える人は少なく, 双方の対話に隔たりがで
きてしまう. このようなときに, コンピュータを介することによって相互の対話を支援
する目的から, 手話認識システムに関する研究を行っている.
- バイモーダル個人認識
~ 個人認識技術では, これまでに, 声, 顔, 指紋, 網膜, 筆跡などのバイオメトリック情
報と呼ばれる人間のもつ個人特有の情報を利用した個人認識の研究が行なわれてきた.
しかし, 単一特徴のみを用いての認識では結果が不安定になる. 音声などの聴覚情報の
みを用いた場合, 周囲の様々な雑音により認識率が低下し, また, 顔画像などの聴覚情
報のみを用いた場合は, 照明などの撮影環境による明るさや位置のずれなどが認識率に
影響する. このような問題の対処として,聴覚情報に視覚情報を加えたバイモーダル
情報を用いた個人認識の研究を行っている.
** 研究分野 [#f46c13d7]

** 研究テーマ例 [#p70fc6e7]
*** 顔画像による個人認識 [#v50012f1]

- [[顔動画像と音声を用いた個人識別 -より頑健なセキュリティシステムの実現- マルチモーダル音声合成のための任意テキストからの唇動画像生成:https://www.sp.nitech.ac.jp/~demo/]]
- [[自動リップリーディング(読唇)のための動画像認識モデルに関する研究:https://www.sp.nitech.ac.jp/~demo/demo1/]]
- 個人識別 / リップリーディングのための顔画像からの自動パーツ抽出
- [[ジェスチャー認識/手話認識に関する研究:https://www.sp.nitech.ac.jp/~demo/jesture.pdf]]
- 手話動画像合成に関する研究
> 人間の顔をセキュリティシステムの個人認証に用いることを考えます.~
相手が人間ならいわゆる「顔パス」が通用しますが,コンピューターにと
っては簡単なことではありません.~
認証エラーが生じにくい,頑健なシステムの実現を目指しています.
//しかも背景,照明,顔の位置の変化が多々生じます.~

*** 手話認識  [#g6948053]
> 聴覚障害者と健常者とのスムーズなコミュニケーションを補助するシステム
の構築を目指しています.
//[[詳細はこちら:https://www.sp.nitech.ac.jp/~demo/jesture.pdf]]

*** 手話動画像合成 [#db056943]

> 入力した文章を手話に翻訳し,その動画像を生成する研究です.~
聴覚障害者と健常者とのスムーズなコミュニケーションを図るための
インターフェイス構築に有効です.

*** 唇動画像合成 [#gb553b52]

> 入力した文章の通りに唇を動かす動画像を生成する研究です.~
CGのキャラクターの動作設計等への応用が期待できます.~
[[デモはこちら:https://www.sp.nitech.ac.jp/~demo/gtalk_lip/splip.php]]

*** リップリーディング [#nff58b6f]
> いわゆる読唇術をコンピューターに行わせるための研究です.~
福祉分野での応用が期待されます.~
[[デモはこちら:https://www.sp.nitech.ac.jp/~demo/demo1/]]

//*** 手書き文字認識 [#c212b354]
//最近の携帯ゲーム機では自分の書いた文字を使ってゲームができますよね?~
//あれってすごいですよね.そういった手書きの文字を,高精度でコンピュー
//ターに認識させる仕組みに関する研究です.

//*** バイモーダル個人認識 [#e91008f7]
//「マガーク効果」いう現象が知られています.この現象は,人間同士の会話において
//聴覚情報だけでなく,視覚情報がいかに重要かを物語っています.本研究室では
//音声認識で培った技術と画像認識の技術を組み合わせて,より精度の高い認識
//システムの実現を目指します.~
//(ここにマガーク効果のデモへのリンクを貼る?)
//** 研究テーマ例 [#i36ee5c4]
//?





トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS