【徳田・南角・橋本研究室】 - ホーム/研究内容/音声認識の履歴の現在との差分(No.2)

履歴一覧
差分を表示
ソースを表示
履歴を表示
ホーム/研究内容/音声認識へ行く。
- 1 (2008-05-08 (木) 17:59:49)
- 2 (2008-05-09 (金) 08:42:32)
- 3 (2008-05-13 (火) 13:21:03)
- 4 (2008-05-19 (月) 08:59:42)
- 5 (2008-05-21 (水) 07:40:01)
- 6 (2008-10-07 (火) 05:36:26)

追加された行はこの色です。
削除された行はこの色です。

* 音声認識 [#xf67d5d7]
* 研究内容 - 音声認識 [#xf67d5d7]

音声や画像の合成に関する分野 †
** はじめに [#d2dc5acb]

    * テキスト音声合成
    * 話者補間
    * 固有声
    * 歌声合成
    * 感情音声合成
    * 唇合成
    * 手話動画像合成
> 音声認識とは，人が話した音声をコンピュータに理解させて文字データにすることです．~
この技術によって，音声でロボットやコンピュータの操作を行うことができます．

↑
音声や画像の認識に関する分野 †
** HMM音声認識 [#a0ef36c7]

    * 連続音声認識
    * 音声による個人認識
    * 顔画像による個人認識
    * リップリーディング
    * 手書き文字認識
    * ジェスチャー認識
    * 手話認識
    * バイモーダル個人認識
> 音声認識は一般的に，音響的特徴をもつ音響モデルと言語的特徴をもつ言語モデルの2つについて別々に研究されます．~
本研究室でよく研究されている音声認識技術であるHMM音声認識は，音響モデルをHMM(隠れマルコフモデル)と呼ばれる確率モデルに基づいてモデリングしています．

↑
符号化に関する分野 †
** 研究分野 [#a783d056]

    * 低ビーットレート音声符号化
*** 連続音声認識 [#j6f1afbe]

↑
具体的なテーマ例 †
> 音声を解析して文章に変換します．~
より高い音声認識精度を得るための研究です．

    * 声による話者認識を利用したセキュリティシステムの構築
    * 不特定話者連続音声認識システム構築のための話者適応化手法に関する研究
    * 高速な音声認識のための階層化された確率・統計モデルに関する研究
    * 隠れマルコフモデルに基づくテキスト音声合成システムの実現 -喜んだり悲しんだりするコンピュータを目指して-
    * 声質変換システムの構築に関する研究
    * 固有声に関する研究
    * 歌声合成に関する研究
    * 極低ビットレート(100 bit/s)音声符号化システムの構築
    * 顔動画像と音声を用いた個人識別 -より頑健なセキュリティシステムの実現-
      マルチモーダル音声合成のための任意テキストからの唇動画像生成
    * 自動リップリーディング（読唇）のための動画像認識モデルに関する研究
    * 個人識別 / リップリーディングのための顔画像からの自動パーツ抽出
    * ジェスチャー認識／手話認識に関する研究
    * 手話動画像合成に関する研究
    * 擬人化エージェント
*** 話者適応 [#s7b73313]

> 人間の声質は性別や年齢によって様々な特徴を持っており，様々な声質を
高い精度で認識することは難しいですが，
子供向けのシステムなら子供向けに，女性向けのシステムなら女性向けに
音声認識システムを特化することでより高性能なシステムが期待できます．~
特定の話者へのシステム特化に関する研究です．

*** 話者識別 [#ge277210]

> 入力された音声から誰の声であるかを識別したり，登録されている話者かどうかを判別する技術です．~
セキュリティシステムや会議での話者ごとの音声自動アーカイブ化などに利用される研究です．