【徳田・南角・橋本研究室】 - ホーム/研究内容/音声合成の履歴(No.9)

履歴一覧
差分を表示
現在との差分を表示
ソースを表示
ホーム/研究内容/音声合成へ行く。
- 1 (2008-05-08 (木) 14:12:44)
- 2 (2008-05-09 (金) 06:46:03)
- 3 (2008-05-13 (火) 11:17:36)
- 4 (2008-05-15 (木) 06:27:40)
- 5 (2008-05-16 (金) 09:19:10)
- 6 (2008-05-19 (月) 02:16:42)
- 7 (2008-05-22 (木) 15:38:38)
- 8 (2008-07-15 (火) 05:57:32)
- 9 (2008-07-15 (火) 05:57:41)
- 10 (2008-09-05 (金) 05:19:28)

研究内容 - 音声合成

はじめに

音声合成とはコンピュータに人間のような自然な発話をさせる技術です．
より滑らかで，より自然な発声にする研究を進めています．

HMM音声合成

音声合成には単位選択型など様々な手法が提案されていますが，本研究室では主に隠れマルコフモデル(HMM)などの統計的な枠組みに基づいた手法を扱っています．
HMM音声合成システムではHMMに基づいて，音声に含まれる特徴量を統計的にモデル化して音声を合成します．

研究分野

テキスト音声合成

任意のテキストから音声を合成する技術です．
Text To Speech (TTS) とも呼ばれています．

話者補間

複数話者のモデルを組み合わせて，新しい話者のモデルをつくり出す技術です．
デモンストレーションはこちら

固有声

複数の話者や話し方のスタイルを少量のパラメータによるモデル空間で表し，それらのパラメータに重み付けすることで任意の声質を表現して音声を合成する技術です．
様々は声質，話し方を生み出すことができます．

歌声合成

歌詞や楽譜を与えることで，任意の歌を合成する技術です．
エンターテインメントやアミューズメントの分野においてさまざまな用途が期待できます．

声質変換

ある話者の音声をあたかも別の話者の話した音声のように変換する技術です．
2人の話者の発話データからモデルを学習し，一方の話者の発話データをもう一方の話者の発話データに変換します．

話者適応

目標とする話者の少量のデータから，HMMのモデルパラメータを変換し，目標話者の声質を変換する技術です．