【徳田・南角・橋本研究室】 - ホーム/研究内容/音声合成の履歴(No.7)

研究内容 - 音声合成

&ref(): File not found: "speechsynthesis.jpg" at page "ホーム/研究内容/音声合成";

音声合成は機械に人間のような自然な発話をさせる技術です．
機械による発話をより滑らかで自然なものにする研究を進めています．

音声合成には単位選択型など様々な手法が提案されていますが，本研究室では主に隠れマルコフモデルなどの統計的な枠組みに基づいた手法を扱っています．
HMM音声合成システムではHMMに基づき，音声に含まれる特徴量を統計的にモデル化して音声を合成します．

任意のテキストから音声を合成する技術です．
Text To Speech (TTS) とも呼ばれています．

複数話者のモデルを組み合わせて，新しい話者のモデルをつくり出す技術です．

デモンストレーションはこちら

複数の話者や話し方のスタイルを少量のパラメータによるモデル空間で表し，それらのパラメータに重み付けすることで任意の声質を表現して音声を合成する技術です．

歌詞や楽譜を与えることで，任意の歌を合成する技術です．
エンターテインメントやアミューズメントの分野においてさまざまな用途が期待できます．

ある話者の音声をあたかも別の話者の話した音声のように変換する技術です．
2人の話者の発話データからモデルを学習し，一方の話者の発話データをもう一方の話者の発話データに変換します．

目標とする話者の少量のデータから，HMMのモデルパラメータを変換し，目標話者の声質を変換する技術です．