* デモンストレーション - 話者適応 [#v17a1de8]

CENTER:&ref(adaptation.png,nolink);

> 通常,音声合成システムの構築では,
「平常」の音声データベースを学習することでモデルを作成します.~
しかし,より感情のこもった音声を学習するとどんな音声が合成できるのでしょうか?~
ここでは学習に「怒り」の音声を用いた場合の合成音声を紹介しています.
> 音声合成システムの学習に用いる音声データは本来,大量にあればあるほど
高音質になります.~
しかし,大量の音声を録音する時間の無い人や喉の病気等で長時間の発声に
絶えられない人の音声はどのように学習すれば良いでしょうか?~
話者適応とは,少量の音声データでその人の音声を真似する技術です.

- 学習に用いた音声の例
-- 「あらゆる現実を,全て自分の方へ捻じ曲げたのだ.」~
&ref(train.wav,,平常音声);
-- 「おい!ばあちゃんまだ死んでねぇのに,なんてことすんだよ!」~
&ref(train_anger.wav,,怒り音声);
- 目標とする話者の音声~
「なぜ自分ばかりこんな目にあうのだろう.」
-- &ref(orig.wav,,分析合成音声);

- 合成音声
-- 「落ち着いていられるわけないだろ!」~
&ref(synth_1.wav,,平常音声); &ref(synth_anger_1.wav,,怒り音声);
-- 「なんでそんなことしなきゃいけないんだよ!」~
&ref(synth_2.wav,,平常音声); &ref(synth_anger_2.wav,,怒り音声);
-- 「一週間ばかり,ニューヨークを取材した.」~
&ref(synth_3.wav,,平常音声); &ref(synth_anger_3.wav,,怒り音声);
- 話者適応~
「なぜ自分ばかりこんな目にあうのだろう.」
-- 適応無し~
&ref(adapt0.wav,,合成音声);
-- 1文章で適応~
&ref(adapt1.wav,,合成音声);
-- 3文章で適応~
&ref(adapt3.wav,,合成音声);
-- 5文章で適応~
&ref(adapt5.wav,,合成音声);
-- 7文章で適応~
&ref(adapt7.wav,,合成音声);

> この技術を用いると,最後の例のように通常の文も「怒り」の感情で合成することができます.~
この技術によって,より人間に近い感情のこもった音声の合成が期待でき,
声優アプリケーションや映画の自動吹き替えシステムなどへの応用が考えられます.
> たった数文章の適応によって,本人の声に近づくことができました.~
この技術によって,より少量のデータでより高音質な音声合成システム
の構築が期待でき,「咽頭がん」の手術後の会話補助システムなどへの応用
が考えられます.






トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS