デモンストレーション - 話者補間
通常,音声合成システムの構築では,
「平常」の音声データベースを学習することでモデルを作成します.
しかし,より感情のこもった音声を学習するとどんな音声が合成できるのでしょうか?
ここでは学習に「怒り」の音声を用いた場合の合成音声を紹介しています.
- 学習に用いた音声の例
- &ref(): File not found: "train.wav" at page "ホーム/デモンストレーション/話者補間";
「あらゆる現実を,全て自分の方へ捻じ曲げたのだ.」
- &ref(): File not found: "train_anger.wav" at page "ホーム/デモンストレーション/話者補間";
「おい!ばあちゃんまだ死んでねぇのに,なんてことすんだよ!」
- 合成音声
- &ref(): File not found: "synth_1.wav" at page "ホーム/デモンストレーション/話者補間"; &ref(): File not found: "synth_anger_1.wav" at page "ホーム/デモンストレーション/話者補間";
「落ち着いていられるわけないだろ!」
- &ref(): File not found: "synth_2.wav" at page "ホーム/デモンストレーション/話者補間"; &ref(): File not found: "synth_anger_2.wav" at page "ホーム/デモンストレーション/話者補間";
「なんでそんなことしなきゃいけないんだよ!」
- &ref(): File not found: "synth_3.wav" at page "ホーム/デモンストレーション/話者補間"; &ref(): File not found: "synth_anger_3.wav" at page "ホーム/デモンストレーション/話者補間";
「一週間ばかり,ニューヨークを取材した.」
この技術を用いると,最後の例のように通常の文も「怒り」の感情で合成することができます.
この技術によって,より人間に近い感情のこもった音声の合成が期待でき,
声優アプリケーションや映画の自動吹き替えシステムなどへの応用が考えられます.