* デモンストレーション - 話者補間 [#i4862eac]

//CENTER:&ref(happy.png,nolink); &ref(anger.png,nolink);

> 通常,音声合成システムの構築では,
「平常」の音声データベースを学習することでモデルを作成します.~
しかし,より感情のこもった音声を学習するとどんな音声が合成できるのでしょうか?~
ここでは学習に「怒り」の音声を用いた場合の合成音声を紹介しています.

- 学習に用いた音声の例
-- &ref(train.wav,,平常音声);~
「あらゆる現実を,全て自分の方へ捻じ曲げたのだ.」
-- &ref(train_anger.wav,,怒り音声);~
「おい!ばあちゃんまだ死んでねぇのに,なんてことすんだよ!」

- 合成音声
-- &ref(synth_1.wav,,平常音声); &ref(synth_anger_1.wav,,怒り音声);~
「落ち着いていられるわけないだろ!」
-- &ref(synth_2.wav,,平常音声); &ref(synth_anger_2.wav,,怒り音声);~
「なんでそんなことしなきゃいけないんだよ!」
-- &ref(synth_3.wav,,平常音声); &ref(synth_anger_3.wav,,怒り音声);~
「一週間ばかり,ニューヨークを取材した.」

> この技術を用いると,最後の例のように通常の文も「怒り」の感情で合成することができます.~
この技術によって,より人間に近い感情のこもった音声の合成が期待でき,
声優アプリケーションや映画の自動吹き替えシステムなどへの応用が考えられます.





トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS