* デモンストレーション - 話者補間 [#i4862eac]

//CENTER:&ref(happy.png,nolink); &ref(anger.png,nolink);
CENTER:&ref(morfing.png,nolink);

> 通常,音声合成システムの構築では,
「平常」の音声データベースを学習することでモデルを作成します.~
しかし,より感情のこもった音声を学習するとどんな音声が合成できるのでしょうか?~
ここでは学習に「怒り」の音声を用いた場合の合成音声を紹介しています.
> 徳田・李研究室の音声合成システムの構築では
音声波形を分析したデータを使っています.~
波形を直接保存する手法ではないので,
人と人の声を混ぜ合わせることもできます.

- 学習に用いた音声の例
-- &ref(train.wav,,平常音声);~
「あらゆる現実を,全て自分の方へ捻じ曲げたのだ.」
-- &ref(train_anger.wav,,怒り音声);~
「おい!ばあちゃんまだ死んでねぇのに,なんてことすんだよ!」
- 補間音声「あらゆる現実を,全て自分の方へ捻じ曲げたのだ.」
-- 話者A100% 話者B000%~
&ref(a100_b000.wav,,合成音声); 
-- 話者A075% 話者B025%~
&ref(a075_b025.wav,,合成音声);
-- 話者A050% 話者B050%~
&ref(a050_b050.wav,,合成音声);
-- 話者A025% 話者B075%~
&ref(a025_b075.wav,,合成音声);
-- 話者A000% 話者B100%~
&ref(a000_b100.wav,,合成音声);

- 合成音声
-- &ref(synth_1.wav,,平常音声); &ref(synth_anger_1.wav,,怒り音声);~
「落ち着いていられるわけないだろ!」
-- &ref(synth_2.wav,,平常音声); &ref(synth_anger_2.wav,,怒り音声);~
「なんでそんなことしなきゃいけないんだよ!」
-- &ref(synth_3.wav,,平常音声); &ref(synth_anger_3.wav,,怒り音声);~
「一週間ばかり,ニューヨークを取材した.」
- 連続補間音声「汚職事件,すべて,42,3歳から46,7歳まで,課長補佐,課長,部次長といったあたりが間違いをおこす.」
-- Aさん→Bさん~
&ref(a2b.wav,,合成音声);
-- Bさん→Aさん~
&ref(b2a.wav,,合成音声);

> この技術を用いると,最後の例のように通常の文も「怒り」の感情で合成することができます.~
この技術によって,より人間に近い感情のこもった音声の合成が期待でき,
声優アプリケーションや映画の自動吹き替えシステムなどへの応用が考えられます.
> それぞれの話者の音声が混ざって聞こえましたか?~
合成時の様々なパラメータを変更することでさらにたくさんの声質を
作り出すことができます.






トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS