* Demonstration - Speaker adaptation [#oab71fa7]
* DEMONSTRATION - Speaker adaptation [#oab71fa7]

CENTER:&ref(adaptation.png,nolink);

> 音声合成システムの学習に用いる音声データは本来,大量にあればあるほど
高音質になります.~
しかし,大量の音声を録音する時間の無い人や喉の病気等で長時間の発声に
耐えられない人の音声はどのように学習すれば良いでしょうか?~
話者適応とは,少量の音声データでその人の音声を真似する技術です.
> In the speech synthesis system, a large amount of trainin data is required.~
However, the cost for recoding speech is unaffordable.~
Speaker adaptation is a technique for control style with a small amount of adaptation data.

- 目標とする話者の音声~
「なぜ自分ばかりこんな目にあうのだろう.」
-- &ref(orig.wav,,分析合成音声);
- Speech of the target speaker~
"nazejibuNbakarikoNnameniaunodarou"~
-- &ref(orig.wav,,target speech);

- 話者適応~
「なぜ自分ばかりこんな目にあうのだろう.」
-- 適応無し~
&ref(adapt0.wav,,合成音声);
-- 1文章で適応~
&ref(adapt1.wav,,合成音声);
-- 3文章で適応~
&ref(adapt3.wav,,合成音声);
-- 5文章で適応~
&ref(adapt5.wav,,合成音声);
-- 7文章で適応~
&ref(adapt7.wav,,合成音声);
- Synthesis speech with speaker adaptation~
"nazejibuNbakarikoNnameniaunodarou"~
-- without adaptation~
&ref(adapt0.wav,,synthesis speech);
-- with adaptation using one sentence~
&ref(adapt1.wav,,synthesis speech);
-- with adaptation using three sentences~
&ref(adapt3.wav,,synthesis speech);
-- with adaptation using five sentences~
&ref(adapt5.wav,,synthesis speech);
-- with adaptation using seven sentences~
&ref(adapt7.wav,,synthesis speech);

> たった数文章の適応によって,本人の声に近づくことができました.~
この技術によって,より少量のデータでより高音質な音声合成システム
の構築が期待でき,「咽頭がん」等の手術後の会話補助システムなどへの応用
が考えられます.
> We could perform controling style with only a few adaptation data.~
By using this technique, we will be able to construct the speech synthesis sytem which have higer quality with a small amount of training data.





トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS