* デモンストレーション - 話者適応 [#v17a1de8] CENTER:&ref(adaptation.png,nolink); > 音声合成システムの学習に用いる音声データは本来,大量にあればあるほど 高音質になります.~ しかし,大量の音声を録音する時間の無い人や喉の病気等で長時間の発声に 絶えられない人の音声はどのように学習すれば良いでしょうか?~ 話者適応とは,少量の音声データでその人の音声を真似する技術です. - 目標とする話者の音声~ 「なぜ自分ばかりこんな目にあうのだろう.」 -- &ref(orig.wav,,分析合成音声); - 話者適応~ 「なぜ自分ばかりこんな目にあうのだろう.」 -- 適応無し~ &ref(adapt0.wav,,合成音声); -- 1文章で適応~ &ref(adapt1.wav,,合成音声); -- 3文章で適応~ &ref(adapt3.wav,,合成音声); -- 5文章で適応~ &ref(adapt5.wav,,合成音声); -- 7文章で適応~ &ref(adapt7.wav,,合成音声); > たった数文章の適応によって,本人の声に近づくことができました.~ この技術によって,より少量のデータでより高音質な音声合成システム の構築が期待でき,「咽頭がん」の手術後の会話補助システムなどへの応用 が考えられます.