デモンストレーション - 話者適応

adaptation.png

音声合成システムの学習に用いる音声データは本来,大量にあればあるほど 高音質になります.
しかし,大量の音声を録音する時間の無い人や喉の病気等で長時間の発声に 絶えられない人の音声はどのように学習すれば良いでしょうか?
話者適応とは,少量の音声データでその人の音声を真似する技術です.

たった数文章の適応によって,本人の声に近づくことができました.
この技術によって,より少量のデータでより高音質な音声合成システム の構築が期待でき,「咽頭がん」の手術後の会話補助システムなどへの応用 が考えられます.





トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS