デモンストレーション - 話者適応

adaptation.png

音声合成システムの学習に用いる音声データは本来,大量にあればあるほど 高音質になります.
しかし,大量の音声を録音する時間の無い人や喉の病気等で長時間の発声に 耐えられない人の音声はどのように学習すれば良いでしょうか?
話者適応とは,少量の音声データでその人の音声を真似する技術です.

たった数文章の適応によって,本人の声に近づくことができました.
この技術によって,より少量のデータでより高音質な音声合成システム の構築が期待でき,「咽頭がん」等の手術後の会話補助システムなどへの応用 が考えられます.





files: fileorig.wav 1144件 [詳細] fileadapt0.wav 4010件 [詳細] fileadapt1.wav 2972件 [詳細] fileadaptation.png 1017件 [詳細] fileadapt7.wav 3687件 [詳細] fileadapt3.wav 2670件 [詳細] fileadapt5.wav 2383件 [詳細]
トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS