音声と唇動画像の合成 |
| Δなし | Δあり |
|---|---|
| 入力テキスト | 合成例 |
|---|---|
| 小さな鰻屋に,熱気のようなものがみなぎる. | |
| 泥棒でも入ったかと,一瞬僕は思った. | |
| 学生はレポートを置くと,ちょっと頭を下げて出ていった. |
| データベース | ATR音声データベース音韻バランス文503文章 男性話者1名 |
| 学習データ | 輝度と位置の正規化を行った450文章() |
| フレーム周期 | 59.97frame/s |
| 画像サイズ | 176x160 |
| 主成分分析に使用した画像フレーム数 | 1000 |
| モデルの分類 | 39音素 |
| HMM | 3状態 left-to-right |
| モデルの特徴量 | 16次主成分係数 + Δ + ΔΔ(合計48次元) |