認識ボコーダ |
原音声 |
||
分析合成音 |
||
ベクトル量子化(400bit/s) |
||
認識ボコーダ | ||
状態継続長をエントロピー符号化 | ||
168bit/s |
||
音素継続長をエントロピー符号化 | ||
100bit/s |
||
音素継続長をベクトル量子化 | ||
68bit/s(size 3bit) |
||
95bit/s(size 5bit) |
||
146bit/s(size 10bit) |
||
| 音声データ | ATR 日本語音声データベース 音韻バランス文 |
| サンプリング周波数 | 10kHz |
| 学習データ | 503文 (b-set 話者 mht) |
| 分析窓 | 25.6ms Blackman窓 (256 point) |
| 分析周期 | 5ms |
| 分析法 | 12次メルケプストラム分析 |
| 特徴パラメータ | 0〜12次メルケプストラム,デルタ,デルタデルタ |
| HMM | 3状態 left-to-right モデル |
| 単一対角共分散出力分布 | |
| 音素数 | 36 (無音も含む) |