認識ボコーダ |
原音声 |
||
分析合成音 |
||
ベクトル量子化(400bit/s) |
||
認識ボコーダ | ||
状態継続長をエントロピー符号化 | ||
168bit/s |
||
音素継続長をエントロピー符号化 | ||
100bit/s |
||
音素継続長をベクトル量子化 | ||
68bit/s(size 3bit) |
||
95bit/s(size 5bit) |
||
146bit/s(size 10bit) |
音声データ | ATR 日本語音声データベース 音韻バランス文 |
サンプリング周波数 | 10kHz |
学習データ | 503文 (b-set 話者 mht) |
分析窓 | 25.6ms Blackman窓 (256 point) |
分析周期 | 5ms |
分析法 | 12次メルケプストラム分析 |
特徴パラメータ | 0〜12次メルケプストラム,デルタ,デルタデルタ |
HMM | 3状態 left-to-right モデル |
単一対角共分散出力分布 | |
音素数 | 36 (無音も含む) |