[ 一覧へ戻る ]

認識ボコーダ

「カリフォルニアですから,四日ぐらいですね.」

原音声

分析合成音

ベクトル量子化(400bit/s)

認識ボコーダ

状態継続長をエントロピー符号化

168bit/s

音素継続長をエントロピー符号化

100bit/s

音素継続長をベクトル量子化

68bit/s(size 3bit)

95bit/s(size 5bit)

146bit/s(size 10bit)



実験条件
音声データ ATR 日本語音声データベース 音韻バランス文
サンプリング周波数 10kHz
学習データ 503文 (b-set 話者 mht)
分析窓 25.6ms Blackman窓 (256 point)
分析周期 5ms
分析法 12次メルケプストラム分析
特徴パラメータ 0〜12次メルケプストラム,デルタ,デルタデルタ
HMM 3状態 left-to-right モデル
単一対角共分散出力分布
音素数 36 (無音も含む)