#include <julius/julius.h>
#include <sys/stat.h>
関数 | |
boolean | wav2mfcc (SP16 speech[], int speechlen, Recog *recog) |
音声波形データから MFCC パラメータを抽出する. |
入力された音声波形から,特徴ベクトル系列を抽出します. Julius/Julianで抽出できる特徴ベクトルは,MFCC の任意次元数のもので, _0, _E, _D, _A, _Z, _N の任意の組合わせをサポートします. そのほか,窓長やフレームシフト,帯域カットなどのパラメータを指定できます. 認識時には,音響モデルのヘッダとチェックが行われ,CMNの有無など が決定されます.
ここの関数は,バッファ上に蓄積された音声波形データを一度に 特徴ベクトル系列に変換するもので,ファイル入力などに用いられます. マイク入力などで,入力と平行に認識を行う場合は,ここの関数ではなく, realtime-1stpass.c 内で行われます.
wav2mfcc.c で定義されています。
音声波形データから MFCC パラメータを抽出する.
エンジンインスタンス内の MFCC 計算インスタンスごとにパラメータ抽出が 行われ,それぞれの mfcc->param に格納される.
speech | [in] 音声波形データ | |
speechlen | [in] speech の長さ(単位:サンプル数) | |
recog | [in] エンジンインスタンス |
wav2mfcc.c の 85 行で定義されています。