#include <julius/julius.h>
関数 | |
static HTK_HMM_INFO * | initialize_HMM (JCONF_AM *amconf, Jconf *jconf) |
音響HMMをファイルから読み込み,認識用にセットアップする. | |
static HTK_HMM_INFO * | initialize_GSHMM (JCONF_AM *amconf) |
Gaussian Mixture Selection のための状態選択用モノフォンHMMを読み込む. | |
static HTK_HMM_INFO * | initialize_GMM (Jconf *jconf) |
発話検証・棄却用の1状態 GMM を読み込んで初期化する. | |
static WORD_INFO * | initialize_dict (JCONF_LM *lmconf, HTK_HMM_INFO *hmminfo) |
単語辞書をファイルから読み込んでセットアップする. | |
static NGRAM_INFO * | initialize_ngram (JCONF_LM *lmconf, WORD_INFO *winfo) |
単語N-gramをファイルから読み込んでセットアップする. | |
boolean | j_load_am (Recog *recog, JCONF_AM *amconf) |
音響モデルを読み込む. | |
boolean | j_load_lm (Recog *recog, JCONF_LM *lmconf) |
言語モデルを読み込む. | |
boolean | j_load_all (Recog *recog, Jconf *jconf) |
全てのモデルを読み込み,認識の準備を行なう. | |
static boolean | mfcc_config_is_same (JCONF_AM *amconf, MFCCCalc *mfcc) |
AM設定パラメータと既に作られたMFCC計算インスタンス間で,パラメータ抽出の 設定が同一であるかどうかをチェックする. | |
void | create_mfcc_calc_instances (Recog *recog) |
全てのAM処理インスタンスおよびGMM用に,MFCC計算インスタンスを生成する. | |
boolean | j_launch_recognition_instance (Recog *recog, JCONF_SEARCH *sconf) |
認識処理インスタンスを立ち上げる. | |
boolean | j_final_fusion (Recog *recog) |
全てのロードされたモデルと設定からエンジンインスタンスを 最終構成する. |
設定に従い,モデルの読み込み・木構造化辞書などのデータ構造の構築・ ワークエリアの確保など,認識開始に必要な環境の構築を行なう.
m_fusion.c で定義されています。
static HTK_HMM_INFO* initialize_HMM | ( | JCONF_AM * | amconf, | |
Jconf * | jconf | |||
) | [static] |
音響HMMをファイルから読み込み,認識用にセットアップする.
ファイルからのHMM定義の読み込み,HMMList ファイルの読み込み, パラメータ型のチェック,マルチパス扱いの on/off, ポーズモデルの設定など が行われ,認識のための準備が行われる.
この音響モデルの入力となる音響パラメータの種類やパラメータもここで 最終決定される. 決定には,音響HMMのヘッダ,(バイナリHMMの場合,存 在すれば)バイナリHMMに埋め込まれた特徴量情報,jconf の設定(ばらば らに,あるいは -htkconf 使用時)などの情報が用いられる.
amconf | [in] AM configuration variables | |
jconf | [i/o] global configuration variables |
m_fusion.c の 73 行で定義されています。
参照元 j_load_am().
static HTK_HMM_INFO* initialize_GSHMM | ( | JCONF_AM * | amconf | ) | [static] |
Gaussian Mixture Selection のための状態選択用モノフォンHMMを読み込む.
amconf | [in] AM configuratino variables |
m_fusion.c の 166 行で定義されています。
参照元 j_load_am().
static HTK_HMM_INFO* initialize_GMM | ( | Jconf * | jconf | ) | [static] |
発話検証・棄却用の1状態 GMM を読み込んで初期化する.
jconf | [in] global configuration variables |
m_fusion.c の 198 行で定義されています。
参照元 j_load_all().
static WORD_INFO* initialize_dict | ( | JCONF_LM * | lmconf, | |
HTK_HMM_INFO * | hmminfo | |||
) | [static] |
単語辞書をファイルから読み込んでセットアップする.
辞書上のモノフォン表記からトライフォンへの計算は init_voca() で 読み込み時に行われる. このため,辞書読み込み時には,認識で使用する 予定のHMM情報を与える必要がある.
N-gram 使用時は,文頭無音単語およぶ文末無音単語をここで設定する. また,"-iwspword" 指定時は,ポーズ単語を辞書の最後に挿入する.
lmconf | [in] LM configuration variables | |
hmminfo | [in] HMM definition of each phone in dictionary, for phone checking and monophone-to-triphone conversion. |
m_fusion.c の 263 行で定義されています。
参照元 j_load_lm().
static NGRAM_INFO* initialize_ngram | ( | JCONF_LM * | lmconf, | |
WORD_INFO * | winfo | |||
) | [static] |
単語N-gramをファイルから読み込んでセットアップする.
ARPA フォーマットで指定時は,LRファイルと RL ファイルの組合せで 動作が異なる. LR のみ,あるいは RL のみ指定時は,それをそのまま読み込む. 双方とも指定されている場合は,RLをまず主モデルとして読み込んだ後, LR の 2-gram だけを第1パス用に主モデルに追加読み込みする.
また,読み込み終了後,辞書上のN-gramエントリとのマッチングを取る.
lmconf | [in] LM configuration variables | |
winfo | [i/o] word dictionary that will be used with this N-gram. each word in the dictionary will be assigned to an N-gram entry here. |
m_fusion.c の 353 行で定義されています。
参照元 j_load_lm().
AM設定パラメータと既に作られたMFCC計算インスタンス間で,パラメータ抽出の 設定が同一であるかどうかをチェックする.
amconf | [in] AM configuration parameters | |
mfcc | [in] MFCC calculation instance. |
m_fusion.c の 709 行で定義されています。
void create_mfcc_calc_instances | ( | Recog * | recog | ) |
全てのAM処理インスタンスおよびGMM用に,MFCC計算インスタンスを生成する.
2つ以上のAM処理インスタンス(およびGMM)が同一の特徴量計算条件を持 つ場合,それらのインスタンスはひとつの MFCC 計算インスタンスを共有する.
recog | [i/o] engine instance |
m_fusion.c の 771 行で定義されています。
参照元 j_final_fusion().