#include <julius/julius.h>
関数 | |
static NODE * | get_best_from_stack (NODE **start, int *stacknum) |
スタックトップの最尤仮説を取り出す. | |
static int | put_to_stack (NODE *new, NODE **start, NODE **bottom, int *stacknum, int stacksize) |
スタックに新たな仮説を格納する. | |
static void | put_all_in_stack (NODE **start, int *stacknum, WORD_INFO *winfo) |
スタックの中身を全て出力する. | |
static void | free_all_nodes (NODE *start) |
スタック内の全仮説を解放する. | |
static void | put_hypo_woutput (NODE *hypo, WORD_INFO *winfo) |
デバッグ用に仮説の単語列を表示する. | |
static void | put_hypo_wname (NODE *hypo, WORD_INFO *winfo) |
デバッグ用に仮説の単語N-gramエントリ名(Julianではカテゴリ番号)を出力する. | |
static NEXTWORD ** | nw_malloc (int *maxlen, NEXTWORD **root, int max) |
次単語の格納領域の割り当て. | |
static void | nw_free (NEXTWORD **nw, NEXTWORD *root) |
次単語の格納領域の解放. | |
static NEXTWORD ** | nw_expand (NEXTWORD **nwold, int *maxlen, NEXTWORD **root, int num) |
次単語候補格納用の NEXTWORD 配列のメモリ領域を伸張する. | |
static int | can_put_to_stack (NODE *new, NODE **bottom, int *stacknum, int stacksize) |
ある仮説がスタック内に格納されるかどうかチェックする. | |
static void | wb_init (StackDecode *s) |
Word envelope 用にカウンタを初期化する. | |
static boolean | wb_ok (StackDecode *s, NODE *now, int width) |
Word envelope を参照して,与えられた仮説を展開してよいかどうかを返す. | |
void | segment_set_last_nword (NODE *hypo, RecogProcess *r) |
認識結果から,次の入力区間の認識を開始する際の初期単語履歴をセットする. | |
static void | store_result_pass2 (NODE *hypo, RecogProcess *r) |
第2パスの結果として仮説を保存する. | |
static void | result_reorder_and_output (NODE **r_start, NODE **r_bottom, int *r_stacknum, int ncan, RecogProcess *r, HTK_Param *param) |
スタックから上位の仮説を取り出し,認識結果として出力する. | |
void | wchmm_fbs (HTK_Param *param, RecogProcess *r, int cate_bgn, int cate_num) |
第2探索パスであるスタックデコーディングを行うメイン関数 |
Julius の第2パスであるスタックデコーディングアルゴリズムが記述され ています. 第1パスの結果の単語トレリス情報を元に,第1パスとは逆向き の right-to-left に探索を行います. 仮説のスコアは、第1パスのトレリ スとそのスコアを未探索部のヒューリスティックとして接続することで, 文全体の仮説スコアを考慮しながら探索を行います.
次単語集合の取得のために,単語N-gramでは ngram_decode.c 内の関数が, 文法では dfa_decode.c の関数が用いられます.
search_bestfirst_main.c で定義されています。
スタックトップの最尤仮説を取り出す.
start | [i/o] スタックの先頭ノードへのポインタ(書換えられる場合あり) | |
stacknum | [i/o] 現在のスタックサイズへのポインタ(書き換えあり) |
search_bestfirst_main.c の 209 行で定義されています。
参照元 put_all_in_stack().
static int put_to_stack | ( | NODE * | new, | |
NODE ** | start, | |||
NODE ** | bottom, | |||
int * | stacknum, | |||
int | stacksize | |||
) | [static] |
スタックに新たな仮説を格納する.
スタック内のスコア順を考慮した位置に挿入される. 格納できなかった場合,与えられた仮説は free_node() される.
new | [in] チェックする仮説 | |
start | [i/o] スタックのトップノードへのポインタ | |
bottom | [i/o] スタックの底ノードへのポインタ | |
stacknum | [i/o] スタックに現在格納されているノード数へのポインタ | |
stacksize | [in] スタックのノード数の上限 |
search_bestfirst_main.c の 292 行で定義されています。
スタックの中身を全て出力する.
スタックの中身は失われる. (デバッグ用)
start | [i/o] スタックのトップノードへのポインタ | |
stacknum | [i/o] スタックに現在格納されているノード数へのポインタ | |
winfo | [in] 単語辞書 |
search_bestfirst_main.c の 380 行で定義されています。
static void free_all_nodes | ( | NODE * | start | ) | [static] |
デバッグ用に仮説の単語N-gramエントリ名(Julianではカテゴリ番号)を出力する.
hypo | [in] 仮説 | |
winfo | [in] 単語辞書 |
search_bestfirst_main.c の 954 行で定義されています。
次単語の格納領域の割り当て.
次単語候補を格納するための NEXTWORD 配列にメモリを割り付ける.
maxlen | [out] 格納可能な単語数 | |
root | [out] 割り付け領域の先頭へのポインタ | |
max | [in] 割り付ける領域のサイズ |
search_bestfirst_main.c の 86 行で定義されています。
次単語の格納領域の解放.
nw | [in] NEXTWORD配列 | |
root | [in] nw_malloc() で与えられた領域先頭へのポインタ |
search_bestfirst_main.c の 118 行で定義されています。
次単語候補格納用の NEXTWORD 配列のメモリ領域を伸張する.
この関数は探索中に次単語候補集合が溢れた際に呼ばれ,配列により多くの 次単語候補を格納できるよう NEXTWORD の中身を realloc() する. 実際には最初に nw_malloc() で辞書の単語数分だけ領域を確保しており, 単語N-gram使用時は呼ばれることはない. 文法認識では,ショートポーズの スキップ処理により状態の異なる候補を同時に展開するので, 次単語数が語彙数よりも大きいことが起こりうる.
nwold | [i/o] NEXTWORD配列 | |
maxlen | [i/o] 最大格納数を格納するポインタ. 現在の最大格納数を 入れて呼び,関数内で新たに確保された数に変更される. | |
root | [i/o] 領域先頭へのポインタを格納するアドレス. 関数内で 書き換えられる. | |
num | [in] 伸長する長さ |
search_bestfirst_main.c の 163 行で定義されています。
ある仮説がスタック内に格納されるかどうかチェックする.
new | [in] チェックする仮説 | |
bottom | [in] スタックの底ノードへのポインタ | |
stacknum | [in] スタックに現在格納されているノード数へのポインタ | |
stacksize | [in] スタックのノード数の上限 |
search_bestfirst_main.c の 253 行で定義されています。
static void wb_init | ( | StackDecode * | s | ) | [static] |
static boolean wb_ok | ( | StackDecode * | s, | |
NODE * | now, | |||
int | width | |||
) | [static] |
Word envelope を参照して,与えられた仮説を展開してよいかどうかを返す.
また,Word envelope のカウンタを更新する.
s | [i/o] 第2パス用ワークエリア | |
now | [in] 今から展開しようとしている仮説 | |
width | [in] 展開カウントの上限値 |
search_bestfirst_main.c の 764 行で定義されています。
void segment_set_last_nword | ( | NODE * | hypo, | |
RecogProcess * | r | |||
) |
認識結果から,次の入力区間の認識を開始する際の初期単語履歴をセットする.
透過語および仮説の重複を考慮して初期単語履歴が決定される.
hypo | [in] 現在の入力区間の認識結果としての文候補 | |
r | [in] 認識処理インスタンス |
search_bestfirst_main.c の 882 行で定義されています。
static void store_result_pass2 | ( | NODE * | hypo, | |
RecogProcess * | r | |||
) | [static] |
第2パスの結果として仮説を保存する.
hypo | [in] hypothesis to save | |
r | [in] recognition process instance |
search_bestfirst_main.c の 980 行で定義されています。
static void result_reorder_and_output | ( | NODE ** | r_start, | |
NODE ** | r_bottom, | |||
int * | r_stacknum, | |||
int | ncan, | |||
RecogProcess * | r, | |||
HTK_Param * | param | |||
) | [static] |
スタックから上位の仮説を取り出し,認識結果として出力する.
さらに, スタックに格納されている全ての仮説を解放する.
得られた文候補は,いったん結果格納用のスタックに格納される. 探索終 了("-n" の数だけ文候補が見つかるか,探索が中断される)の後,結果的 に得られた文候補の中から上位N個("-output" で指定された数)の仮説を 出力する.
指定があればアラインメントもここで実行する.
r_start | [i/o] 結果格納用スタックの先頭ノードへのポインタ | |
r_bottom | [i/o] 結果格納用スタックの底ノードへのポインタ | |
r_stacknum | [i/o] スタックに格納されているノード数へのポインタ | |
ncan | [in] 出力する上位仮説数 | |
r | [in] 認識処理インスタンス | |
param | [in] 入力パラメータ |
search_bestfirst_main.c の 1062 行で定義されています。
void wchmm_fbs | ( | HTK_Param * | param, | |
RecogProcess * | r, | |||
int | cate_bgn, | |||
int | cate_num | |||
) |
第2探索パスであるスタックデコーディングを行うメイン関数
引数のうち cate_bgn, cate_num は単語N-gramでは無視される.
param | [in] 入力パラメータベクトル列 | |
r | [i/o] 認識処理インスタンス | |
cate_bgn | [in] 展開対象とすべきカテゴリの開始番号 | |
cate_num | [in] 展開対象とすべきカテゴリの数 |
search_bestfirst_main.c の 1126 行で定義されています。