#include <julius/julius.h>
関数 | |
| static NODE * | get_best_from_stack (NODE **start, int *stacknum) |
| スタックトップの最尤仮説を取り出す. | |
| static int | put_to_stack (NODE *new, NODE **start, NODE **bottom, int *stacknum, int stacksize) |
| スタックに新たな仮説を格納する. | |
| static void | put_all_in_stack (NODE **start, int *stacknum, WORD_INFO *winfo) |
| スタックの中身を全て出力する. | |
| static void | free_all_nodes (NODE *start) |
| スタック内の全仮説を解放する. | |
| static void | put_hypo_woutput (NODE *hypo, WORD_INFO *winfo) |
| デバッグ用に仮説の単語列を表示する. | |
| static void | put_hypo_wname (NODE *hypo, WORD_INFO *winfo) |
| デバッグ用に仮説の単語N-gramエントリ名(Julianではカテゴリ番号)を出力する. | |
| static NEXTWORD ** | nw_malloc (int *maxlen, NEXTWORD **root, int max) |
| 次単語の格納領域の割り当て. | |
| static void | nw_free (NEXTWORD **nw, NEXTWORD *root) |
| 次単語の格納領域の解放. | |
| static NEXTWORD ** | nw_expand (NEXTWORD **nwold, int *maxlen, NEXTWORD **root, int num) |
| 次単語候補格納用の NEXTWORD 配列のメモリ領域を伸張する. | |
| static int | can_put_to_stack (NODE *new, NODE **bottom, int *stacknum, int stacksize) |
| ある仮説がスタック内に格納されるかどうかチェックする. | |
| static void | wb_init (StackDecode *s) |
| Word envelope 用にカウンタを初期化する. | |
| static boolean | wb_ok (StackDecode *s, NODE *now, int width) |
| Word envelope を参照して,与えられた仮説を展開してよいかどうかを返す. | |
| void | segment_set_last_nword (NODE *hypo, RecogProcess *r) |
| 認識結果から,次の入力区間の認識を開始する際の初期単語履歴をセットする. | |
| static void | store_result_pass2 (NODE *hypo, RecogProcess *r) |
| 第2パスの結果として仮説を保存する. | |
| static void | result_reorder_and_output (NODE **r_start, NODE **r_bottom, int *r_stacknum, int ncan, RecogProcess *r, HTK_Param *param) |
| スタックから上位の仮説を取り出し,認識結果として出力する. | |
| void | wchmm_fbs (HTK_Param *param, RecogProcess *r, int cate_bgn, int cate_num) |
| 第2探索パスであるスタックデコーディングを行うメイン関数 | |
Julius の第2パスであるスタックデコーディングアルゴリズムが記述され ています. 第1パスの結果の単語トレリス情報を元に,第1パスとは逆向き の right-to-left に探索を行います. 仮説のスコアは、第1パスのトレリ スとそのスコアを未探索部のヒューリスティックとして接続することで, 文全体の仮説スコアを考慮しながら探索を行います.
次単語集合の取得のために,単語N-gramでは ngram_decode.c 内の関数が, 文法では dfa_decode.c の関数が用いられます.
search_bestfirst_main.c で定義されています。
スタックトップの最尤仮説を取り出す.
| start | [i/o] スタックの先頭ノードへのポインタ(書換えられる場合あり) | |
| stacknum | [i/o] 現在のスタックサイズへのポインタ(書き換えあり) |
search_bestfirst_main.c の 209 行で定義されています。
参照元 put_all_in_stack().
| static int put_to_stack | ( | NODE * | new, | |
| NODE ** | start, | |||
| NODE ** | bottom, | |||
| int * | stacknum, | |||
| int | stacksize | |||
| ) | [static] |
スタックに新たな仮説を格納する.
スタック内のスコア順を考慮した位置に挿入される. 格納できなかった場合,与えられた仮説は free_node() される.
| new | [in] チェックする仮説 | |
| start | [i/o] スタックのトップノードへのポインタ | |
| bottom | [i/o] スタックの底ノードへのポインタ | |
| stacknum | [i/o] スタックに現在格納されているノード数へのポインタ | |
| stacksize | [in] スタックのノード数の上限 |
search_bestfirst_main.c の 292 行で定義されています。
スタックの中身を全て出力する.
スタックの中身は失われる. (デバッグ用)
| start | [i/o] スタックのトップノードへのポインタ | |
| stacknum | [i/o] スタックに現在格納されているノード数へのポインタ | |
| winfo | [in] 単語辞書 |
search_bestfirst_main.c の 380 行で定義されています。
| static void free_all_nodes | ( | NODE * | start | ) | [static] |
デバッグ用に仮説の単語N-gramエントリ名(Julianではカテゴリ番号)を出力する.
| hypo | [in] 仮説 | |
| winfo | [in] 単語辞書 |
search_bestfirst_main.c の 954 行で定義されています。
次単語の格納領域の割り当て.
次単語候補を格納するための NEXTWORD 配列にメモリを割り付ける.
| maxlen | [out] 格納可能な単語数 | |
| root | [out] 割り付け領域の先頭へのポインタ | |
| max | [in] 割り付ける領域のサイズ |
search_bestfirst_main.c の 86 行で定義されています。
次単語の格納領域の解放.
| nw | [in] NEXTWORD配列 | |
| root | [in] nw_malloc() で与えられた領域先頭へのポインタ |
search_bestfirst_main.c の 118 行で定義されています。
次単語候補格納用の NEXTWORD 配列のメモリ領域を伸張する.
この関数は探索中に次単語候補集合が溢れた際に呼ばれ,配列により多くの 次単語候補を格納できるよう NEXTWORD の中身を realloc() する. 実際には最初に nw_malloc() で辞書の単語数分だけ領域を確保しており, 単語N-gram使用時は呼ばれることはない. 文法認識では,ショートポーズの スキップ処理により状態の異なる候補を同時に展開するので, 次単語数が語彙数よりも大きいことが起こりうる.
| nwold | [i/o] NEXTWORD配列 | |
| maxlen | [i/o] 最大格納数を格納するポインタ. 現在の最大格納数を 入れて呼び,関数内で新たに確保された数に変更される. | |
| root | [i/o] 領域先頭へのポインタを格納するアドレス. 関数内で 書き換えられる. | |
| num | [in] 伸長する長さ |
search_bestfirst_main.c の 163 行で定義されています。
ある仮説がスタック内に格納されるかどうかチェックする.
| new | [in] チェックする仮説 | |
| bottom | [in] スタックの底ノードへのポインタ | |
| stacknum | [in] スタックに現在格納されているノード数へのポインタ | |
| stacksize | [in] スタックのノード数の上限 |
search_bestfirst_main.c の 253 行で定義されています。
| static void wb_init | ( | StackDecode * | s | ) | [static] |
| static boolean wb_ok | ( | StackDecode * | s, | |
| NODE * | now, | |||
| int | width | |||
| ) | [static] |
Word envelope を参照して,与えられた仮説を展開してよいかどうかを返す.
また,Word envelope のカウンタを更新する.
| s | [i/o] 第2パス用ワークエリア | |
| now | [in] 今から展開しようとしている仮説 | |
| width | [in] 展開カウントの上限値 |
search_bestfirst_main.c の 764 行で定義されています。
| void segment_set_last_nword | ( | NODE * | hypo, | |
| RecogProcess * | r | |||
| ) |
認識結果から,次の入力区間の認識を開始する際の初期単語履歴をセットする.
透過語および仮説の重複を考慮して初期単語履歴が決定される.
| hypo | [in] 現在の入力区間の認識結果としての文候補 | |
| r | [in] 認識処理インスタンス |
search_bestfirst_main.c の 882 行で定義されています。
| static void store_result_pass2 | ( | NODE * | hypo, | |
| RecogProcess * | r | |||
| ) | [static] |
第2パスの結果として仮説を保存する.
| hypo | [in] hypothesis to save | |
| r | [in] recognition process instance |
search_bestfirst_main.c の 980 行で定義されています。
| static void result_reorder_and_output | ( | NODE ** | r_start, | |
| NODE ** | r_bottom, | |||
| int * | r_stacknum, | |||
| int | ncan, | |||
| RecogProcess * | r, | |||
| HTK_Param * | param | |||
| ) | [static] |
スタックから上位の仮説を取り出し,認識結果として出力する.
さらに, スタックに格納されている全ての仮説を解放する.
得られた文候補は,いったん結果格納用のスタックに格納される. 探索終 了("-n" の数だけ文候補が見つかるか,探索が中断される)の後,結果的 に得られた文候補の中から上位N個("-output" で指定された数)の仮説を 出力する.
指定があればアラインメントもここで実行する.
| r_start | [i/o] 結果格納用スタックの先頭ノードへのポインタ | |
| r_bottom | [i/o] 結果格納用スタックの底ノードへのポインタ | |
| r_stacknum | [i/o] スタックに格納されているノード数へのポインタ | |
| ncan | [in] 出力する上位仮説数 | |
| r | [in] 認識処理インスタンス | |
| param | [in] 入力パラメータ |
search_bestfirst_main.c の 1062 行で定義されています。
| void wchmm_fbs | ( | HTK_Param * | param, | |
| RecogProcess * | r, | |||
| int | cate_bgn, | |||
| int | cate_num | |||
| ) |
第2探索パスであるスタックデコーディングを行うメイン関数
引数のうち cate_bgn, cate_num は単語N-gramでは無視される.
| param | [in] 入力パラメータベクトル列 | |
| r | [i/o] 認識処理インスタンス | |
| cate_bgn | [in] 展開対象とすべきカテゴリの開始番号 | |
| cate_num | [in] 展開対象とすべきカテゴリの数 |
search_bestfirst_main.c の 1126 行で定義されています。
1.5.4