Julius: libjulius/src/search_bestfirst

ソースコードを見る。


関数
static NODE *	get_best_from_stack (NODE *start, int stacknum)
	スタックトップの最尤仮説を取り出す.
static int	put_to_stack (NODE new, NODE start, NODE bottom, int stacknum, int stacksize)
	スタックに新たな仮説を格納する.
static void	put_all_in_stack (NODE *start, int stacknum, WORD_INFO *winfo)
	スタックの中身を全て出力する.
static void	free_all_nodes (NODE *start)
	スタック内の全仮説を解放する.
static void	put_hypo_woutput (NODE hypo, WORD_INFO winfo)
	デバッグ用に仮説の単語列を表示する.
static void	put_hypo_wname (NODE hypo, WORD_INFO winfo)
	デバッグ用に仮説の単語N-gramエントリ名（Julianではカテゴリ番号）を出力する.
static NEXTWORD **	nw_malloc (int maxlen, NEXTWORD *root, int max)
	次単語の格納領域の割り当て.
static void	nw_free (NEXTWORD *nw, NEXTWORD root)
	次単語の格納領域の解放.
static NEXTWORD **	nw_expand (NEXTWORD *nwold, int maxlen, NEXTWORD **root, int num)
	次単語候補格納用の NEXTWORD 配列のメモリ領域を伸張する.
static int	can_put_to_stack (NODE new, NODE bottom, int stacknum, int stacksize)
	ある仮説がスタック内に格納されるかどうかチェックする.
static void	wb_init (StackDecode *s)
	Word envelope 用にカウンタを初期化する.
static boolean	wb_ok (StackDecode s, NODE now, int width)
	Word envelope を参照して，与えられた仮説を展開してよいかどうかを返す.
void	segment_set_last_nword (NODE hypo, RecogProcess r)
	認識結果から，次の入力区間の認識を開始する際の初期単語履歴をセットする.
static void	store_result_pass2 (NODE hypo, RecogProcess r)
	第2パスの結果として仮説を保存する.
static void	result_reorder_and_output (NODE r_start, NODE r_bottom, int r_stacknum, int ncan, RecogProcess r, HTK_Param *param)
	スタックから上位の仮説を取り出し，認識結果として出力する.
void	wchmm_fbs (HTK_Param param, RecogProcess r, int cate_bgn, int cate_num)
	第2探索パスであるスタックデコーディングを行うメイン関数

説明

Julius の第2パスであるスタックデコーディングアルゴリズムが記述されています. 第1パスの結果の単語トレリス情報を元に，第1パスとは逆向きの right-to-left に探索を行います. 仮説のスコアは、第1パスのトレリスとそのスコアを未探索部のヒューリスティックとして接続することで，文全体の仮説スコアを考慮しながら探索を行います.

次単語集合の取得のために，単語N-gramでは ngram_decode.c 内の関数が，文法では dfa_decode.c の関数が用いられます.

関数

static NODE * get_best_from_stack	(	NODE **	start,
		int *	stacknum
	)			`[static]`

スタックトップの最尤仮説を取り出す.

引数:

	start	[i/o] スタックの先頭ノードへのポインタ（書換えられる場合あり）
	stacknum	[i/o] 現在のスタックサイズへのポインタ（書き換えあり）

戻り値:: 取り出した最尤仮説のポインタを返す.

search_bestfirst_main.c の 209 行で定義されています。

参照元 put_all_in_stack().

static int put_to_stack	(	NODE *	new,
		NODE **	start,
		NODE **	bottom,
		int *	stacknum,
		int	stacksize
	)			`[static]`

スタックに新たな仮説を格納する.

スタック内のスコア順を考慮した位置に挿入される. 格納できなかった場合，与えられた仮説は free_node() される.

引数:

	new	[in] チェックする仮説
	start	[i/o] スタックのトップノードへのポインタ
	bottom	[i/o] スタックの底ノードへのポインタ
	stacknum	[i/o] スタックに現在格納されているノード数へのポインタ
	stacksize	[in] スタックのノード数の上限

戻り値:: 格納できれば 0 を，できなかった場合は -1 を返す.

search_bestfirst_main.c の 292 行で定義されています。

static void put_all_in_stack	(	NODE **	start,
		int *	stacknum,
		WORD_INFO *	winfo
	)			`[static]`

スタックの中身を全て出力する.

スタックの中身は失われる. (デバッグ用)

引数:

	start	[i/o] スタックのトップノードへのポインタ
	stacknum	[i/o] スタックに現在格納されているノード数へのポインタ
	winfo	[in] 単語辞書

search_bestfirst_main.c の 380 行で定義されています。

static void free_all_nodes ( NODE * start ) [static]

スタック内の全仮説を解放する.

引数:

start

[i/o] スタックのトップノード

search_bestfirst_main.c の 405 行で定義されています。

static void put_hypo_woutput	(	NODE *	hypo,
		WORD_INFO *	winfo
	)			`[static]`

デバッグ用に仮説の単語列を表示する.

引数:

	hypo	[in] 仮説
	winfo	[in] 単語辞書

search_bestfirst_main.c の 926 行で定義されています。

static void put_hypo_wname	(	NODE *	hypo,
		WORD_INFO *	winfo
	)			`[static]`

デバッグ用に仮説の単語N-gramエントリ名（Julianではカテゴリ番号）を出力する.

引数:

	hypo	[in] 仮説
	winfo	[in] 単語辞書

search_bestfirst_main.c の 954 行で定義されています。

static NEXTWORD** nw_malloc	(	int *	maxlen,
		NEXTWORD **	root,
		int	max
	)			`[static]`

次単語の格納領域の割り当て.

次単語候補を格納するための NEXTWORD 配列にメモリを割り付ける.

引数:

	maxlen	[out] 格納可能な単語数
	root	[out] 割り付け領域の先頭へのポインタ
	max	[in] 割り付ける領域のサイズ

戻り値:: 割り付けられた次単語配列へのポインタを返す.

search_bestfirst_main.c の 86 行で定義されています。

static void nw_free	(	NEXTWORD **	nw,
		NEXTWORD *	root
	)			`[static]`

次単語の格納領域の解放.

引数:

	nw	[in] NEXTWORD配列
	root	[in] nw_malloc() で与えられた領域先頭へのポインタ

search_bestfirst_main.c の 118 行で定義されています。

static NEXTWORD** nw_expand	(	NEXTWORD **	nwold,
		int *	maxlen,
		NEXTWORD **	root,
		int	num
	)			`[static]`

次単語候補格納用の NEXTWORD 配列のメモリ領域を伸張する.

この関数は探索中に次単語候補集合が溢れた際に呼ばれ，配列により多くの次単語候補を格納できるよう NEXTWORD の中身を realloc() する. 実際には最初に nw_malloc() で辞書の単語数分だけ領域を確保しており，単語N-gram使用時は呼ばれることはない. 文法認識では，ショートポーズのスキップ処理により状態の異なる候補を同時に展開するので，次単語数が語彙数よりも大きいことが起こりうる.

引数:

	nwold	[i/o] NEXTWORD配列
	maxlen	[i/o] 最大格納数を格納するポインタ. 現在の最大格納数を入れて呼び，関数内で新たに確保された数に変更される.
	root	[i/o] 領域先頭へのポインタを格納するアドレス. 関数内で書き換えられる.
	num	[in] 伸長する長さ

戻り値:: 伸張された新たな次単語配列へのポインタを返す.

search_bestfirst_main.c の 163 行で定義されています。

static int can_put_to_stack	(	NODE *	new,
		NODE **	bottom,
		int *	stacknum,
		int	stacksize
	)			`[static]`

ある仮説がスタック内に格納されるかどうかチェックする.

引数:

	new	[in] チェックする仮説
	bottom	[in] スタックの底ノードへのポインタ
	stacknum	[in] スタックに現在格納されているノード数へのポインタ
	stacksize	[in] スタックのノード数の上限

戻り値:: スタックのサイズが上限に達していないか，スコアが底ノードよりもよければ格納されるとして 0 を，それ以外であれば格納できないとして -1 を返す.

search_bestfirst_main.c の 253 行で定義されています。

static void wb_init ( StackDecode * s ) [static]

Word envelope 用にカウンタを初期化する.

引数:

[i/o] 第2パス用ワークエリア

search_bestfirst_main.c の 730 行で定義されています。

static boolean wb_ok	(	StackDecode *	s,
		NODE *	now,
		int	width
	)			`[static]`

Word envelope を参照して，与えられた仮説を展開してよいかどうかを返す.

また，Word envelope のカウンタを更新する.

引数:

	s	[i/o] 第2パス用ワークエリア
	now	[in] 今から展開しようとしている仮説
	width	[in] 展開カウントの上限値

戻り値:: 展開可能（展開カウントが上限に達していない）なら TRUE, 展開不可能（カウントが上限に達している）なら FALSE を返す.

search_bestfirst_main.c の 764 行で定義されています。

void segment_set_last_nword	(	NODE *	hypo,
		RecogProcess *	r
	)

認識結果から，次の入力区間の認識を開始する際の初期単語履歴をセットする.

透過語および仮説の重複を考慮して初期単語履歴が決定される.

引数:

	hypo	[in] 現在の入力区間の認識結果としての文候補
	r	[in] 認識処理インスタンス

search_bestfirst_main.c の 882 行で定義されています。

static void store_result_pass2	(	NODE *	hypo,
		RecogProcess *	r
	)			`[static]`

第2パスの結果として仮説を保存する.

引数:

	hypo	[in] hypothesis to save
	r	[in] recognition process instance

search_bestfirst_main.c の 980 行で定義されています。

static void result_reorder_and_output	(	NODE **	r_start,
		NODE **	r_bottom,
		int *	r_stacknum,
		int	ncan,
		RecogProcess *	r,
		HTK_Param *	param
	)			`[static]`

スタックから上位の仮説を取り出し，認識結果として出力する.

さらに，スタックに格納されている全ての仮説を解放する.

得られた文候補は，いったん結果格納用のスタックに格納される. 探索終了（"-n" の数だけ文候補が見つかるか，探索が中断される）の後，結果的に得られた文候補の中から上位N個（"-output" で指定された数）の仮説を出力する.

指定があればアラインメントもここで実行する.

引数:

	r_start	[i/o] 結果格納用スタックの先頭ノードへのポインタ
	r_bottom	[i/o] 結果格納用スタックの底ノードへのポインタ
	r_stacknum	[i/o] スタックに格納されているノード数へのポインタ
	ncan	[in] 出力する上位仮説数
	r	[in] 認識処理インスタンス
	param	[in] 入力パラメータ

search_bestfirst_main.c の 1062 行で定義されています。

void wchmm_fbs	(	HTK_Param *	param,
		RecogProcess *	r,
		int	cate_bgn,
		int	cate_num
	)

第2探索パスであるスタックデコーディングを行うメイン関数

引数のうち cate_bgn, cate_num は単語N-gramでは無視される.

引数:

	param	[in] 入力パラメータベクトル列
	r	[i/o] 認識処理インスタンス
	cate_bgn	[in] 展開対象とすべきカテゴリの開始番号
	cate_num	[in] 展開対象とすべきカテゴリの数

search_bestfirst_main.c の 1126 行で定義されています。

libjulius/src/search_bestfirst_main.c

関数

説明

関数