#include <sent/stddefs.h>
#include <sent/ngram2.h>
ngram_read_arpa.cのインクルード依存関係図
関数 | |
static WORD_ID | lookup_word (NGRAM_INFO *ndata, char *str) |
void | set_unknown_id (NGRAM_INFO *ndata) |
Set unknown word ID to the N-gram data. | |
static void | set_total_info (FILE *fp, NGRAM_INFO *ndata) |
static void | set_and_check_total_info (FILE *fp, NGRAM_INFO *ndata) |
static void | set_unigram (FILE *fp, NGRAM_INFO *ndata) |
static void | add_unigram (FILE *fp, NGRAM_INFO *ndata) |
static void | set_bigram (FILE *fp, NGRAM_INFO *ndata) |
static void | add_bigram_rl (FILE *fp, NGRAM_INFO *ndata) |
static void | set_trigram (FILE *fp, NGRAM_INFO *ndata) |
boolean | ngram_read_arpa (FILE *fp, NGRAM_INFO *ndata, int direction) |
void | ngram_compact_bigram_context (NGRAM_INFO *ndata) |
変数 | |
static char | buf [800] |
Local buffer for reading. | |
static char | pbuf [800] |
Local buffer for error string. | |
static boolean | LR_2gram_read = FALSE |
TRUE if LR 2gram has already been read. |
ngram_read_arpa.c で定義されています。
|
Get N-gram word/class id of a string, and terminate program if not found.
ngram_read_arpa.c の 52 行で定義されています。 参照元 add_bigram_rl(), add_unigram(), set_bigram(), と set_trigram(). |
|
Set unknown word ID to the N-gram data. In CMU-Cam SLM toolkit, OOV words are always mapped to <unk>, which always appear at the very beginning of N-gram entry, so we fix the unknown word ID at "0".
ngram_read_arpa.c の 72 行で定義されています。 参照元 ngram_read_arpa(), と ngram_read_bin(). |
|
Set number of N-gram entries, for reading the first LR 2-gram.
ngram_read_arpa.c の 97 行で定義されています。 参照元 ngram_read_arpa(). |
|
Read number of N-gram entries of the second RL 3-gram, and check if those values are exactly the same as the previous LR values.
ngram_read_arpa.c の 121 行で定義されています。 参照元 ngram_read_arpa(). |
|
Read word/class entry names and 1-gram data from LR 2-gram file.
ngram_read_arpa.c の 155 行で定義されています。 参照元 ngram_read_arpa(). |
|
Read 1-gram data from RL 3-gram file. Only the back-off weights are stored.
ngram_read_arpa.c の 220 行で定義されています。 参照元 ngram_read_arpa(). |
|
Read 2-gram data from LR 2-gram file.
ngram_read_arpa.c の 260 行で定義されています。 参照元 ngram_read_arpa(). |
|
Read reverse 2-gram data from RL 3-gram file, and set RL 2-gram probabilities and back-off values for RL 3-gram to the corresponding LR 2-gram data.
ngram_read_arpa.c の 337 行で定義されています。 参照元 ngram_read_arpa(). |
|
Read reverse 3-gram data from RL 3-gram file and store them.
ngram_read_arpa.c の 374 行で定義されています。 参照元 ngram_read_arpa(). |
|
Read in one ARPA N-gram file, either LR 2-gram or RL 3-gram.
ngram_read_arpa.c の 518 行で定義されています。 参照元 init_ngram_arpa(). |
|
Compact the 2-gram context information.
ngram_read_arpa.c の 630 行で定義されています。 参照元 ngram_read_arpa(), と ngram_read_bin(). |