認知アルゴリズム特論

課題2 ML推定


お知らせ

12月1日(火)の講義は休みにします。また、レポートの提出期限を12月 7日(月)としましたので、注意して下さい。


前回の課題では、各カテゴリの真の分布が明らかな場合 について、ベイズ識別とユークリッド距離による識別を行なった。 今回は、各カテゴリの真の分布が未知だが、各カテゴリ の学習用データが得られる場合について考える。つまり、各カテゴリの学習用 データから各カテゴリの分布を ML 推定によって推定し、この分布 を用いて、テスト用データのベイズ識別およびユークリッド距離による識別 を行なう。

  1. 前回の課題と同様の実験を,学習データからML推定により得られた各カテゴリの 分布を用いて行なう.

    真の分布を用いた場合と,ML推定で得られた分布を用いた場合との違いを 考察する.(各カテゴリの分布や学習データ数などを変えて考察する)

  2. 話者 12 人の音声データ(「あ」「い」「う」「え」「お」の5母音をそ れぞれ 20 回ずつ)から得られた 16 次元のケプストラム係数(音声信号から 抽出された特徴ベクトル)を学習データとし、ベイズ識別を行なう. 各クラスの分布は,多次元ガウス分布とする.共分散行列は対角を仮定してもよい.

    例えば、6 人分のデータを学習用データとし、それぞれのクラスの平均と分散 を求める。これらの値を ML 推定値とし、テスト用データ(学習に用いていな い別の 6 人分) のベイズ識別およびユークリッド距離による識別を行なえば 良い。


課題に関する参考事項


Last modified: November 24, 1998