12月1日(火)の講義は休みにします。また、レポートの提出期限を12月 7日(月)としましたので、注意して下さい。
前回の課題では、各カテゴリの真の分布が明らかな場合 について、ベイズ識別とユークリッド距離による識別を行なった。 今回は、各カテゴリの真の分布が未知だが、各カテゴリ の学習用データが得られる場合について考える。つまり、各カテゴリの学習用 データから各カテゴリの分布を ML 推定によって推定し、この分布 を用いて、テスト用データのベイズ識別およびユークリッド距離による識別 を行なう。
真の分布を用いた場合と,ML推定で得られた分布を用いた場合との違いを 考察する.(各カテゴリの分布や学習データ数などを変えて考察する)
例えば、6 人分のデータを学習用データとし、それぞれのクラスの平均と分散 を求める。これらの値を ML 推定値とし、テスト用データ(学習に用いていな い別の 6 人分) のベイズ識別およびユークリッド距離による識別を行なえば 良い。
バイナリ形式(float 型) : [ cepstrum.tar.gz ]
※ 解凍すると大量のファイルが生成されますのでご注意ください。