認知アルゴリズム特論

課題3 EM アルゴリズム


お知らせ

レポートの提出期限を1月11日(月)としましたが、 できた人から早めに提出して下さい。早く提出したことは評価します。


前回の課題では、各カテゴリの真の分布が未知だが、各カテゴリ の学習用データが得られる場合について考えた。 今回は、学習データにラベルがない場合(各学習サンプルがどの カテゴリのものかわからない場合:アンスーパーバイズド学習)を考え、 EMアルゴリズムにより各カテゴリの分布をML推定する。 また、得られた分布を用いて、テスト用データのベイズ識別を行なう。

  1. 真のモデルがわかっているとき
  2. スーパーバイズド学習によるML推定を用いたとき
  3. アンスーパーバイズド学習によるML推定を用いたとき

のモデル推定精度、認識率などを いくつかの条件(真の平均、分散、学習データの数など)のもとで比較する。

また、同様の実験を特徴ベクトルが多次元の場合についても行なう。 但し、共分散行列は対角を仮定する。


課題に関する参考事項

初期モデルは、適当にいくつか与えて試してみる。 一般には、以下のような方法が用いられる。


Last modified: December 15, 1998