2005年度 メディアパターン処理特論 レポート課題
「パターン認識に関する小規模なシミュレーションを行い,考察を加えてください」
各人オリジナルなレポート課題を提案してください.提案されたテー
マは以下に列挙します.他の人が既に提案した課題は提案できません
(先着順).
まず,提案テーマのタイトルと100字程度の概要を7月8日(金)ま
でに以下宛に送ってください.メイルのSubject(件名)は必ずpattern
としてください.
テーマ提案 締め切り: |
7月 8日(金) |
テーマ説明: |
7月 11日(月) |
レポート締め切り: |
7月25日(月) |
- レポート提出先:
- できればpdfで,webに置くかメイルで送るかして下さい.
提案課題一覧
- ニューラルネットを用いた文字画像の識別 (pdf)
ニューラルネットに対し,いくつかの数字やアルファベット等の画像を
学習させ,学習済みのニューラルネットを用いて文字を識別させる.学
習データや認識対象に手を加えることによる認識率の変化について考察
する.
- DPマッチングによる英単語識別・簡易英文作成 (pdf)
あらかじめリファレンスとなる簡単な英単語をいくつか用意しておき,
文章を構成する(ただしランダムな順序で与える)単語群をそれぞれDP
マッチングにより識別する.その際,リファレンスとなる単語には文要
素(「主語(S)」,「述語(V)」,「目的語(O)」…)の識別子を与えて
おき,ランダムな順序で与えられた単語は,正しい文構成となるように
並び替え,出力結果とする.
- 孤立数字単語認識 (pdf)
複数の話者による数字単語音声をHMMを用いてモデル化し,そのモデル
を用いて何と言っているかを認識する.
- 連続音声認識 (pdf)
連続音声を音素単位でHMMでモデル化し,認識を行う.
- 声質をコンテキストとしたモデルに基づく講演音声のHMM連続音声認識 (pdf)
課題として,僕は声質をコンテキストとしたモデルに基づく講演音声の
HMM連続音声認識をやります.
- 手書き数字の識別実験 (pdf)
「線形判別法」を使って手書き数字の識別実験をしようと思っています。
最初は、2クラスからやって、うまくできたら、クラスの数を増やそう
と思っています。
- 英語のローマ字の識別実験 (pdf)
複素PARCOR係数の誤差二乗和によってローマ字を認識して、うまくでき
たら、数字認識したいと思います。
- テンプレートマッチングを用いた画像認識 (pdf)
対象画像から目的のパターンを探し出す手法としてテンプレートマッチ
ングが用いられるが、その手法を利用し文字や数字などを検出する。
- HMM(GMM)に基づくジェスチャー/手話の認識 (pdf)
自分の行っている研究とは少し違った視点で認識実験をしたいと思いま
す.まだ詳しく考えていませんが,モデル化に混合数 1 の HMM を用い
るのと混合数を増やした GMM を用いるのと認識結果や作成されたモデ
ルを比較し,時系列のデータをモデル化するのに適しているのはどちら
かを明らかにしたいと思います.特徴ベクトルとして用いるデータを普
段研究で用いていないものを用いることも考えています.
- 音韻情報を用いたHMMモデルによる手話のジェスチャー認識 (pdf)
基本的な手話の手形や動きが定義された手話音韻表記表を使って手話単
語を音韻情報でラベル化します.ラベル化された単語のデータベースで
HMMをモデル化し手話単語の認識を行なう
- 最小分類誤り(MCE)学習を用いた話者識別 (pdf)
混合ガウスモデル(GMM)に本人を含まない状況で,統合重みのみをMCE
学習することにより,話者識別を行います.学習データの単語数や初期
値,男女の比率など,色々と変化させて比較・検討したいと思います.
- HSMMに基づく音声認識 (pdf)
HSMMに基づく音声認識でお願いします.
- KL展開を用いた蝶の画像の圧縮 (pdf)
数種の蝶の羽の画像をサンプルとして,それらをKL展開で圧縮する.
そして,復元画像と原画像の比較をする.
- 母音音声の線形予測係数を用いた音声認識 (pdf)
母音のパワーが最大となるフレームの線形予測係数を GMM でモデル化し
母音を認識したいと思います.
- 色のパターンマッチングを行い考察する (pdf)
RGBの値で色を扱い,サンプルを学習させることで,色の識別を行う.
学習するサンプルに手を加えたときの色の識別の変化について考察する.
- 経路の探索に基づく連続音声認識 (pdf)
認識結果に与える影響が少ないと考えられる経路を,確立計算から除外
した連続音声認識をやってみます.比較的小規模な連続音声において,
全ての経路を考慮した場合と計算量を比較し,考察をしたいと思います.
- 連続音声認識における多段階共有構造の混合モデル化 (pdf)
コンテキストクラスタリング時に途中のノードも全て混合ガウス分布と
して保持した音響モデルを作成し,大語意連続音声認識を行う.
- 状態クラスタリングを用いた分離型2次元格子HMMにおける顔画像
認識 (pdf)
従来の分離型2次元格子HMMにおける画像認識よりも画像の生成過程をよ
り適切に表現でき、識別的なモデルパラメータが推定できると考えられ
ます。
- 画像の類似度評価 (pdf)
各画像間の、サンプル画像群内での相対的類似度をSOMによる
教師なし学習で評価します。
Last modified: June 27, 2005