* ソフトウェア [#g38f6265]

> 徳田・李研究室では音声・画像研究の推進のためのソフトウェア等を開発,公開して
> 徳田・李・南角研究室では音声・画像研究の推進のためのソフトウェア等を開発,公開して
おり,様々な機関,企業での研究に利用されています.

** ソフトウェア [#l19f0068]

*** [[HMM音声合成ツールキット HTS>http://hts.sp.nitech.ac.jp/]] [#t007cfee]

CENTER:[[&ref(01.jpg,center,nolink);>http://hts.sp.nitech.ac.jp/]]

> 海外を含め,多くの研究機関 ([[Microsoft>http://www.microsoft.com/ja/jp/default.aspx]], [[IBM>http://www.ibm.com/jp/]], etc) が
採用している音声合成基盤ソフトウェアです.

*** [[汎用大語彙連続音声認識エンジン Julius>http://julius.sourceforge.jp/]] [#ecd1527f]

CENTER:[[&ref(02.jpg,center,nolink);>http://julius.sourceforge.jp/]]

> Julius は,音声認識システムの開発・研究のためのオープ
ンソースの高性能な汎用大語彙連続音声認識エンジンです.~
数万語彙の連続音声認識を一般のPC上で実時間で実行できます.~
高い汎用性を持ち,発音辞書や言語モデル・音響モデルなどの
モジュールを組み替えることで,様々な幅広い用途に応用でき
ます.~
機能はライブラリで提供されており,アプリケーションへの組
み込みも可能です.

*** [[音声信号処理ツールキット SPTK>http://sp-tk.sourceforge.net/]] [#p892db55]

CENTER:[[&ref(03.jpg,center,nolink);>http://sp-tk.sourceforge.net/]]

> 音響分析のための信号処理,データの加工などを行うソフトウェアです.

*** [[音声合成エンジン hts_engine>http://hts-engine.sourceforge.net/]] [#xf0cd5dc]

CENTER:[[&ref(07.jpg,center,nolink);>http://hts-engine.sourceforge.net/]]

> HTSで学習したモデルを用いて音声を合成するソフトウェアです.~
BSDライセンスで公開しています.

*** [[日本語テキスト音声合成システム Open JTalk>http://open-jtalk.sourceforge.net/]] [#d002dfda]

CENTER:[[&ref(08.jpg,center,nolink);>http://open-jtalk.sourceforge.net/]]

> 日本語のテキストから音声を合成するシステムです.~
波形生成部にhts_engine APIを利用しています.~
BSDライセンスで公開しています.

*** [[擬人化音声対話エージェント Galatea>http://hil.t.u-tokyo.ac.jp/~galatea/index-jp.html]] [#ld44675b]

CENTER:[[&ref(04.jpg,center,nolink);>http://hil.t.u-tokyo.ac.jp/~galatea/index-jp.html]]

> 擬人化音声対話エージェントの
オープンソース,ライセンスフリーで公開されている擬人化音声対話エージェントです.~
国内の十数大学などの音声・言語・画像研究者が参加したプロジェクトの成果物であり,
本研究室のソフトウェアであるHTSとJuliusがそれぞれ,音声波形生成部と音声認識部
を担当しています.

** 端末 [#x5040f3b]

*** [[名工大 音声対話端末 めいちゃん>http://d.hatena.ne.jp/nit_mei]] [#fbbec3e1]

CENTER:[[&ref(06.jpg,center,nolink);>http://d.hatena.ne.jp/nit_mei]]

> 名古屋工業大学2号館の1階に音声情報案内端末を設置しました.~
名工大にお越しの際はぜひ喋りかけてみてください.

** データベース [#jf490d57]

*** [[研究用マルチモーダル音声データベース M2TINIT>http://m2tinit.sp.nitech.ac.jp/]] [#m855fd39]

CENTER:[[&ref(05.jpg,center,nolink);>http://m2tinit.sp.nitech.ac.jp/]]

> マルチモーダル音声研究の推進のため,[[東京工業大学大学院院総合理工学研究科>http://www.igs.titech.ac.jp/]] [[小林隆夫研究室>http://sp-www.ip.titech.ac.jp/]],および[[名古屋工業大学>http://www.nitech.ac.jp/]]知能情報システム学科 北村・徳田研究室 (現在,[[情報工学科>http://www.cs.nitech.ac.jp/]] [[徳田・李研究室>http://www.sp.nitech.ac.jp]])が開発・公開する音声・唇動画像同時収録データベースです.~
> マルチモーダル音声研究の推進のため,[[東京工業大学大学院院総合理工学研究科>http://www.igs.titech.ac.jp/]] [[小林隆夫研究室>http://sp-www.ip.titech.ac.jp/]],および[[名古屋工業大学>http://www.nitech.ac.jp/]]知能情報システム学科 北村・徳田研究室 (現在,[[情報工学科>http://www.cs.nitech.ac.jp/]] [[徳田・李・南角研究室>http://www.sp.nitech.ac.jp]])が開発・公開する音声・唇動画像同時収録データベースです.~
これまでに音声・唇動画像の生成やバイモーダル音声認識の研究に利用されています.





トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS