【徳田・南角・橋本研究室】 - ホーム/ソフトウェアの履歴差分(No.8)

追加された行はこの色です。
削除された行はこの色です。
* ソフトウェア [#g38f6265]

> 徳田・李研究室では音声・画像研究の推進のためのソフトウェア等を開発，公開して
> 徳田・李・南角研究室では音声・画像研究の推進のためのソフトウェア等を開発，公開して
おり，様々な機関，企業での研究に利用されています．

** ソフトウェア [#l19f0068]

*** [[HMM音声合成ツールキット HTS>http://hts.sp.nitech.ac.jp/]] [#t007cfee]

CENTER:[[&ref(01.jpg,center,nolink);>http://hts.sp.nitech.ac.jp/]]

> 海外を含め，多くの研究機関 ([[Microsoft>http://www.microsoft.com/ja/jp/default.aspx]], [[IBM>http://www.ibm.com/jp/]], etc) が
採用している音声合成基盤ソフトウェアです．

*** [[汎用大語彙連続音声認識エンジン Julius>http://julius.sourceforge.jp/]] [#ecd1527f]

CENTER:[[&ref(02.jpg,center,nolink);>http://julius.sourceforge.jp/]]

> Julius は，音声認識システムの開発・研究のためのオープ
ンソースの高性能な汎用大語彙連続音声認識エンジンです．~
数万語彙の連続音声認識を一般のPC上で実時間で実行できます．~
高い汎用性を持ち，発音辞書や言語モデル・音響モデルなどの
モジュールを組み替えることで，様々な幅広い用途に応用でき
ます．~
機能はライブラリで提供されており，アプリケーションへの組
み込みも可能です．

*** [[音声信号処理ツールキット SPTK>http://sp-tk.sourceforge.net/]] [#p892db55]

CENTER:[[&ref(03.jpg,center,nolink);>http://sp-tk.sourceforge.net/]]

> 音響分析のための信号処理，データの加工などを行うソフトウェアです．

*** [[音声合成エンジン hts_engine>http://hts-engine.sourceforge.net/]] [#xf0cd5dc]

CENTER:[[&ref(07.jpg,center,nolink);>http://hts-engine.sourceforge.net/]]

> HTSで学習したモデルを用いて音声を合成するソフトウェアです．~
BSDライセンスで公開しています．

*** [[日本語テキスト音声合成システム Open JTalk>http://open-jtalk.sourceforge.net/]] [#d002dfda]

CENTER:[[&ref(08.jpg,center,nolink);>http://open-jtalk.sourceforge.net/]]

> 日本語のテキストから音声を合成するシステムです．~
波形生成部にhts_engine APIを利用しています．~
BSDライセンスで公開しています．

*** [[擬人化音声対話エージェント Galatea>http://hil.t.u-tokyo.ac.jp/~galatea/index-jp.html]] [#ld44675b]

CENTER:[[&ref(04.jpg,center,nolink);>http://hil.t.u-tokyo.ac.jp/~galatea/index-jp.html]]

> 擬人化音声対話エージェントの
オープンソース，ライセンスフリーで公開されている擬人化音声対話エージェントです．~
国内の十数大学などの音声・言語・画像研究者が参加したプロジェクトの成果物であり，
本研究室のソフトウェアであるHTSとJuliusがそれぞれ，音声波形生成部と音声認識部
を担当しています．

** 端末 [#x5040f3b]

*** [[名工大 音声対話端末 めいちゃん>http://d.hatena.ne.jp/nit_mei]] [#fbbec3e1]

CENTER:[[&ref(06.jpg,center,nolink);>http://d.hatena.ne.jp/nit_mei]]

> 名古屋工業大学2号館の1階に音声情報案内端末を設置しました．~
名工大にお越しの際はぜひ喋りかけてみてください．

** データベース [#jf490d57]

*** [[研究用マルチモーダル音声データベース M2TINIT>http://m2tinit.sp.nitech.ac.jp/]] [#m855fd39]

CENTER:[[&ref(05.jpg,center,nolink);>http://m2tinit.sp.nitech.ac.jp/]]

> マルチモーダル音声研究の推進のため，[[東京工業大学大学院院総合理工学研究科>http://www.igs.titech.ac.jp/]] [[小林隆夫研究室>http://sp-www.ip.titech.ac.jp/]]，および[[名古屋工業大学>http://www.nitech.ac.jp/]]知能情報システム学科 北村・徳田研究室 (現在，[[情報工学科>http://www.cs.nitech.ac.jp/]] [[徳田・李研究室>http://www.sp.nitech.ac.jp]])が開発・公開する音声・唇動画像同時収録データベースです．~
> マルチモーダル音声研究の推進のため，[[東京工業大学大学院院総合理工学研究科>http://www.igs.titech.ac.jp/]] [[小林隆夫研究室>http://sp-www.ip.titech.ac.jp/]]，および[[名古屋工業大学>http://www.nitech.ac.jp/]]知能情報システム学科 北村・徳田研究室 (現在，[[情報工学科>http://www.cs.nitech.ac.jp/]] [[徳田・李・南角研究室>http://www.sp.nitech.ac.jp]])が開発・公開する音声・唇動画像同時収録データベースです．~
これまでに音声・唇動画像の生成やバイモーダル音声認識の研究に利用されています．