* EXHIBITION [#te5cb5d6]

> In Tokuda & Lee laboratory, softwares for promotion of speech and image research  are developed and opened to the public. These are used  to research in various organizations and companies.

//> 徳田・李研究室では音声・画像研究の推進のためのソフトウェア等を開発,公開して
//おり,様々な機関,企業での研究に利用されています.

** Software [#od9a694f]

*** HMM Speech Sysnthesis System toolkit: HTS [#k67a045b]

#ref(01.jpg,center,nolink);

> HTS is a basic software for speech synthesis that a lot of research laboratories ([[Microsoft>http://www.microsoft.com/en/us/default.aspx]], [[IBM>http://www.ibm.com/us/]], etc) adopt.

> [[Here>http://hts.sp.nitech.ac.jp/]]

*** Open-source large vocabulary continuous speech recognition engine: Julius [#w94d774a]

#ref(02.jpg,center,nolink);

> This is a speech recognition software that is adopted by various research laboratories, and maintains Google Rank of the top of Japan as free software.
//> フリーソフトとしては日本一のGoogle Rankを保持し,
//様々な研究機関で採用されている音声認識ソフトウェアです.

> [[Here>http://julius.sourceforge.jp/en_index.php?q=index-en.html]]

*** Speech signal processing toolkit: SPTK [#j89fcdd2]

#ref(03.jpg,center,nolink);

> This is a software that does signal processing and data processing for the acoustical analysis. 
//音響分析のための信号処理やデータの加工などを行うソフトウェアです.

> [[Here>http://sp-tk.sourceforge.net/]]

//- [[韻律・言語情報編集ツール PLEd:http://www.sp.nitech.ac.jp/~tokuda/PLEd/]]

*** Anthropomorphic spoken dialogue agent: Galatea [#w7c29df7]

#ref(04.jpg,center,nolink);

>This is an open-source, license-free software toolkit for building anthropomorphic spoken dialogue agents. This is a product of project which speech, language, and image researchers from ten or more university in Japan participate to build anthropomorphic spoken dialogue agents. HTS and Julius, those are developed in this laboratory, are used on speech wave form generation module and speech recognition module respectively in this software.

//> 擬人化音声対話エージェントの
//オープンソース,ライセンスフリーで公開されている擬人化音声対話エージェントです.~
//国内の十数大学などの音声・言語・画像研究者が参加したプロジェクトの成果物であり,
//本研究室のソフトウェアであるHTSとJuliusがそれぞれ,音声波形生成部と音声認識部
//を担当しています.

> [[Here>http://hil.t.u-tokyo.ac.jp/~galatea/index.html]]

//** デモ [#s3e54a0a]
//*** [[GalateaTalk:http://www.sp.nitech.ac.jp/~demo/tts/gtalk.php]] [#ddad24a2]
//> なんたらかんたら.

** Data base [#g698609d]

*** Multimodal speech data base for research: M2TINIT [#ib4d29e6]

#ref(05.jpg,center,nolink);


> M2TINIT is a multi-modal data base which japanese speech and lip dynamic scene are recorded concurrently. It is developed and opened to the public by [[Takao Kobayashi laboratory>http://www.kbys.ip.titech.ac.jp/]] ([[Interdisciplinary Graduate School of Science and Engineering, Tokyo Institute of Technology>http://www.igs.titech.ac.jp/index_English.html]]) and Kitamura & Tokuda laboratory ([[Department of Computer Science, Nagoya Institute of Technology>http://eng.nitech.ac.jp/faculty_day05.html]]. Currently, [[Tokuda & Lee laboratory>http://www.sp.nitech.ac.jp]]) for promotion of multi-modal speech research. It has been used to researches that are generation of speech and lip dynamic scene and bimodal speech recognition.

//> マルチモーダル音声研究の推進のため,東京工業大学大学院院総合理工学研究科 小林//隆夫研究室,および名古屋工業大学知能情報システム学科 北村・徳田研究室(現在,情//報工学科 徳田・李研究室)が開発・公開する音声・唇動画像同時収録データベースです.~
//これまでに音声・唇動画像の生成やバイモーダル音声認識の研究に利用されています.

> [[Here (Japanese page)>http://m2tinit.sp.nitech.ac.jp/]]




トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS