//ブロック要素のセンタリング //CENTER:[[&ref(01.jpg,center,nolink);>http://hts.sp.nitech.ac.jp/]] * ソフトウェア [#g38f6265] > 徳田・李・南角研究室では音声・画像研究の推進のためのソフトウェア等を開発,公開して おり,様々な機関,企業での研究に利用されています. ** ソフトウェア [#l19f0068] *** [[HMM/DNN音声合成ツールキット HTS>http://hts.sp.nitech.ac.jp/]] [#t007cfee] >[[&ref(01.jpg,center,nolink);>http://hts.sp.nitech.ac.jp/]] > 海外を含め,多くの研究機関 ([[Microsoft>http://www.microsoft.com/ja/jp/default.aspx]], [[IBM>http://www.ibm.com/jp/]], etc) が 採用している音声合成基盤ソフトウェアです. // *** [[汎用大語彙連続音声認識エンジン Julius>http://julius.sourceforge.jp/]] [#ecd1527f] // CENTER:[[&ref(02.jpg,center,nolink);>http://julius.sourceforge.jp/]] // > Julius は,音声認識システムの開発・研究のためのオープ // ンソースの高性能な汎用大語彙連続音声認識エンジンです.~ // 数万語彙の連続音声認識を一般のPC上で実時間で実行できます.~ // 高い汎用性を持ち,発音辞書や言語モデル・音響モデルなどの // モジュールを組み替えることで,様々な幅広い用途に応用でき // ます.~ // 機能はライブラリで提供されており,アプリケーションへの組 // み込みも可能です. *** [[音声信号処理ツールキット SPTK>http://sp-tk.sourceforge.net/]] [#p892db55] >[[&ref(03.jpg,center,nolink);>http://sp-tk.sourceforge.net/]] > 音響分析のための信号処理,データの加工などを行うソフトウェアです. *** [[音声合成エンジン hts_engine>http://hts-engine.sourceforge.net/]] [#xf0cd5dc] >[[&ref(07.jpg,center,nolink);>http://hts-engine.sourceforge.net/]] > HTSで学習したモデルを用いて音声を合成するソフトウェアです.~ BSDライセンスで公開しています. *** [[日本語テキスト音声合成システム Open JTalk>http://open-jtalk.sourceforge.net/]] [#d002dfda] >[[&ref(08.jpg,center,nolink);>http://open-jtalk.sourceforge.net/]] > 日本語のテキストから音声を合成するシステムです.~ 波形生成部にhts_engine APIを利用しています.~ BSDライセンスで公開しています. *** [[HMM/DNN歌声合成システム Sinsy>http://www.sinsy.jp/]] [#t107cfpe] >[[&ref(10.jpg,center,nolink);>http://www.sinsy.jp/]] > 隠れマルコフモデル (HMM) / 深層ニューラルネットワーク (DNN) を用いた歌声合成システムです.~ アップロードされた楽譜に基づいて任意の歌声を合成することができます. *** [[音声対話システム構築ツールキット MMDAgent>http://www.mmdagent.jp/]] [#t107cfee] >[[&ref(09.jpg,center,nolink);>http://www.mmdagent.jp/]] > オープンソースの音声インタラクションシステム構築ツールキットです.~ 音声合成,音声認識,音声学習機能,3D描画,リップシンクの技術等を組み合わせることで,画面内のキャラクター(MMDモデル)と会話することを実現します. *** [[擬人化音声対話エージェント Galatea>http://hil.t.u-tokyo.ac.jp/~galatea/index-jp.html]] [#ld44675b] >[[&ref(04.jpg,center,nolink);>http://hil.t.u-tokyo.ac.jp/~galatea/index-jp.html]] > 擬人化音声対話エージェントの オープンソース,ライセンスフリーで公開されている擬人化音声対話エージェントです.~ 国内の十数大学などの音声・言語・画像研究者が参加したプロジェクトの成果物であり, 本研究室のソフトウェアであるHTSとJuliusがそれぞれ,音声波形生成部と音声認識部 を担当しています. ** 端末 [#x5040f3b] *** [[双方向音声案内デジタルサイネージ メイちゃん>http://mei.web.nitech.ac.jp/]] [#fbbec3e1] >[[&ref(11.jpg,center,nolink);>http://mei.web.nitech.ac.jp/]] > 名古屋工業大学の正門付近に双方向音声案内デジタルサイネージ “メイちゃん” を設置しました.~ 名工大にお越しの際はぜひ喋りかけてみてください. ** データベース [#jf490d57] *** [[研究用マルチモーダル音声データベース M2TINIT>http://m2tinit.sp.nitech.ac.jp/]] [#m855fd39] >[[&ref(05.jpg,center,nolink);>http://m2tinit.sp.nitech.ac.jp/]] > マルチモーダル音声研究の推進のため,[[東京工業大学大学院院総合理工学研究科>http://www.igs.titech.ac.jp/]] [[小林隆夫研究室>http://sp-www.ip.titech.ac.jp/]],および[[名古屋工業大学>http://www.nitech.ac.jp/]]知能情報システム学科 北村・徳田研究室 (現在,[[情報工学科>http://www.cs.nitech.ac.jp/]] [[徳田・李・南角研究室>http://www.sp.nitech.ac.jp]])が開発・公開する音声・唇動画像同時収録データベースです.~ これまでに音声・唇動画像の生成やバイモーダル音声認識の研究に利用されています.