【徳田・南角・橋本研究室】 - ホーム/ソフトウェアの履歴ソース(No.13)

//ブロック要素のセンタリング
//CENTER:[[&ref(01.jpg,center,nolink);>http://hts.sp.nitech.ac.jp/]]


* ソフトウェア [#g38f6265]

> 徳田・李・南角研究室では音声・画像研究の推進のためのソフトウェア等を開発，公開して
おり，様々な機関，企業での研究に利用されています．

** ソフトウェア [#l19f0068]

*** [[HMM/DNN音声合成ツールキット HTS>http://hts.sp.nitech.ac.jp/]] [#t007cfee]

>[[&ref(01.jpg,center,nolink);>http://hts.sp.nitech.ac.jp/]]

> 海外を含め，多くの研究機関 ([[Microsoft>http://www.microsoft.com/ja/jp/default.aspx]], [[IBM>http://www.ibm.com/jp/]], etc) が
採用している音声合成基盤ソフトウェアです．

// *** [[汎用大語彙連続音声認識エンジン Julius>http://julius.sourceforge.jp/]] [#ecd1527f]

// CENTER:[[&ref(02.jpg,center,nolink);>http://julius.sourceforge.jp/]]

// > Julius は，音声認識システムの開発・研究のためのオープ
// ンソースの高性能な汎用大語彙連続音声認識エンジンです．~
// 数万語彙の連続音声認識を一般のPC上で実時間で実行できます．~
// 高い汎用性を持ち，発音辞書や言語モデル・音響モデルなどの
// モジュールを組み替えることで，様々な幅広い用途に応用でき
// ます．~
// 機能はライブラリで提供されており，アプリケーションへの組
// み込みも可能です．

*** [[音声信号処理ツールキット SPTK>http://sp-tk.sourceforge.net/]] [#p892db55]

>[[&ref(03.jpg,center,nolink);>http://sp-tk.sourceforge.net/]]

> 音響分析のための信号処理，データの加工などを行うソフトウェアです．

*** [[音声合成エンジン hts_engine>http://hts-engine.sourceforge.net/]] [#xf0cd5dc]

>[[&ref(07.jpg,center,nolink);>http://hts-engine.sourceforge.net/]]

> HTSで学習したモデルを用いて音声を合成するソフトウェアです．~
BSDライセンスで公開しています．

*** [[日本語テキスト音声合成システム Open JTalk>http://open-jtalk.sourceforge.net/]] [#d002dfda]

>[[&ref(08.jpg,center,nolink);>http://open-jtalk.sourceforge.net/]]

> 日本語のテキストから音声を合成するシステムです．~
波形生成部にhts_engine APIを利用しています．~
BSDライセンスで公開しています．

*** [[HMM/DNN歌声合成システム Sinsy>http://www.sinsy.jp/]] [#t107cfpe]

>[[&ref(10.jpg,center,nolink);>http://www.sinsy.jp/]]

> 隠れマルコフモデル (HMM) / 深層ニューラルネットワーク (DNN) を用いた歌声合成システムです．~
アップロードされた楽譜に基づいて任意の歌声を合成することができます．

*** [[音声対話システム構築ツールキット MMDAgent>http://www.mmdagent.jp/]] [#t107cfee]

>[[&ref(09.jpg,center,nolink);>http://www.mmdagent.jp/]]

> オープンソースの音声インタラクションシステム構築ツールキットです．~
音声合成，音声認識，音声学習機能，3D描画，リップシンクの技術等を組み合わせることで，画面内のキャラクター（MMDモデル）と会話することを実現します．

*** [[擬人化音声対話エージェント Galatea>http://hil.t.u-tokyo.ac.jp/~galatea/index-jp.html]] [#ld44675b]

>[[&ref(04.jpg,center,nolink);>http://hil.t.u-tokyo.ac.jp/~galatea/index-jp.html]]

> 擬人化音声対話エージェントの
オープンソース，ライセンスフリーで公開されている擬人化音声対話エージェントです．~
国内の十数大学などの音声・言語・画像研究者が参加したプロジェクトの成果物であり，
本研究室のソフトウェアであるHTSとJuliusがそれぞれ，音声波形生成部と音声認識部
を担当しています．


** 端末 [#x5040f3b]

*** [[双方向音声案内デジタルサイネージ メイちゃん>http://mei.web.nitech.ac.jp/]] [#fbbec3e1]

>[[&ref(11.jpg,center,nolink);>http://mei.web.nitech.ac.jp/]]

> 名古屋工業大学の正門付近に双方向音声案内デジタルサイネージ “メイちゃん” を設置しました．~
名工大にお越しの際はぜひ喋りかけてみてください．

** データベース [#jf490d57]

*** [[研究用マルチモーダル音声データベース M2TINIT>http://m2tinit.sp.nitech.ac.jp/]] [#m855fd39]

>[[&ref(05.jpg,center,nolink);>http://m2tinit.sp.nitech.ac.jp/]]

> マルチモーダル音声研究の推進のため，[[東京工業大学大学院院総合理工学研究科>http://www.igs.titech.ac.jp/]] [[小林隆夫研究室>http://sp-www.ip.titech.ac.jp/]]，および[[名古屋工業大学>http://www.nitech.ac.jp/]]知能情報システム学科 北村・徳田研究室 (現在，[[情報工学科>http://www.cs.nitech.ac.jp/]] [[徳田・李・南角研究室>http://www.sp.nitech.ac.jp]])が開発・公開する音声・唇動画像同時収録データベースです．~
これまでに音声・唇動画像の生成やバイモーダル音声認識の研究に利用されています．