【徳田・南角・橋本研究室】 - ホーム/ソフトウェア

ソフトウェア

徳田・南角・橋本研究室では音声・画像研究の推進のためのソフトウェア等を開発，公開しており，様々な機関，企業での研究に利用されています．

ソフトウェア

HMM/DNN音声合成ツールキット HTS

海外を含め，多くの研究機関 (Microsoft, IBM, etc) が採用している音声合成基盤ソフトウェアです．

音声信号処理ツールキット SPTK

音響分析のための信号処理，データの加工などを行うソフトウェアです．

音声合成エンジン hts_engine

HTSで学習したモデルを用いて音声を合成するソフトウェアです．
BSDライセンスで公開しています．

日本語テキスト音声合成システム Open JTalk

日本語のテキストから音声を合成するシステムです．
波形生成部にhts_engine APIを利用しています．
BSDライセンスで公開しています．

HMM/DNN歌声合成システム Sinsy

隠れマルコフモデル (HMM) / 深層ニューラルネットワーク (DNN) を用いた歌声合成システムです．
アップロードされた楽譜に基づいて任意の歌声を合成することができます．

音声対話システム構築ツールキット MMDAgent

オープンソースの音声インタラクションシステム構築ツールキットです．
音声合成，音声認識，音声学習機能，3D描画，リップシンクの技術等を組み合わせることで，画面内のキャラクター（MMDモデル）と会話することを実現します．

擬人化音声対話エージェント Galatea

擬人化音声対話エージェントのオープンソース，ライセンスフリーで公開されている擬人化音声対話エージェントです．
国内の十数大学などの音声・言語・画像研究者が参加したプロジェクトの成果物であり，本研究室のソフトウェアであるHTSとJuliusがそれぞれ，音声波形生成部と音声認識部を担当しています．

端末

双方向音声案内デジタルサイネージメイちゃん

名古屋工業大学の正門付近に双方向音声案内デジタルサイネージ “メイちゃん” を設置しました．
名工大にお越しの際はぜひ喋りかけてみてください．

データベース

研究用マルチモーダル音声データベース M2TINIT

マルチモーダル音声研究の推進のため，東京工業大学大学院院総合理工学研究科小林隆夫研究室，および名古屋工業大学知能情報システム学科北村・徳田研究室 (現在，情報工学科徳田・李・南角研究室)が開発・公開する音声・唇動画像同時収録データベースです．
これまでに音声・唇動画像の生成やバイモーダル音声認識の研究に利用されています．