ソフトウェア

徳田・李・南角研究室では音声・画像研究の推進のためのソフトウェア等を開発,公開して おり,様々な機関,企業での研究に利用されています.

ソフトウェア

HMM/DNN音声合成ツールキット HTS

01.jpg

海外を含め,多くの研究機関 (Microsoft, IBM, etc) が 採用している音声合成基盤ソフトウェアです.

音声信号処理ツールキット SPTK

03.jpg

音響分析のための信号処理,データの加工などを行うソフトウェアです.

音声合成エンジン hts_engine

07.jpg

HTSで学習したモデルを用いて音声を合成するソフトウェアです.
BSDライセンスで公開しています.

日本語テキスト音声合成システム Open JTalk

08.jpg

日本語のテキストから音声を合成するシステムです.
波形生成部にhts_engine APIを利用しています.
BSDライセンスで公開しています.

HMM/DNN歌声合成システム Sinsy

10.jpg

隠れマルコフモデル (HMM) / 深層ニューラルネットワーク (DNN) を用いた歌声合成システムです.
アップロードされた楽譜に基づいて任意の歌声を合成することができます.

音声対話システム構築ツールキット MMDAgent

09.jpg

オープンソースの音声インタラクションシステム構築ツールキットです.
音声合成,音声認識,音声学習機能,3D描画,リップシンクの技術等を組み合わせることで,画面内のキャラクター(MMDモデル)と会話することを実現します.

擬人化音声対話エージェント Galatea

04.jpg

擬人化音声対話エージェントの オープンソース,ライセンスフリーで公開されている擬人化音声対話エージェントです.
国内の十数大学などの音声・言語・画像研究者が参加したプロジェクトの成果物であり, 本研究室のソフトウェアであるHTSとJuliusがそれぞれ,音声波形生成部と音声認識部 を担当しています.

端末

双方向音声案内デジタルサイネージ メイちゃん

11.jpg

名古屋工業大学の正門付近に双方向音声案内デジタルサイネージ “メイちゃん” を設置しました.
名工大にお越しの際はぜひ喋りかけてみてください.

データベース

研究用マルチモーダル音声データベース M2TINIT

05.jpg

マルチモーダル音声研究の推進のため,東京工業大学大学院院総合理工学研究科 小林隆夫研究室,および名古屋工業大学知能情報システム学科 北村・徳田研究室 (現在,情報工学科 徳田・李・南角研究室)が開発・公開する音声・唇動画像同時収録データベースです.
これまでに音声・唇動画像の生成やバイモーダル音声認識の研究に利用されています.





トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS