ソフトウェア

徳田・南角・橋本研究室では音声・画像研究の推進のためのソフトウェア等を開発,公開しており,様々な機関,企業での研究に利用されています.

ソフトウェア

HMM/DNN音声合成ツールキット HTS

01.jpg

海外を含め,多くの研究機関 (Microsoft, IBM, etc) が 採用している音声合成基盤ソフトウェアです.

音声信号処理ツールキット SPTK

03.jpg

音響分析のための信号処理,データの加工などを行うソフトウェアです.

音声合成エンジン hts_engine

07.jpg

HTSで学習したモデルを用いて音声を合成するソフトウェアです.
BSDライセンスで公開しています.

日本語テキスト音声合成システム Open JTalk

08.jpg

日本語のテキストから音声を合成するシステムです.
波形生成部にhts_engine APIを利用しています.
BSDライセンスで公開しています.

HMM/DNN歌声合成システム Sinsy

10.jpg

隠れマルコフモデル (HMM) / 深層ニューラルネットワーク (DNN) を用いた歌声合成システムです.
アップロードされた楽譜に基づいて任意の歌声を合成することができます.

音声対話システム構築ツールキット MMDAgent

09.jpg

オープンソースの音声インタラクションシステム構築ツールキットです.
音声合成,音声認識,音声学習機能,3D描画,リップシンクの技術等を組み合わせることで,画面内のキャラクター(MMDモデル)と会話することを実現します.

擬人化音声対話エージェント Galatea

04.jpg

擬人化音声対話エージェントの オープンソース,ライセンスフリーで公開されている擬人化音声対話エージェントです.
国内の十数大学などの音声・言語・画像研究者が参加したプロジェクトの成果物であり, 本研究室のソフトウェアであるHTSとJuliusがそれぞれ,音声波形生成部と音声認識部 を担当しています.

端末

双方向音声案内デジタルサイネージ メイちゃん

11.jpg

名古屋工業大学の正門付近に双方向音声案内デジタルサイネージ “メイちゃん” を設置しました.
名工大にお越しの際はぜひ喋りかけてみてください.

データベース

研究用マルチモーダル音声データベース M2TINIT

05.jpg

マルチモーダル音声研究の推進のため,東京工業大学大学院院総合理工学研究科 小林隆夫研究室,および名古屋工業大学知能情報システム学科 北村・徳田研究室 (現在,情報工学科 徳田・李・南角研究室)が開発・公開する音声・唇動画像同時収録データベースです.
これまでに音声・唇動画像の生成やバイモーダル音声認識の研究に利用されています.





files: file02.jpg 1875件 [詳細] file06.jpg 1716件 [詳細] file07.jpg 1651件 [詳細] file09.jpg 728件 [詳細] file01.jpg 1852件 [詳細] file08.jpg 1702件 [詳細] file04.jpg 1939件 [詳細] file11.jpg 720件 [詳細] file05.jpg 1857件 [詳細] file10.jpg 737件 [詳細] file03.jpg 1663件 [詳細]
トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS