【南角・橋本研究室】 - ホーム/ソフトウェアの履歴(No.10)

ソフトウェア

徳田・李・南角研究室では音声・画像研究の推進のためのソフトウェア等を開発，公開しており，様々な機関，企業での研究に利用されています．

ソフトウェア

HMM音声合成ツールキット HTS

海外を含め，多くの研究機関 (Microsoft, IBM, etc) が採用している音声合成基盤ソフトウェアです．

汎用大語彙連続音声認識エンジン Julius

Julius は，音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです．
数万語彙の連続音声認識を一般のPC上で実時間で実行できます．
高い汎用性を持ち，発音辞書や言語モデル・音響モデルなどのモジュールを組み替えることで，様々な幅広い用途に応用できます．
機能はライブラリで提供されており，アプリケーションへの組み込みも可能です．

音声信号処理ツールキット SPTK

音響分析のための信号処理，データの加工などを行うソフトウェアです．

音声合成エンジン hts_engine

HTSで学習したモデルを用いて音声を合成するソフトウェアです．
BSDライセンスで公開しています．

日本語テキスト音声合成システム Open JTalk

日本語のテキストから音声を合成するシステムです．
波形生成部にhts_engine APIを利用しています．
BSDライセンスで公開しています．

HMM/DNN歌声合成システム Sinsy

隠れマルコフモデル (HMM) を用いた歌声合成システムです．
アップロードされた楽譜に基づいて任意の歌声を合成することができます．

音声対話システム構築ツールキット MMDAgent

オープンソースの音声インタラクションシステム構築ツールキットです．
音声合成，音声認識，音声学習機能，3D描画，リップシンクの技術等を組み合わせることで，画面内のキャラクター（MMDモデル）と会話することを実現します．

擬人化音声対話エージェント Galatea

擬人化音声対話エージェントのオープンソース，ライセンスフリーで公開されている擬人化音声対話エージェントです．
国内の十数大学などの音声・言語・画像研究者が参加したプロジェクトの成果物であり，本研究室のソフトウェアであるHTSとJuliusがそれぞれ，音声波形生成部と音声認識部を担当しています．

端末

名工大音声対話端末めいちゃん

名古屋工業大学2号館の1階に音声情報案内端末を設置しました．
名工大にお越しの際はぜひ喋りかけてみてください．

データベース

研究用マルチモーダル音声データベース M2TINIT

マルチモーダル音声研究の推進のため，東京工業大学大学院院総合理工学研究科小林隆夫研究室，および名古屋工業大学知能情報システム学科北村・徳田研究室 (現在，情報工学科徳田・李・南角研究室)が開発・公開する音声・唇動画像同時収録データベースです．
これまでに音声・唇動画像の生成やバイモーダル音声認識の研究に利用されています．