![]() |
徳田・李・南角研究室では音声・画像研究の推進のためのソフトウェア等を開発,公開して おり,様々な機関,企業での研究に利用されています.
Julius は,音声認識システムの開発・研究のためのオープ ンソースの高性能な汎用大語彙連続音声認識エンジンです.
数万語彙の連続音声認識を一般のPC上で実時間で実行できます.
高い汎用性を持ち,発音辞書や言語モデル・音響モデルなどの モジュールを組み替えることで,様々な幅広い用途に応用でき ます.
機能はライブラリで提供されており,アプリケーションへの組 み込みも可能です.
音響分析のための信号処理,データの加工などを行うソフトウェアです.
HTSで学習したモデルを用いて音声を合成するソフトウェアです.
BSDライセンスで公開しています.
日本語のテキストから音声を合成するシステムです.
波形生成部にhts_engine APIを利用しています.
BSDライセンスで公開しています.
隠れマルコフモデル (HMM) を用いた歌声合成システムです.
アップロードされた楽譜に基づいて任意の歌声を合成することができます.
オープンソースの音声インタラクションシステム構築ツールキットです.
音声合成,音声認識,音声学習機能,3D描画,リップシンクの技術等を組み合わせることで,画面内のキャラクター(MMDモデル)と会話することを実現します.
擬人化音声対話エージェントの オープンソース,ライセンスフリーで公開されている擬人化音声対話エージェントです.
国内の十数大学などの音声・言語・画像研究者が参加したプロジェクトの成果物であり, 本研究室のソフトウェアであるHTSとJuliusがそれぞれ,音声波形生成部と音声認識部 を担当しています.
名古屋工業大学2号館の1階に音声情報案内端末を設置しました.
名工大にお越しの際はぜひ喋りかけてみてください.
マルチモーダル音声研究の推進のため,東京工業大学大学院院総合理工学研究科 小林隆夫研究室,および名古屋工業大学知能情報システム学科 北村・徳田研究室 (現在,情報工学科 徳田・李・南角研究室)が開発・公開する音声・唇動画像同時収録データベースです.
これまでに音声・唇動画像の生成やバイモーダル音声認識の研究に利用されています.