Japanese Page / English Page
徳田・南角研究室

ソフトウェア

徳田・李・南角研究室では音声・画像研究の推進のためのソフトウェア等を開発,公開して おり,様々な機関,企業での研究に利用されています.

ソフトウェア

HMM音声合成ツールキット HTS

01.jpg

海外を含め,多くの研究機関 (Microsoft, IBM, etc) が 採用している音声合成基盤ソフトウェアです.

汎用大語彙連続音声認識エンジン Julius

02.jpg

Julius は,音声認識システムの開発・研究のためのオープ ンソースの高性能な汎用大語彙連続音声認識エンジンです.
数万語彙の連続音声認識を一般のPC上で実時間で実行できます.
高い汎用性を持ち,発音辞書や言語モデル・音響モデルなどの モジュールを組み替えることで,様々な幅広い用途に応用でき ます.
機能はライブラリで提供されており,アプリケーションへの組 み込みも可能です.

音声信号処理ツールキット SPTK

03.jpg

音響分析のための信号処理,データの加工などを行うソフトウェアです.

音声合成エンジン hts_engine

07.jpg

HTSで学習したモデルを用いて音声を合成するソフトウェアです.
BSDライセンスで公開しています.

日本語テキスト音声合成システム Open JTalk

08.jpg

日本語のテキストから音声を合成するシステムです.
波形生成部にhts_engine APIを利用しています.
BSDライセンスで公開しています.

擬人化音声対話エージェント Galatea

04.jpg

擬人化音声対話エージェントの オープンソース,ライセンスフリーで公開されている擬人化音声対話エージェントです.
国内の十数大学などの音声・言語・画像研究者が参加したプロジェクトの成果物であり, 本研究室のソフトウェアであるHTSとJuliusがそれぞれ,音声波形生成部と音声認識部 を担当しています.

端末

名工大 音声対話端末 めいちゃん

06.jpg

名古屋工業大学2号館の1階に音声情報案内端末を設置しました.
名工大にお越しの際はぜひ喋りかけてみてください.

データベース

研究用マルチモーダル音声データベース M2TINIT

05.jpg

マルチモーダル音声研究の推進のため,東京工業大学大学院院総合理工学研究科 小林隆夫研究室,および名古屋工業大学知能情報システム学科 北村・徳田研究室 (現在,情報工学科 徳田・李・南角研究室)が開発・公開する音声・唇動画像同時収録データベースです.
これまでに音声・唇動画像の生成やバイモーダル音声認識の研究に利用されています.

files: file06.jpg 957件 [詳細] file07.jpg 933件 [詳細] file08.jpg 995件 [詳細] file05.jpg 1115件 [詳細] file04.jpg 1212件 [詳細] file02.jpg 1135件 [詳細] file03.jpg 940件 [詳細] file01.jpg 1119件 [詳細]
トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS