PUBLICATIONS - 2008

Journal

  1. 鹿野清宏, 河原達也, 猿渡洋, 武田一哉, 河原英紀, 徳田恵一, 西浦敬信, 李晃伸. “学と産の連 携による基盤ソフトウェアの先進的開発: 11. 人にやさしい音声インタフェース," 情報処理 学会会誌「情報処理」, vol.49, no.11, pp.1297-1301, 2008.
  2. Keiichiro Oura, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, and Keiichi Tokuda, “A Fully Consistent Hidden Semi-Markov Model-Based Speech Recognition System," IEICE Transactions on Information and Systems, vol.E91-D, no.11, pp.2693-2700, 2008. (Full paper peer reviewed)
  3. 全炳河, 戸田智基, 中村勝, 徳田恵一, 益子貴史, 小林隆夫, 北村正, “おめでとうソサイエ ティ論文賞「Blizzard Challenge のための高品質HMM 音声合成システム」," 電子情報通信 学会情報・システムソサイエティ誌, vol.13, no.2, p.12, 2008.
  4. Heiga Zen, Tomoki Toda, and Keiichi Tokuda, “The Nitech-NAIST HMM based speech synthesis system for the Blizzard Challenge 2006," IEICE Transactions on Information and Systems, vol.E91-D, no.6, pp.1764-1773, 2008. (Full paper peer reviewed)
  5. Tomoki Toda, Alan W. Black, and Keiichi Tokuda, “Statistical mapping between articulatory movements and acoustic spectrum with a Gaussian mixture model," Speech Communication, vol.50, no.3, pp.215-227, 2008. (Full paper peer reviewed)

International Conference

  1. Yi-Jian Wu, Simon King and Keiichi Tokuda, “Cross-lingual speaker adaptation for HMM-based speech synthesis,” International Symposium on Chinese Spoken Language Processing (ISCSLP2008), SPE1.1, pp.9–12, Kunming, China, 2008.(Full paper peer reviewed)
  2. Keiichiro Oura, Yoshihiko Nankaku, Tomoki Toda, Keiichi Tokuda, Rannierry Maia, Shinsuke Sakai, and Satoshi Nakamura, “Simultaneous acoustic, prosodic, and phrasing model training for TTS conversion systems,” International Symposium on Chinese Spoken Language Processing (ISCSLP2008), SPE1.1, pp.1–4, Kunming, China, 2008 (Best Student Paper Award, Full paper peer reviewed).
  3. Zhi-Peng Yu, Yi-Jian Wu, Heiga Zen, Yoshihiko Nankaku, and Keiichi Tokuda, “Analysis of stream-dependent tying structure for HMM-based speech synthesis,” International Conference on Signal Processing (ICSP’08), pp.655–658, Beijing, China, 2008. (Full paper peer reviewed)
  4. Junichi Yamagishi, Heiga Zen, Yi-Jian Wu, Tomoki Toda, and Keiichi Tokuda, “HTS-2008: Yet another evaluation of speaker adaptive HMM-based speech synthesis system,” Blizzard Challenge Workshop 2008, Brisbane, Australia, 2008 (web proceedings).
  5. Ranniery Maia, Jinfu Ni, Shinsuke Sakai, Tomoki Toda, Keiichi TokudaTohru Shimizu, and Satoshi Nakamura, “The NICT/ATR speech synthesis system for the Blizzard Challenge 2008”, Blizzard Challenge Workshop 2008, Brisbane, Australia, 2008 (web proceedings).
  6. Yoshitaka Yoshimi, Ryota Kakitsuba, Yoshihiko Nankaku, Akinobu Lee, and Keiichi Tokuda, “Probabilistic answer selection based on conditional random fields for spoken dialog system,” Interspeech 2008, pp.215–218, Brisbane, Australia, 2008. (Full paper peer reviewed)
  7. Yi-Jian Wu, and Keiichi Tokuda, “Minimum generation error training with direct log spectral distortion on LSPs for HMM-Based speech synthesis,” Interspeech 2008, pp.577–580, Brisbane, Australia, 2008. (Full paper peer reviewed)
  8. Sayaka Shiota, Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, and Keiichi Tokuda, “Acoustic modeling based on model structure annealing for speech recognition,” Interspeech 2008, pp.932–935, Brisbane, Australia, 2008. (Full paper peer reviewed)
  9. Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, and Keiichi Tokuda, “Bayesian context clustering using cross valid prior distribution for HMM-Based speech recognition,” Interspeech 2008, pp.936–939, Brisbane, Australia, 2008. (Full paper peer reviewed)
  10. Heiga Zen, Yoshihiko Nankaku, and Keiichi Tokuda, “Probabilistic feature mapping based on trajectory HMMs,” Interspeech 2008, pp.1068–1071, Brisbane, Australia, 2008. (Full paper peer reviewed)
  11. Kaori Yutani, Yosuke Uto, Yoshihiko Nankaku, Tomoki Toda, and Keiichi Tokuda, “Simultaneous conversion of duration and spectrum based on statistical models including time sequence matching,” Interspeech 2008, pp.1072–1075, Brisbane, Australia, 2008. (Full paper peer reviewed)
  12. Tatsuya Ito, Kei Hashimoto, Yoshihiko Nankaku, Akinobu Lee, and Keiichi Tokuda, “Speaker recognition based on variational bayesian method,” Interspeech 2008, pp.1417–1420, Brisbane, Australia, 2008. (Full paper peer reviewed)
  13. Simon King, Keiichi Tokuda, Heiga Zen, and Junichi Yamagishi, “Unsupervised adaptation for HMM-Based speech synthesis,” Interspeech 2008, pp.1869–1872, Brisbane, Australia, 2008. (Full paper peer reviewed)
  14. Yi-Jian Wu, Heiga Zen, Yoshihiko Nankaku, and Keiichi Tokuda, “Minimum generation error criterion considering global/local variance for HMM-based speech synthesis,” 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp.4621–4624, Las Vegas, Nevada, U.S.A., 2008. (Full paper peer reviewed)
  15. Yoshihiko Nankaku, Kazuhiro Nakamura, Heiga Zen, and Keiichi Tokuda, “Acoustic modeling with contextual additive structure for HMM-based speech recognition,” 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp.4469–4472, Las Vegas, Nevada, U.S.A., 2008. (Full paper peer reviewed)
  16. Junichi Yamagishi, Takashi Nose, Heiga Zen, Tomoki Toda, and Keiichi Tokuda, “Performance evaluation of the speaker-independent HMM-based speech synthesis system HTS-2007 for the Blizzard Challenge 2007,” 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp.3957–3960, Las Vegas, Nevada, U.S.A., 2008. (Full paper peer reviewed)
  17. Ranniery Maia, Tomoki Toda, Keiichi Tokuda, Shinsuke Sakai, and Satoshi Nakamura, “On the state definition for a trainable excitation model in HMM-based speech synthesis,” 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp.3965–3968, Las Vegas, Nevada, U.S.A., 2008. (Full paper peer reviewed)
  18. Tomoki Toda, and Keiichi Tokuda, “Statistical approach to vocal tract transfer function estimation based on factor analyzed trajectory HMM,” 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp.3925–3928, Las Vegas, Nevada, U.S.A., 2008. (Full paper peer reviewed)

Workshop

  1. Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, Akinobu LEE, and Keiichi Tokuda. ``Speech recognition based on statistical models including multiple decision trees,'' 第10回音声言語シンポジウム, 2008-SLP-74-38, 東京, 日本, 2008.
  2. 大浦圭一郎, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``HMM音声合成における共分散パラメータの共有に関する検討,'' 第10回音声言語シンポジウム, 2008-SLP-74-37, 東京, 日本, 2008.
  3. Tatsuya Ito, Kei Hashimoto, Yoshihiko Nankaku, Akinobu LEE, and Keiichi Tokuda, ``Speaker Recognition Based on Gaussian Mixture Models Using Variational Bayesian Method,'' 第10回音声言語シンポジウム, 2008-SLP-74-32, 東京, 日本, 2008.
  4. Kaori Yutani, Yoshihiko Nankaku, Tomoki Toda, Keiichi Tokuda, ``Simultaneous Transformation of Duration and Spectrum Using Statistical Models Including Time-Sequence Matching,'' 第10回音声言語シンポジウム, 2008-SLP-74-14, 東京, 日本, 2008.
  5. Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, ``Bayesian Context Clustering Using Cross Validation for HMM-Based Speech Synthesis,'' 第10回音声言語シンポジウム, 2008-SLP-74-13, 東京, 日本, 2008.
  6. 酒向慎司, 才野慶二郎, 南角吉彦, 徳田恵一, 北村正, ``声質と歌唱スタイルを自動学習可能な歌声合成システム,'' 第74回音楽情報科学研究会・第70回音声言語情報処理研究会 共催研究会, vol. 2008, no. 12, 2008-SLP-70-7, pp. 39-44, 静岡, 日本, 2008.

National Convention

  1. 小島弘, 南角吉彦, 李晃伸, 徳田恵一, ``音声認識のビーム探索における複数枝刈り基準の統合に関する検討,'' 日本音響学会2008年秋季研究発表会, pp. 211-212, 福岡, 日本, 2008.
  2. 戸田智基, 徳田恵一, ``因子分析トラジェクトリHMMに基づく統計的音声スペクトル推定法,'' 日本音響学会2008年秋季研究発表会, pp. 293-294, 福岡, 日本, 2008.
  3. 大浦圭一郎, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``HMM音声合成における分散パラメータの共有に関する検討,'' 日本音響学会2008年秋季研究発表会, pp. 421-422, 2008.
  4. 渡辺英樹, 花園正也, 西山高史, 徳田恵一, ``合成音声の主観評価効率化のための評価音声抽出方法の検討,'' 日本音響学会2008年秋季研究発表会, pp. 419-420, 福岡, 日本, 2008.
  5. 花園正也, 渡辺英樹, 西山高史, 徳田恵一, ``文脈限定下でのHMM音声合成のための収録テキストセットの最適化,'' 日本音響学会2008年秋季研究発表会, pp. 417-418, 福岡, 日本, 2008.
  6. 油谷かおり, 南角吉彦, 戸田智基, 徳田恵一, ``声質変換における時系列マッチングを含む統計モデルの拡張,'' 日本音響学会2008年秋季研究発表会, pp. 411-412, 福岡, 日本, 2008.
  7. 塩田さやか, 橋本佳, 南角吉彦, 李晃伸, 徳田恵一, ``複数の音素決定木構造を用いた音声認識の検討,'' 日本音響学会2008年秋季研究発表会, pp. 125-126, 福岡, 日本, 2008.
  8. Ranniery Maia, Jinfu Ni, Shinsuke Sakai, Tomoki Toda, Keiichi Tokuda, Tohru Shimizu, and Satoshi Nakamura, ``The NICT/ATR-SLC entry for the Blizzard Challenge 2008,'' 日本音響学会2008年秋季研究発表会, pp. 255-256, Fukuoka, Japan, 2008.
  9. 橋本佳, 全炳河, 南角吉彦, 徳田恵一, ``クロスバリデーションを用いたベイズ基準によるHMM音声合成,'' 日本音響学会2008年秋季研究発表会, pp. 251-252, 福岡, 日本, 2008.
  10. Yi-JianWu, and Keiichi Tokuda, ``HMM training by minimizing log spectral distortion between generated and original LSPs for speech synthesis,'' 日本音響学会2008年秋季研究発表会, pp. 249-250, Fukuoka, Japan, 2008.
  11. 花園正也, 西山高史, 徳田恵一, ``文脈限定下での高品質HMM音声合成のための収録テキストセットの最適化," システム制御情報学会第52回研究発表講演会, pp. 777-778, 京都, 日本, 2008. The Insutitute of system, Control and Information Engineers , pp. 777-778, Kyoto, Japan, 2008.
  12. 伊藤達也, 南角吉彦, 李晃伸, 徳田恵一 ``変分ベイズ法に基づく話者認識,'' 日本音響学会2008年春季研究発表会, pp. 143-144, 千葉, 日本, 2008.
  13. 宇藤陽介, 南角吉彦, 李晃伸, 徳田恵一, ``声質変換のためのスペクトルおよびF0の同時モデリング,'' 日本音響学会2008年春季研究発表会, pp. 353-356, 千葉, 日本, 2008.
  14. 丸目雅浩, 南角吉彦, 酒向慎司, 徳田恵一, 北村正, ``変分ベイズ法に基づいた声質変換,'' 日本音響学会2008年春季研究発表会, pp. 349-352, 千葉, 日本, 2008.
  15. 油谷かおり, 宇藤陽介, 南角吉彦, 戸田智基, 李晃伸, 徳田恵一, ``時系列マッチングを含む統計モデルに基づいた継続長およびスペクトルの同時変換,'' 日本音響学会2008年春季研究発表会, pp. 347-348, 千葉, 日本, 2008.
  16. 山岸順一, 能勢隆, 全炳河, 戸田智基, 徳田恵一, 小林隆夫, ``Blizzard Challenge 2007のための平均声に基づくHMM音声合成システムの評価,'' 日本音響学会2008年春季研究発表会, pp. 339-342, 千葉, 日本, 2008.
  17. Ranniery Maia, Tomoki Toda, Keiichi Tokuda, Shinsuke Sakai, and Satoshi Nakamura, ``State clustering on an excitation model for HMM-based speech synthesis ,'' 日本音響学会2008年春季研究発表会, pp. 337-338, 千葉, 日本, 2008.
  18. 大浦圭一郎, 戸田智基, 南角吉彦, 徳田恵一, マイアハニエリ, 坂井信輔, 中村哲, ``英語音声合成における韻律推定モデルと音響モデルの同時学習,'' 日本音響学会2008年春季研究発表会, pp. 335-336, 千葉, 日本, 2008.
  19. 橋本佳, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``クロスバリデーションを用いたベイズ基準によるコンテキストクラスタリング,'' 日本音響学会2008年春季研究発表会, pp. 69-70, 千葉, 日本, 2008.
  20. 袴田智博, 南角吉彦, 李晃伸, 徳田恵一, ``仮説の遅延確定による1パス信頼度計算の評価と複数デコーダ間枝刈りへの応用,'' 日本音響学会2008年春季研究発表会, pp. 217-218, 千葉, 日本, 2008.
  21. 吉見孔孝, 南角吉彦, 李晃伸, 徳田恵一, ``音声対話システムにおける条件付確率場に基づく自動応答文選択,'' 日本音響学会2008年春季研究発表会, pp. 95-96, 千葉, 日本, 2008.
  22. 全炳河, 徳田恵一, ``隠れマルコフモデルに基づく音声合成システム,'' 情報処理学会第70回全国大会, pp. 5-359-5-360, 茨城, 日本, 2008.

Master's and Bachelor's Theses

  1. 竹内一浩, ``メルケプストラム分析とSTRAIGHT分析を用いたHMM音声合成における諸条件の検討,'' 卒業論文, 名古屋工業大学, 2008.
  2. 武藤聡, ``HMM歌声合成における話者適応,'' 卒業論文, 名古屋工業大学, 2008.
  3. 一丸貴則, ``MAP推定に基づく話者補間のためのコンテキストクラスタリング,'' 卒業論文, 名古屋工業大学, 2008.
  4. 油谷かおり, ``時系列マッチングを含む統計モデルに基づいた継続長およびスペクトルの同時変換,'' 卒業論文, 名古屋工業大学, 2008.
  5. 伊藤達也, ``変分ベイズ法に基づく話者認識,'' 卒業論文, 名古屋工業大学, 2008.
  6. 小林高広, ``条件付確率場に基づくGMMを用いた発話区間検出,'' 卒業論文, 名古屋工業大学, 2009.
  7. 吉見孔孝, ``音声対話システムにおける条件付確率場による自動応答文選択,'' 卒業論文, 名古屋工業大学, 2009.

Past Publications





トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS