発表論文 - 2009

論文誌

  1. Kei Hashimoto, Hirohumi Yamamoto, Hideo Okuma, Eiichiro Sumita, and Keiichi Tokuda, “A reordering model using a source-side parse-tree for statistical machine translation," IEICE Transactions on Information and Systems, vol.E92-D, no.12, pp.2386-2393, 2009. (Full paper peer reviewed)
  2. Heiga Zen, Keiichi Tokuda, and Alan W. Black, “Statistical parametric speech synthesis," Speech Communication, vol.51, no.11, pp.1039-1154, 2009. (Full paper peer reviewed)
  3. Heiga Zen, Keiichiro Oura, Takashi Nose, Junichi Yamagishi, Shinji Sako, Tomoki Toda, Takashi Masuko, Alan W. Black, and Keiichi Tokuda, “Recent development of the HMM- based speech synthesis system (HTS)," 2009 Asia Paci c Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC 2009), pp.121-130, Sapporo, Japan, 2009. (Invited Session Paper)
  4. Keiichi Tokuda, Heiga Zen, “Fundamentals and recent advances in HMM-based speech synthesis," Interspeech 2009, Brighton, U.K., 2009. (Tutorial)
  5. Junichi Yamagishi, Takashi Nose, Heiga Zen, Zhen-Hua Ling, Tomoki Toda, Keiichi Tokuda, Simon King, Steve Renals, “A robust speaker-adaptive HMM-based text-to-speech synthe- sis," IEEE Transactions on Audio, Speech, and Language Processing, vol.17, no.6, 2009. (Full paper peer reviewed)
  6. Heiga Zen, and Keiichi Tokuda, “TechWare: HMM-Based Speech Synthesis Resources," IEEE Signal Processing Magazine, 2009. (Tutorial paper)
  7. 鹿野清宏, 武田一哉, 河原達也, 河原英紀, 猿渡洋, 徳田恵一, 李晃伸, 川波弘道, 西村竜一, Randy GOMEZ, 戸田智基, 西浦敬信, 高橋徹, 坂野秀樹, 全炳河, “総合報告ユーザ負担の ない話者・環境適応性を実現する自然な音声対話処理技術の総合開発," 電子情報通信学会誌, vol.92, no.6, 2009. (解説論文) Akinobu Lee, Hiromichi Kawanami, Ryuichi Nisimura, Randy GOMEZ, Tomoki Toda, Takanobu Nishiura, Toru Takahashi, Hideki Banno, Heiga Zen, 〝E-Society Software Development Project for Speech Recognition and Synthesis(Technical Report)"

国際会議

  1. Junichi Yamagishi, Bela Usabaev, Simon King, Oliver Watts, John Dines, Jilei Tian, Rile Hu, Yong Guan, Keiichiro Oura, Keiichi Tokuda, Reima Karhila, and Mikko Kurimo “Thousands of voices for HMM-based speech synthesis,” Interspeech 2009, pp.420–423, Brighton, U.K., 2009. (Full paper peer reviewed)
  2. Yi-Jian Wu, Yoshihiko Nankaku, and Keiichi Tokuda, “State mapping based method for crosslingual speaker adaptation in HMM-based speech synthesis,” Interspeech 2009, pp.528–531, Brighton, U.K., 2009. (Full paper peer reviewed)
  3. Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, “Deterministic annealing based training algorithm for Bayesian speech recognition,” Interspeech 2009, pp.680–683, Brighton, U.K., 2009. (Full paper peer reviewed)
  4. Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, “A Bayesian approach to Hidden Semi-Markov Model based speech synthesis,” Interspeech 2009, pp.1751–1754, Brighton, U.K., 2009. (Full paper peer reviewed)
  5. Keiichiro Oura, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, and Keiichi Tokuda, “Tying covariance matrices to reduce the footprint of HMM-based speech synthesis systems,” Interspeech 2009, pp.1751–1762, Brighton, U.K., September 6-10, 2009. (Full paper peer reviewed)
  6. Ranniery Maia, Tomoki Toda, Keiichi Tokuda, Shinsuke Sakai, and Satoshi Nakamura, “A decision tree-based clustering approach to state definition in an excitation modeling framework for HMM-based speech synthesis,” Interspeech 2009, pp.1783–1786, Brighton, U.K., 2009. (Full paper peer reviewed)
  7. Yi-Jian Wu, Long Qin, and Keiichi Tokuda, “An improved minimum generation error based model adaptation for HMM-based speech synthesis,” Interspeech 2009, pp.1787–1790, Brighton, U.K., 2009. (Full paper peer reviewed)
  8. Heiga Zen, Keiichiro Oura, Takashi Nose, Junichi Yamagishi, Shinji Sako, Tomoki Toda, Takashi Masuko, Alan W. Black, and Keiichi Tokuda, “Recent development of the HMM-based speech synthesis system (HTS),” Asia-Pacific Signal and Information Processing Association 2009 Annual Summit and Conference (APSIPA ASC 2009), pp.121–130, Sapporo, Japan, 2009. (Full paper peer reviewed)
  9. Keiichiro Oura, Yi-Jian Wu , and Keiichi Tokuda, “Overview of NIT HMM-based speech synthesis system for Blizzard Challenge 2009,” 2009 Blizzard Challenge Workshop, 2009 (web proceedings).
  10. Kei Hashimoto, Hirohumi Yamamoto, Hideo Okuma, Eiichiro Sumita, and Keiichi Tokuda, “Reordering model using syntactic information of a source tree for statistical machine translation,” NAACL HLT 2009 Workshop: Third Workshop on Syntax and Structure in Statistical Translation (SSST-3), pp.69–77, Boulder, Colorado, 2009. (Full paper peer reviewed)
  11. Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, and Keiichi Tokuda, “A Bayesian approach to HMM-based speech synthesis,” 2009 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2009), pp.4029–4032, Taipei, Taiwan, 2009. (Full paper peer reviewed)
  12. Yi-Jian Wu, and Keiichi Tokuda “Minimum generation error training by using original spectrum as reference for log spectral distortion measure,” 2009 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2009), pp.4013–4016, Taipei, Taiwan, 2009. (Full paper peer reviewed)
  13. Kaori Yutani, Yosuke Uto, Yoshihiko Nankaku, Akinobu Lee, and Keiichi Tokuda, “Voice conversion based on simultaneous modeling of spectrum and F0,” 2009 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2009), pp.3897–3900, Taipei, Taiwan, 2009. (Full paper peer reviewed)
  14. Heiga Zen, Yoshihiko Nankaku, and Keiichi Tokuda, “Stereo-based stochastic noise compensation based on trajectory GMMs,” 2009 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2009), pp.4577–4580, Taipei, Taiwan, 2009. (Full paper peer reviewed)
  15. Lu Heng, Wu Yi-Jian, Tokuda Keiichi, Dai Li-Rong, and Wang Ren-Hua, “FULL covariance state duration modeling for HMM-based speech synthesis,” 2009 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2009), pp.4033–4036, Taipei, Taiwan, 2009. (Full paper peer reviewed)

研究会

  1. 福田敏則, 吉見孔孝, 南角吉彦, 李晃伸, 徳田恵一, ``ユーザ生成型音声対話コンテンツを用いた音声情報案内システム," 第11回音声言語シンポジウム, vol. 109, no. 356, pp. 207-212, SP2009-94, 東京, 日本, 2009.
  2. 鹿住恭介, 南角吉彦, 徳田恵一, ``多様な声質を表現するための因子分析モデルに基づくHMM音声合成,'' 第11回音声言語シンポジウム, vol. 109, no. 356, pp. 177-182, SP2009-92, 東京, 日本, 2009.
  3. 吉見孔孝, 南角吉彦, 李晃伸, 徳田恵一, ``音声対話システムのためのN-gramに基づくキーワードからの文生成,'' 第11回音声言語シンポジウム, vol. 109, no. 356, pp. 71-76, SP2009-83, 東京, 日本, 2009.
  4. 斎藤彰, 南角吉彦, 李晃伸, 徳田恵一, ``複数の特徴量による条件付確率場に基づく音声区間検出,'' 第11回音声言語シンポジウム, vol. 109, no. 356, pp. 59-64, SP2009-82, 東京, 日本, 2009.
  5. Keiichiro Oura, Junichi Yamagishi, Mirjam Wester, Simon King, Keiichi Tokuda, ``Unsupervised speaker adaptation for speech-to-speech translation system,'' 第11回音声言語シンポジウム, vol. 2009-SLP-79, no. 3, pp.1-6, 東京, 日本, 2009.
  6. 林豊大, 南角吉彦, 李晃伸, 徳田恵一, ``音声認識のための非線形スペクトル変換を用いた話者適応,'' 第11回音声言語シンポジウム, vol. 109, no. 356, pp. 1-6, SP2009-76, 東京, 日本, 2009.
  7. 山田知彦, 武藤聡, 南角吉彦, 酒向慎司, 徳田恵一, ``HMMに基づく歌声合成のためのビブラートモデル化,'' 第80回音楽情報科学研究会(SIGMUS), vol. 2009-MUS-80, no. 5, IPSJ-MUS09080005, 茨城, 日本, 2009.
  8. 玉森聡, 南角吉彦, 徳田恵一, ``回転変動を考慮した分離型2次元HMMによる顔画像認識,'' パターン認識・メディア理解研究会(PRMU), vol. 108, no. 484, PRMU2008-263, pp. 159-164, 宮城, 日本, 2009.
  9. 高橋良彰, 玉森聡, 南角吉彦, 徳田恵一, ``状態継続長を考慮した分離型2次元格子HMMによる顏画像認識,'' パターン認識・メディア理解研究会(PRMU), vol. 108, no. 484, PRMU2008-262, pp. 153-158, 宮城, 日本, 2009.
  10. 小島弘, 南角吉彦, 李晃伸, 徳田恵一, ``信頼度基準による解探索打ち切りに基づく超早音声認識,'' 音声研究会, vol. 108, no. 422, SP2008-128, pp. 13-18, 奈良, 日本, 2009.

全国大会

  1. Keiichiro Oura, Junichi Yamagishi, Simon King, Mirjam Wester, and Keiichi Tokuda, ``Unsupervised English-to-Japanese speaker adaptation for HMM-based speech synthesis,'' 日本音響学会2009年秋季研究発表会, pp. 401-402, Fukushima, Japan, 2009.
  2. 山田知彦, 武藤聡, 南角吉彦, 酒向慎司, 徳田恵一, ``HMM歌声合成システムのためのビブラートモデルの導入,'' 日本音響学会2009年秋季研究発表会, pp. 309-312, 福島, 日本, 2009.
  3. 岩島匡秋, 南角吉彦, 李晃伸, 徳田恵一, ``バイモーダル音声認識における特徴量重みの動的決定手法に関する検討,'' 日本音響学会2009年秋季研究発表会, pp. 81-82, 福島, 日本, 2009.
  4. 福田敏則, 吉見孔孝, 南角吉彦, 李晃伸, 徳田恵一, ``ユーザ生成型音声対話コンテンツに基づく音声情報案内システムの構築,'' 日本音響学会2009年秋季研究発表会, pp. 211-212, 福島, 日本, 2009.
  5. 吉見孔孝, 南角吉彦, 李晃伸, 徳田恵一, ``音声対話システムのためのN-gramに基づくキーワードを制約とする文生成手法の検討,'' 日本音響学会2009年秋季研究発表会, pp. 209-210, 福島, 日本, 2009.
  6. 橋本佳, 南角吉彦, 徳田恵一, ``ベイズ基準によるHSMM音声合成の評価,'' 日本音響学会2009年秋季研究発表会, pp. 257-258, 福島, 日本, 2009.
  7. 斎藤彰, 南角吉彦, 李晃伸, 徳田恵一, ``複数の特徴量を用いた条件付確率場に基づく音声区間検出,'' 日本音響学会2009年秋季研究発表会, pp. 47-48, 福島, 日本, 2009.
  8. 林豊大, 南角吉彦, 李晃伸, 徳田恵一, ``音声認識のための非線形スペクトル変換に基づく話者適応,'' 日本音響学会2009年秋季研究発表会, pp. 19-20, 福島, 日本, 2009.
  9. Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``Training algorithm based on deterministic annealing for Bayesian speech recognition,'' 日本音響学会2009年秋季研究発表会, pp. 3-6, 福島, 日本, 2009.
  10. 花園正也, 西山高史, 徳田恵一, ``HMMに基づく感情音声合成のための収録テキストの最適化設計," システム制御情報学会第53回研究発表講演会, 兵庫, 日本, 2009.
  11. 渡辺英樹, 花園正也, 西山高史, 徳田恵一, ``合成音声の主観評価の効率化," 第53 回システム制御情報学会第53回研究発表会, 兵庫, 日本, 2009.
  12. 小島弘, 南角吉彦, 李晃伸, 徳田恵一, ``木構造化辞書の単語間非共有部のスコアを用いた認識結果の予測,'' 日本音響学会2009年春季研究発表会, pp. 225-226, 東京, 日本, 2009.
  13. 永尾京平, 全炳河, 南角吉彦, 徳田恵一, ``HMM音声合成における発話内変動のモデル化手法に関する検討,'' 日本音響学会2009年春季研究発表会, pp. 427-428, 東京, 日本, 2009.
  14. Ranniery Maia, Tomoki Toda, Keiichi Tokuda, Shinsuke Sakai, Tohru Shimizu, and Satoshi Nakamura, ``A decision tree-based clustering approach to state definition in a residual modeling framework,'' 日本音響学会2009年春季研究発表会, pp. 311-312, 東京, 日本, 2009.
  15. 酒向慎司, 徳田恵一, 北村正, ``HMM音声合成のための音響モデル簡易学習ツールキットVoiceMaker,'' 日本音響学会2009年春季研究発表会, pp. 305-306, 東京, 日本, 2009.
  16. 橋本佳, 南角吉彦, 徳田恵一, ``ベイズ基準による隠れセミマルコフモデルに基づく音声合成,'' 日本音響学会2009年春季研究発表会, pp. 303-304, 東京, 日本, 2009.

学位論文

  1. 福田敏則, ``ユーザ生成情報に基づく音声対話システムの構築,'' 卒業論文, 名古屋工業大学, 2009.
  2. 横山長明, ``音声対話システムにおけるユーザフレンドリな合成音声の検討,'' 卒業論文, 名古屋工業大学, 2009.
  3. 山田知彦, ``HSMMに基づく歌声合成システムにおけるビブラートモデルの導入,'' 卒業論文, 名古屋工業大学, 2009.
  4. 伊藤直晃, ``組み込み用途のための高速なHMM音声合成の自動最適化,'' 卒業論文, 名古屋工業大学, 2009.
  5. 鹿住恭介, ``因子分析を用いた固有声モデルのためのアニーリングに基づく学習アルゴリズム,'' 卒業論文, 名古屋工業大学, 2009.
  6. 高木信二, ``動的モデル選択に基づくHMM音声合成,'' 卒業論文, 名古屋工業大学, 2009.
  7. 藤井智也, ``可変固有顔における識別的共有構造の検討,'' 卒業論文, 名古屋工業大学, 2009.
  8. 高橋良彰, ``状態継続長を考慮した分離型2次元格子HMMによる顔画像認識,'' 卒業論文, 名古屋工業大学, 2009.
  9. 岩島匡秋, ``バイモーダル音声認識における特徴量重みの動的決定法の検討,'' 卒業論文, 名古屋工業大学, 2009.
  10. 林豊大, ``音声認識のための非線形スペクトル変換に基づく話者適応,'' 卒業論文, 名古屋工業大学, 2009.
  11. 斎藤純平, ``多空間上の確率分布に基づいたHMMによる音声認識,'' 卒業論文, 名古屋工業大学, 2009.
  12. 斉藤彰, ``複数の特徴量を用いた条件付確率場に基づく音声区間検出,'' 卒業論文, 名古屋工業大学, 2009.
  13. 小崎和正, ``音声対話システムにおける多様な外的要因を考慮した応答生成,'' 修士論文, 名古屋工業大学, 2009.
  14. 塩田さやか, ``複数のモデル構造を含む統計モデルに基づく音声認識,'' 修士論文, 名古屋工業大学, 2009.
  15. 于志鵬, ``HMM音声合成のためのストリーム依存共有構造の分析,'' 修士論文, 名古屋工業大学, 2009.
  16. 永尾京平, ``HMM音声合成における発話内変動のモデル化手法に関する検討,'' 修士論文, 名古屋工業大学, 2009.

過去の発表論文





トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS