発表論文 - 2008
論文誌
- 鹿野清宏, 河原達也, 猿渡洋, 武田一哉, 河原英紀, 徳田恵一, 西浦敬信, 李晃伸, ``学と産の連携による基盤ソフトウェアの先進的開発: 11. 人にやさしい音声インタフェース,'' 情報処理学会会誌「情報処理」, vol. 49, no. 11, pp. 1297-1301, 2008年11月. (解説論文)
- Keiichiro Oura, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, and Keiichi Tokuda, ``A Fully Consistent Hidden Semi-Markov Model-Based Speech Recognition System,'' IEICE Transactions on Information and Systems, vol. E91-D, no. 11, pp. 2693-2700, Nov, 2008. (Full paper peer reviewed)
- Heiga Zen, Tomoki Toda, and Keiichi Tokuda, ``The Nitech-NAIST HMM based speech synthesis system for the Blizzard Challenge 2006,'' IEICE Transactions on Information and Systems, vol. E91-D, no. 6, pp. 1764-1773, June, 2008. (Full paper peer reviewed)
- Tomoki Toda, Alan W. Black, and Keiichi Tokuda, ``Statistical mapping between articulatory movements and acoustic spectrum with a Gaussian mixture model,'' Speech Communication, vol. 50, no. 3, pp. 215-227, March, 2008. (Full paper peer reviewed)
国際会議
- Yi-Jian Wu, Simon King and Keiichi Tokuda, ``Cross-lingual speaker adaptation for HMM-based speech synthesis,'' International Symposium on Chinese Spoken Language Processing (ISCSLP2008), SPE1.1, pp. 9-12, Kunming, China, December, 2008. (Full paper peer reviewed)
link
- Keiichiro Oura, Yoshihiko Nankaku, Tomoki Toda, Keiichi Tokuda, Rannierry Maia, Shinsuke Sakai, and Satoshi Nakamura, ``Simultaneous acoustic, prosodic, and phrasing model training for TTS conversion systems,'' International Symposium on Chinese Spoken Language Processing (ISCSLP2008), SPE1.1, pp. 1-4, Kunming, China, December, 2008. (Best Student Paper Award, Full paper peer reviewed)
link
- Zhi-Peng Yu, Yi-Jian Wu, Heiga Zen, Yoshihiko Nankaku, and Keiichi Tokuda, ``Analysis of stream-dependent tying structure for HMM-based speech synthesis,'' International Conference on Signal Processing (ICSP’08), pp. 655-658, Beijing, China, October, 2008. (Full paper peer reviewed)
link
- Junichi Yamagishi, Heiga Zen, Yi-Jian Wu, Tomoki Toda, and Keiichi Tokuda, ``HTS-2008: Yet another evaluation of speaker adaptive HMM-based speech synthesis system,'' Blizzard Challenge Workshop 2008, Brisbane, Australia, September, 2008. (web proceedings)
- Ranniery Maia, Jinfu Ni, Shinsuke Sakai, Tomoki Toda, Keiichi Tokuda, Tohru Shimizu, and Satoshi Nakamura, ``The NICT/ATR speech synthesis system for the Blizzard Challenge 2008,'' Blizzard Challenge Workshop 2008, Brisbane, Australia, September, 2008. (web proceedings)
- Yoshitaka Yoshimi, Ryota Kakitsuba, Yoshihiko Nankaku, Akinobu Lee, and Keiichi Tokuda, ``Probabilistic answer selection based on conditional random fields for spoken dialog system,'' Interspeech 2008, pp. 215-218, Brisbane, Australia, September, 2008. (Full paper peer reviewed)
- Yi-Jian Wu, and Keiichi Tokuda, ``Minimum generation error training with direct log spectral distortion on LSPs for HMM-Based speech synthesis,'' Interspeech 2008, pp. 577-580, Brisbane, Australia, September, 2008. (Full paper peer reviewed)
link
- Sayaka Shiota, Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, and Keiichi Tokuda, ``Acoustic modeling based on model structure annealing for speech recognition,'' Interspeech 2008, pp. 932-935, Brisbane, Australia, September, 2008. (Full paper peer reviewed)
- Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, and Keiichi Tokuda, ``Bayesian context clustering using cross valid prior distribution for HMM-Based speech recognition,'' Interspeech 2008, pp. 936-939, Brisbane, Australia, September, 2008. (Full paper peer reviewed)
- Heiga Zen, Yoshihiko Nankaku, and Keiichi Tokuda, ``Probabilistic feature mapping based on trajectory HMMs,'' Interspeech 2008, pp. 1068-1071, Brisbane, Australia, September, 2008. (Full paper peer reviewed)
- Kaori Yutani, Yosuke Uto, Yoshihiko Nankaku, Tomoki Toda, and Keiichi Tokuda, ``Simultaneous conversion of duration and spectrum based on statistical models including time sequence matching,'' Interspeech 2008, pp. 1072-1075, Brisbane, Australia, September, 2008. (Full paper peer reviewed)
- Tatsuya Ito, Kei Hashimoto, Yoshihiko Nankaku, Akinobu Lee, and Keiichi Tokuda, ``Speaker recognition based on variational bayesian method,'' Interspeech 2008, pp. 1417-1420, Brisbane, Australia, September, 2008. (Full paper peer reviewed)
- Simon King, Keiichi Tokuda, Heiga Zen, and Junichi Yamagishi, ``Unsupervised adaptation for HMM-Based speech synthesis,'' Interspeech 2008, pp. 1869-1872, Brisbane, Australia, September, 2008. (Full paper peer reviewed)
- Yi-Jian Wu, Heiga Zen, Yoshihiko Nankaku, and Keiichi Tokuda, ``Minimum generation error criterion considering global/local variance for HMM-based speech synthesis,'' 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp. 4621-4624, Las Vegas, Nevada, U.S.A., March 30- April 4, 2008. (Full paper peer reviewed)
link
- Yoshihiko Nankaku, Kazuhiro Nakamura, Heiga Zen, and Keiichi Tokuda, ``Acoustic modeling with contextual additive structure for HMM-based speech recognition,'' 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp. 4469-4472, Las Vegas, Nevada, U.S.A., March 30- April 4, 2008. (Full paper peer reviewed)
- Junichi Yamagishi, Takashi Nose, Heiga Zen, Tomoki Toda, and Keiichi Tokuda, ``Performance evaluation of the speaker-independent HMM-based speech synthesis system HTS-2007 for the Blizzard Challenge 2007,'' 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp. 3957-3960, Las Vegas, Nevada, U.S.A., March 30- April 4, 2008. (Full paper peer reviewed)
- Ranniery Maia, Tomoki Toda, Keiichi Tokuda, Shinsuke Sakai, and Satoshi Nakamura, ``On the state definition for a trainable excitation model in HMM-based speech synthesis,'' 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp. 3965-3968, Las Vegas, Nevada, U.S.A., March 30- April 4, 2008. (Full paper peer reviewed)
- Tomoki Toda, and Keiichi Tokuda, ``Statistical approach to vocal tract transfer function estimation based on factor analyzed trajectory HMM,'' 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp. 3925-3928, Las Vegas, Nevada, U.S.A., March 30- Aoril 4, 2008. (Full paper peer reviewed)
- Tomoki Toda ,Alan.W.Black Keiichi Tokuda,``Statistical Mapping between Articulatory Movements and Acoustic Spectrum Using a Gaussian Mixture Model,'' Nara Institute of Science and Technology,Speech Communication, vol.50, no.3, pp.215-227, 2008-3. (EURASIP-ISCA Best Paper Award )
研究会
- Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, Akinobu LEE, and Keiichi Tokuda. ``Speech recognition based on statistical models including multiple decision trees,'' 第10回音声言語シンポジウム, 2008-SLP-74-38, 東京, 日本, December, 2008.
- 大浦圭一郎, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``HMM音声合成における共分散パラメータの共有に関する検討,'' 第10回音声言語シンポジウム, 2008-SLP-74-37, 東京, 日本, 2008年12月.
- Tatsuya Ito, Kei Hashimoto, Yoshihiko Nankaku, Akinobu LEE, and Keiichi Tokuda, ``Speaker Recognition Based on Gaussian Mixture Models Using Variational Bayesian Method,'' 第10回音声言語シンポジウム, 2008-SLP-74-32, 東京, 日本, December, 2008.
- Kaori Yutani, Yoshihiko Nankaku, Tomoki Toda, Keiichi Tokuda, ``Simultaneous Transformation of Duration and Spectrum Using Statistical Models Including Time-Sequence Matching,'' 第10回音声言語シンポジウム, 2008-SLP-74-14, 東京, 日本, December, 2008.
- Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, ``Bayesian Context Clustering Using Cross Validation for HMM-Based Speech Synthesis,'' 第10回音声言語シンポジウム, 2008-SLP-74-13, 東京, 日本, December, 2008.
- 酒向慎司, 才野慶二郎, 南角吉彦, 徳田恵一, 北村正, ``声質と歌唱スタイルを自動学習可能な歌声合成システム,'' 第74回音楽情報科学研究会・第70回音声言語情報処理研究会 共催研究会, vol. 2008, no. 12, 2008-SLP-70-7, pp. 39-44, 静岡, 日本, 2008年2月.
全国大会
- 小島弘, 南角吉彦, 李晃伸, 徳田恵一, ``音声認識のビーム探索における複数枝刈り基準の統合に関する検討,'' 日本音響学会2008年秋季研究発表会, pp. 211-212, 福岡, 日本, 2008月9月.
- 戸田智基, 徳田恵一, ``因子分析トラジェクトリHMMに基づく統計的音声スペクトル推定法,'' 日本音響学会2008年秋季研究発表会, pp. 293-294, 福岡, 日本, 2008年9月.(粟屋潔学術奨励賞 )
link
- 大浦圭一郎, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``HMM音声合成における分散パラメータの共有に関する検討,'' 日本音響学会2008年秋季研究発表会, pp. 421-422, 2008年9月.
- 渡辺英樹, 花園正也, 西山高史, 徳田恵一, ``合成音声の主観評価効率化のための評価音声抽出方法の検討,'' 日本音響学会2008年秋季研究発表会,
pp. 419-420, 福岡, 日本, 2008年9月.
- 花園正也, 渡辺英樹, 西山高史, 徳田恵一, ``文脈限定下でのHMM音声合成のための収録テキストセットの最適化,'' 日本音響学会2008年秋季研究発表会, pp. 417-418, 福岡, 日本, 2008年9月.
- 油谷かおり, 南角吉彦, 戸田智基, 徳田恵一, ``声質変換における時系列マッチングを含む統計モデルの拡張,'' 日本音響学会2008年秋季研究発表会, pp. 411-412, 福岡, 日本, 2008年9月.(日本音響学会ポスター賞)
- 塩田さやか, 橋本佳, 南角吉彦, 李晃伸, 徳田恵一, ``複数の音素決定木構造を用いた音声認識の検討,'' 日本音響学会2008年秋季研究発表会, pp. 125-126, 福岡, 日本, 2008年9月.
- Ranniery Maia, Jinfu Ni, Shinsuke Sakai, Tomoki Toda, Keiichi Tokuda, Tohru Shimizu, and Satoshi Nakamura, ``The NICT/ATR-SLC entry for the Blizzard Challenge 2008,'' 日本音響学会2008年秋季研究発表会, pp. 255-256, Fukuoka, Japan, Sepetember, 2008.
- 橋本佳, 全炳河, 南角吉彦, 徳田恵一, ``クロスバリデーションを用いたベイズ基準によるHMM音声合成,'' 日本音響学会2008年秋季研究発表会, pp. 251-252, 福岡, 日本, 2008年9月.
- Yi-JianWu, and Keiichi Tokuda, ``HMM training by minimizing log spectral distortion between generated and original LSPs for speech synthesis,'' 日本音響学会2008年秋季研究発表会, pp. 249-250, Fukuoka, Japan, September, 2008.
- 花園正也, 西山高史, 徳田恵一, ``文脈限定下での高品質HMM音声合成のための収録テキストセットの最適化,'' システム制御情報学会第52回研究発表講演会, pp. 777-778, 京都, 日本, 2008年5月.
The Insutitute of system, Control and Information Engineers ,
pp. 777-778, Kyoto, Japan, 2008.
- 伊藤達也, 南角吉彦, 李晃伸, 徳田恵一 ``変分ベイズ法に基づく話者認識,'' 日本音響学会2008年春季研究発表会, pp. 143-144, 千葉, 日本, 2008年3月.
- 宇藤陽介, 南角吉彦, 李晃伸, 徳田恵一, ``声質変換のためのスペクトルおよびF0の同時モデリング,'' 日本音響学会2008年春季研究発表会, pp. 353-356, 千葉, 日本, 2008年3月.
- 丸目雅浩, 南角吉彦, 酒向慎司, 徳田恵一, 北村正, ``変分ベイズ法に基づいた声質変換,'' 日本音響学会2008年春季研究発表会, pp. 349-352, 千葉, 日本, 2008年3月.
- 油谷かおり, 宇藤陽介, 南角吉彦, 戸田智基, 李晃伸, 徳田恵一, ``時系列マッチングを含む統計モデルに基づいた継続長およびスペクトルの同時変換,'' 日本音響学会2008年春季研究発表会, pp. 347-348, 千葉, 日本, 2008年3月.
- 山岸順一, 能勢隆, 全炳河, 戸田智基, 徳田恵一, 小林隆夫, ``Blizzard Challenge 2007のための平均声に基づくHMM音声合成システムの評価,'' 日本音響学会2008年春季研究発表会, pp. 339-342, 千葉, 日本, 2008年3月.
- Ranniery Maia, Tomoki Toda, Keiichi Tokuda, Shinsuke Sakai, and Satoshi Nakamura, ``State clustering on an excitation model for HMM-based speech synthesis ,'' 日本音響学会2008年春季研究発表会, pp. 337-338, 千葉, 日本, March, 2008.
- 大浦圭一郎, 南角吉彦,戸田智基, 徳田恵一, マイアハニエリ, 坂井信輔, 中村哲, ``英語音声合成における韻律推定モデルと音響モデルの同時学習,'' 日本音響学会2008年春季研究発表会, pp. 335-336, 千葉, 日本, March, 2008.
- 橋本佳, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``クロスバリデーションを用いたベイズ基準によるコンテキストクラスタリング,'' 日本音響学会2008年春季研究発表会, pp. 69-70, 千葉, 日本, 2008年3月.
- 袴田智博, 南角吉彦, 李晃伸, 徳田恵一, ``仮説の遅延確定による1パス信頼度計算の評価と複数デコーダ間枝刈りへの応用,'' 日本音響学会2008年春季研究発表会, pp. 217-218, 千葉, 日本, 2008年3月.
- 吉見孔孝, 南角吉彦, 李晃伸, 徳田恵一, ``音声対話システムにおける条件付確率場に基づく自動応答文選択,'' 日本音響学会2008年春季研究発表会, pp. 95-96, 千葉, 日本, 2008年3月.
- 全炳河, 徳田恵一, ``隠れマルコフモデルに基づく音声合成システム,'' 情報処理学会第70回全国大会, pp. 5-359-5-360, 茨城, 日本, 2008年3月.
学位論文
- 竹内一浩, ``メルケプストラム分析とSTRAIGHT分析を用いたHMM音声合成における諸条件の検討,'' 卒業論文, 名古屋工業大学, 2008年2月.
- 武藤聡, ``HMM歌声合成における話者適応,'' 卒業論文, 名古屋工業大学, 2008年2月.
- 一丸貴則, ``MAP推定に基づく話者補間のためのコンテキストクラスタリング,'' 卒業論文, 名古屋工業大学, 2008年2月.
- 油谷かおり, ``時系列マッチングを含む統計モデルに基づいた継続長およびスペクトルの同時変換,'' 卒業論文, 名古屋工業大学, 2008年2月.
- 伊藤達也, ``変分ベイズ法に基づく話者認識,'' 卒業論文, 名古屋工業大学, 2008年2月.
- 小林高大, ``条件付確率場に基づくGMMを用いた発話区間検出,'' 卒業論文, 名古屋工業大学, 2008年2月.
- 吉見孔孝, ``音声対話システムにおける条件付確率場による自動応答文選択,'' 卒業論文, 名古屋工業大学, 2008年2月.
- 玉森聡, ``回転変動を考慮した2次元HMMによる顔画像のモデル化,'' 卒業論文, 名古屋工業大学, 2008年2月.
- 小島弘, ``音声認識における複数の枝刈手法を統合した解探索アルゴリズム,'' 卒業論文, 名古屋工業大学, 2008年2月.
- 波多野学, ``音声認識におけるGaussianizationによる尤度の正規化,'' 卒業論文, 名古屋工業大学, 2008年2月.
- 大森健太, ``分離型2次元格子HMMに基づく顔画像認識のための特徴量の検討,'' 卒業論文, 名古屋工業大学, 2008年2月.
- 糸川喜裕, ``日本語の話し言葉における母音無声化を考慮した音声認識,'' 修士論文, 名古屋工業大学, 2008年2月.
- 樋口純司, ``部分空間法に基づく顔画像認識のための局所的特徴量の自動抽出,'' 修士論文, 名古屋工業大学, 2008年2月.
- 橋本佳, ``ベイズ基準による音声認識のための事前分布推定法の検討,'' 修士論文, 名古屋工業大学, 2008年2月.
- 坂田龍彦, ``ドメイン依存性を考慮した HMM音声合成の性能改善に関する検討,'' 修士論文, 名古屋工業大学, 2008年2月.
- 袴田智博, ``音声認識中の動的な仮説信頼度による複数デコーダ間枝刈り,'' 修士論文, 名古屋工業大学, 2008年2月.
- 渡邉俊明, ``組み込み用途のための HMM音声合成の高速化,'' 修士論文, 名古屋工業大学, 2008年2月.
- 宇藤陽介, ``スペクトルおよび F0 の同時モデリングに基づく声質変換,'' 修士論文, 名古屋工業大学, 2008年2月.
- 才野慶二郎, ``因子分析に基づく固有声モデルを用いた HMM音声合成におけるクラスタリング手法の検討,'' 修士論文, 名古屋工業大学, 2008年2月.
- 丸目雅浩, ``変分ベイズ法に基づく声質変換,'' 修士論文, 名古屋工業大学, 2008年2月.
記事
- 全炳河, 戸田智基, 中村勝, 徳田恵一, 益子貴史, 小林隆夫, 北村正, ``おめでとうソサイエティ論文賞「Blizzard Challenge のための高品質HMM 音声合成システム」,'' 電子情報通信学会情報・システムソサイエティ誌, vol. 13, no. 2, pp. 12, 2008年11月.
過去の発表論文