Yoshihiko Nankaku

研究業績リスト

学術論文

Kei Sawada, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, "A Bayesian framework for image recognition based on hidden Markov eigen-image models," IEEJ Transactions on Electrical and Electronic Engineering, vol. 13, Issue 9, pp. 1335-1347, September, 2018.

Takenori Yoshimura, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, "Mel-cepstrum-based quantization noise shaping applied to neural-network-based speech waveform synthesis," IEEE/ACM Transactions on Audio, Speech and Language Processing, vol. 26, Issue 7, pp. 1173-1180, July, 2018. (DOI: 10.1109/TASLP.2018.2818408)

Kei Sawada, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, "Constructing text-to-speech systems for languages with unknown pronunciations," Acoustical Science and Technology, vol. 39, Issue 2, pp. 119-129, March, 2018. (DOI: 10.1250/ast.39.119)

大浦圭一郎, 橋本佳, 南角吉彦, 徳田恵一, "隠れマルコフモデルに基づく日本語音声合成ソフトウェア入門," システム制御情報学会誌, vol. 62, no. 2, pp. 57-62, February 2018.

Takenori Yoshimura, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``Simultaneous optimization of multiple tree-based factor analyzed HMM for speech synthesis,'' IEEE/ACM Transactions on Audio, Speech and Language Processing, vol. 25, Issue 9, pp. 1532-1541, September, 2017. (DOI: 10.1109/TASLP.2017.2721219)

Kei Sawada, Akira Tamamori, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``A Bayesian approach to image recognition based on separable lattice hidden Markov models,'' IEICE TRANSACTIONS on Information & Systems, vol.E99-D, no.12, pp.3119-3131, December, 2016. (DOI: 10.1587/transinf.2016EDP7112)

中村和寛, 大浦圭一郎, 南角吉彦, 徳田恵一, ``隠れマルコフモデルに基づく英語歌声合成,'' IEICE, vol. J97-D, no. 11, pp. 1572-1581, Oct. 2014.

Akira Tamamori, Yoshihiko Nankaku, and Keiichi Tokuda, ``Image recognition based on separable lattice trajectory 2-D HMMs,'' IEICE TRANSACTIONS on Information & Systems, Vol.E97-D, No.7, pp. 1842-1854, Jul.2014.

Kazuhiro Nakamura, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``Integration of spectral feature extraction and modeling for HMM-based speech synthesis,'' IEICE TRANSACTIONS on Information & Systems, vol.E97-D, no.6, pp.1438-1448, Jun. 2014.

Shinji Takaki, Yoshihiko Nankaku and Keiichi Tokuda, ``Spectral modeling with contextual additive structure for HMM-based speech synthesis,'' IEEE Transactions on Audio, Speech, and Language Processing, Vol. 8, Issue 2, pp. 229--238, Apr. 2014.

Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda, ``A Bayesian framework using multiple model structures for speech recognition'' IEICE Transactions on Information and & Systems, Vol. E96-D, No. 4, pp.939-948, Apr. 2013.

Akira Tamamori, Yoshihiko Nankuaku, Keiichi Tokuda, ``An extension of separable lattice 2-D HMMs for rotational data variations,'' IEICE Transactions on Information and Systems, vol.E95-D, no.8, pp.2074-2083, August 2012.

Heiga Zen, Mark J. F. Gales, Yoshihiko Nankaku, Keiichi Tokuda, ``Product of Experts for Statistical Parametric Speech Synthesis,'' IEEE Transactions on Audio, Speech, and Language Processing, Vol. 20, Issue 3, pp. 794--805, Mar. 2012.

Sayaka Shiota, Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda, ``Speech recognition based on statistical models including multiple phonetic decision trees,'' Acoust. Sci. & Tech., vol. 32, no. 6, pp.236--243, Nov. 2011.

Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda, ``Bayesian Context Clustering Using Cross Validation for Speech Recognition,'' IEICE TRANSACTIONS on Information and Systems Vol.E94-D No.3 pp.668-678, March 2011.

寺嶌立太, 全炳河, 南角吉彦, 徳田恵一, ``フレーム単位のコンテキスト依存構造に基づく音声認識のための音響モデル,''電気学会論文誌Ｃ（電子・情報・システム部門誌）Vol. 130 (2010) , No. 10 pp.1856-1864.

Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, ``Continuous Stochastic Feature Mapping Based on Trajectory HMMs,'' IEEE Transactions on Audio, Speech, and Language Processing, Vol. 18, No. 5, pp.417-430, Feb. 2011.

Keiichiro Oura, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, and Keiichi Tokuda, ``A covariance-tying technique for HMM-based speech synthesis,'' IEICE Transactions on Information Systems, vol.E93-D, no.3, March 2010 (in press).

Keiichiro Oura, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda, ``A Fully Consistent Hidden Semi-Markov Model-Based Speech Recognition System,'' IEICE Transactions on Information Systems, vol.E91-D, no.11, pp.2693-2700, Nov 2007.

Hiroyuki Suzuki, Heiga Zen, Yoshihiko Nankaku, Chiyomi Miyajima, Keiichi Tokuda and Tadashi Kitamura, ``Continuous Speech Recognition Based on General Factor Dependent Acoustic Models,'' IEICE Transactions on Information Systems, Vol.E88-D, no.3, pp.410--417, Mar, 2005.

Hiroyoshi Yamamoto, Yoshihiko Nankaku, Chiyomi Miyajima, Keiichi Tokuda and Tadashi Kitamura, ``Parameter Sharing in Mixture of Factor Analyzers for Speaker Identification,'' IEICE Transactions on Information Systems, Vol.E88-D, no.3, pp.418--424, Mar, 2005.

Yohei Itaya, Heiga Zen, Yoshihiko Nankaku, Chiyomi Miyajima, Keiichi Tokuda, and Tadashi Kitamura, ``Deterministic Annealing EM Algorithm in Acoustic Modeling for Speaker and Speech Recognition,'' IEICE Transactions on Information Systems, Vol.E88-D, no.3, pp.425--431, Mar, 2005.

Amaro Lima, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, Tadashi Kitamura and Fernando Gil Resende, ``Applying Sparse KPCA for Feature Extraction in Speech Recognition,'' IEICE Transactions on Information Systems, Vol.E88-D, no.3, pp.401--409, Mar, 2005.

Amaro Lima, Heiga Zen, Yoshihiko Nankaku, Chiyomi Miyajima, Keiichi Tokuda, Tadashi Kitamura, ``On the use of kernel PCA for feature extraction in speech recognition,'' IEICE Transactions on Information Systems, Vol.E87-D, no.12, pp.2802--2811, Dec, 2004.

南角吉彦, 徳田恵一, 北村正, 小林隆夫, ``隠れマルコフモデルを用いた視覚音声認識のための正規化学習,'' 電子情報通信学会論文誌, vol.J86-D-II, no.2, pp.163--172, Feb, 2003.

国際会議

Takenori Yoshimura, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, "WaveNet-based zero-delay lossless speech coding," Proceedings of 2018 IEEE Workshop on Spoken Language Technology (SLT 2018), Athens, Greece, December 18-21, 2018. (Accepted)

Kento Nakao, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, "Speaker adaptation for speech synthesis based on deep neural networks using hidden semi-Markov model structures," Proceedings of Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2018 (APSIPA ASC 2018), Honolulu, Hawaii, November 12-15, 2018. (Accepted)

Takayuki Kasugai, Yoshinari Tsuzuki, Kei Sawada, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, "Image recognition based on convolutional neural networks using features generated from separable lattice hidden Markov models," Proceedings of Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2018 (APSIPA ASC 2018), Honolulu, Hawaii, November 12-15, 2018. (Accepted)

Koki Senda, Yukiya Hono, Kei Sawada, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, "Singing voice conversion using posted waveform data on music social media," Proceedings of Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2018 (APSIPA ASC 2018), Honolulu, Hawaii, November 12-15, 2018. (Accepted)

Yukiya Hono, Shumma Murata, Kazuhiro Nakamura, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, "Recent development of the DNN-based singing voice synthesis system -- Sinsy," Proceedings of Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2018 (APSIPA ASC 2018), Honolulu, Hawaii, November 12-15, 2018. (Accepted)

Takenori Yoshimura, Natsumi Koike, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, "Discriminative feature extraction based on sequential variational autoencoder for speaker recognition," Proceedings of Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2018 (APSIPA ASC 2018), Honolulu, Hawaii, November 12-15, 2018. (Accepted)

Takato Fujimoto, Takenori Yoshimura, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, "Speech synthesis using WaveNet vocoder based on periodic/aperiodic decomposition," Proceedings of Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2018 (APSIPA ASC 2018), Honolulu, Hawaii, November 12-15, 2018. (Accepted)

Kei Sawada, Takenori Yoshimura, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, "The NITech text-to-speech system for the Blizzard Challenge 2018," Proceedings of Blizzard Challenge 2018 Workshop, Hyderabad, India, September 8, 2018. (web proceedings)

Eiji Ichikawa, Kei Sawada, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, "Image recognition based on separable lattice HMMs using a deep neural network for output probability distributions," Proceedings of 2018 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2018), pp. 3021-3025, Calgary, Canada, April 15-20, 2018.

Jumpei Niwa, Takenori Yoshimura, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, "Statistical voice conversion based on WaveNet," Proceedings of 2018 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2018), pp. 5289-5293, Calgary, Canada, April 15-20, 2018.

Amelia Gully, Takenori Yoshimura, Damian Murphy, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``Articulatory text-to-speech synthesis using the digital waveguide mesh driven by a deep neural network,'' Proceedings of Interspeech 2017, pp. 234-238, Stockholm, Sweden, August 20--24, 2017.

Yoshinari Tsuzuki, Kei Sawada, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``Image recognition based on discriminative models using features generated from separable lattice HMMs,'' Proceedings of 2017 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2017), pp.2607-2611, New Orleans, USA, March 5-9, 2017.

Keiichi Tokuda, Kei Hashimoto, Keiichiro Oura, and Yoshihiko Nankaku, ``Temporal modeling in neural network based statistical parametric speech synthesis,'' Proceedings of 9th ISCA Speech Synthesis Workshop (SSW9), pp.113-118, California, USA, September 13--15, 2016.

Rasmus Dall, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``Redefining the linguistic context feature set for HMM and DNN TTS through position and parsing,'' Proceedings of Interspeech 2016, pp.2851-2855, California, USA, September 8--12, 2016.

Masanari Nishimura, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``Singing voice synthesis based on deep neural networks,'' Proceedings of Interspeech 2016, pp.2478-2482, California, USA, September 8--12, 2016.

Naoki Hosaka, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``Voice conversion based on trajectory model training of neural networks considering global variance,'' Proceedings of Interspeech 2016, pp.307-311, California, USA, September 8--12, 2016.

Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``Trajectory training considering global variance for speech synthesis based on neural networks,'' Proceedings of 2016 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2016), pp.5600-5604, Shanghai, China, March 20-25, 2016.

Takenori Yoshimura, Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda, ``Simultaneous Optimization of Multiple Tree Structures for Factor Analyzed HMM-Based Speech Synthesis,'' Proc. of Interspeech 2015, pp. 1196--1200, Dresden Germany, September 6-10, 2015.

Siva Reddy Gangireddy, Steve Renals, Yoshihiko Nankaku, Akinobu Lee ``Prosodically-Enhanced Recurrent Neural Network Language Models,'' Proc. of Interspeech 2015, pp. 2390--2394, Dresden Germany, September 6-10, 2015.

Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``The Effect of Neural Networks in Statistical Parametric Speech Synthesis,'' 2015 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2015), pp.4455--4459, Brisbane Australia, April 19-24, 2015.

Atsunobu Kaminuma, Yoshihiko Nankaku, ``Automatic Driver Characteristics Estimation Using Driving Signals,'' FISITA 2014, p1-9, Jun. 2014.

Kazuhiro Nakamura, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, Keiichi Tokuda, ``A Mel-Cepstral Analysis Technique Restoring High Frequency Components from Low-Sampling-Rate Speech,'' Proc. of Interspeech 2014, pp. 2494--2498, Singapore, 14-18 Sep. 2014.

Kazuhiro Nakamura, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``HMM-based singing voice synthesis and its application to Japanese and English,'' 2014 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2014), pp.265--269, Florence Italy, May 6-9, 2014.

Kanako Shirota, Kazuhiro Nakamura, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``Integration of speaker and pitch adaptive training for HMM-based singing voice synthesis,'' 2014 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2014), pp.2578--2582, Florence Italy, May 6-9, 2014.

Kei Sawada, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``Image recognition based on hidden Markov eigen-image models using variational Bayesian method,'' in Proc. APSIPA 2013, Oct. 2013.

Takenori Yoshimura, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku and Keiichi Tokuda, ``Cross-lingual speaker adaptation based on factor analysis using bilingual speech data for HMM-based speech synthesis,'' Proc. of ISCA Speech Synthesis Workshop(SSW8), pp. 297-302, Aug. 2013.

Takaya Makino, Shinji Takaki, Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda, ``Separable lattice 2-D HMMs introducing state duration control for recognition of images with various variations,'' 2013 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2013), pp.3203--3207, Vancouver Canada, May 26-31, 2013.

Akira Tamamori, Yoshihiko Nankaku, Keiichi Tokuda, ``Image recognition based on separable lattice trajectory 2-d HMMs,'' 2013 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2013), pp.3467--3471, Vancouver Canada, May 26-31, 2013.

Shinji Takaki, Yoshihiko Nankaku and Keiichi Tokuda, ``Contextual partial additive structure for HMM-based speech synthesis,'' 2013 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2013), pp.7878--7882, Vancouver Canada, May 26-31, 2013.

Kazuhiro Nakamura, Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda, ``Integration of acoustic modeling and mel-cepstral analysis for HMM-based speech synthesis,'' 2013 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2013), pp.7883--7887, Vancouver Canada, May 26-31, 2013.

Takafumi Hattori, Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda, ``A Bayesian approach to speaker recognition based on GMMs using multiple model structures,'' Interspeech 2012, Portland, USA, September 9-13, 2012.

Viviane de Franca Oliveira, Sayaka Shiota, Yoshihiko Nankaku, Keiichi Tokuda, ``Cross-lingual speaker adaptation for HMM-based speech synthesis based on perceptual characteristics and spaker interpolation,'' Interspeech 2012, Portland, USA, September 9-13, 2012.

Kei Sawada, Akira Tamamori, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``Face Recognition Based on Separable Lattice 2-D HMMs Using Variational Bayesian Method,'' 2012 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2012), pp.2205--2208, Kyoto, Japan, 25-30 Mar. 2012.

Keisuke Kumaki, Yoshihiko Nankaku, and Keiichi Tokuda, ``Face Recognition Based on Extended Separable Lattice 2-D HMMs,'' 2012 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2012), pp.2209--2212, Kyoto, Japan, 25-30 Mar. 2012.

Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``A Model Structure Integration Based on Bayesian Framework for Speech Recognition,'' 2012 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2012), pp.4813--4816, Kyoto, Japan, 25-30 Mar. 2012.

Keiichiro Oura, Ayami Mase, Yoshihiko Nankaku, and Keiichi Tokuda ``Pich Adaptive Training for HMM-Based Singing Voice Synthesis,'' 2012 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2012), pp.5377--5380, Kyoto, Japan, 25-30 Mar. 2012.

Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``Multi-Speaker Modeling with Shared Prior Distributions and Model Structures for Bayesian Speech Synthesis,'' Proc. Interspeech 2011, pp.113--116, Florence, Italy, 27-31 Aug. 2011.

Lei Li, Yoshihiko Nankaku, Keiichi Tokuda, ``A Bayesian Approach to Voice Conversion Based on GMMs Using Multiple Model Structures,'' Proc. Interspeech 2011, pp.661--664, Florence, Italy, 27-31 Aug. 2011.

Ulpu Remes, Yoshihiko Nankaku, Keiichi Tokuda, ``GMM-Based Missing-Feature Reconstruction on Multi-Frame Windows,'' Proc. Interspeech 2011, pp.1665--1668, Florence, Italy, 27-31 Aug. 2011.

Ling-Hui Chen, Yoshihiko Nankaku, Heiga Zen, Keiichi Tokuda, Zhen-Hua Ling, Li-Rong Dai, ``Estimation of Window Coefficients for Dynamic Feature Extraction for HMM-Based Speech Synthesis,'' Proc. Interspeech 2011, pp.1801--1804, Florence, Italy, 27-31 Aug. 2011.

Naoaki Ito, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda, ``Evaluation of Tree-Trellis Based Decoding in Over-Million LVCSR,'' Proc. Interspeech 2011, pp.1937--1940, Florence, Italy, 27-31 Aug. 2011.

Shinji Takaki, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``An Optimization Algorithm of Independent Mean and Variance Parameter Tying Structures for HMM-Based Speech Synthesis,'' 2011 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2011), pp.4700--4703, Prague, Czech Republic, 22-27 May 2011.

Shifeng Pan, Yoshihiko Nankaku, Keiichi Tokuda, Jianhua Tao, ``Global Variance Modeling on Frequency Domain Delta LSP for HMM-Based Speech Synthesis,'' 2011 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2011), pp.4716--4719, Prague, Czech Republic, 22-27 May 2011.

Xianglin Peng, Keiichiro Oura, Yoshihiko Nankaku, Keiichi Tokuda, ``Cross-Lingual Speaker Adaptation for HMM-Based Speech Synthesis Considering Differences Between Language-Dependent Average Voices,'' Proc. of IEEE 10th International Conference on Signal Processing, pp.605-608, Beijing China, 24 -28 Oct. 2010.

Toyohiro Hayashi, Yoshihiko Nankaku, Akinobu Lee and Keiichi Tokuda, ``Speaker Adaptation Based on Nonlinear Spectral Transform for Speech Recognition,'' Interspeech 2009, pp.542-545, Chiba, Japan, 26-30 Sep. 2010.

Ayami Mase, Keiichiro Oura, Yoshihiko Nankaku, Keiichi Tokuda, ``HMM-based singing voice synthesis system using pitch-shifted pseudo training data,'' Interspeech 2009, pp.845-848, Chiba, Japan, 26-30 Sep. 2010.

Akira Saito, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda, ``Voice activity detection based on conditional random fields using multiple features,'' Interspeech 2009, pp.2086-2089, Chiba, Japan, 26-30 Sep. 2010.

Shinji Takaki, Yoshihiko Nankaku, and Keiichi Tokuda, ``Spectral modeling with contextual additive structure for HMM-based speech synthesis,'' Proc. of 7th ISCA Speech Synthesis Workshop, pp.100-105, Kyoto, Japan, Sep. 22-24, 2010.

Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``Bayesian speech synthesis framework integrating training and synthesis processes,'' Proc. of 7th ISCA Speech Synthesis Workshop, pp.106-111, Kyoto, Japan, Sep. 22-24, 2010.

Keiichiro Oura, Ayami Mase, Tomohiko Yamada, Satoru Muto, Yoshihiko Nankaku, and Keiichi Tokuda, ``Recent Development of the HMM-based Singing Voice Synthesis System -- Sinsy,'' Proc. of 7th ISCA Speech Synthesis Workshop, pp.211-216, Kyoto, Japan, Sep. 22-24, 2010.

Yoshiaki Takahashi, Akira Tamamori, Yoshihiko Nankaku, Keiichi Tokuda, ``Face recognition based on separable lattice 2-D HMM with state duration modeling,'' 2010 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2010), pp.2162-2165, Dallas, Texas, U.S.A., March 14-19, 2010.

Kyosuke Kazumi, Yoshihiko Nankaku, Keiichi Tokuda, ``Factor analyzed voice models for HMM-based speech synthesis,'' 2010 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2010), pp.4234-4237, Dallas, Texas, U.S.A., March 14-19, 2010.

Akira Tamamori, Yoshihiko Nankaku, Keiichi Tokuda, ``An extension of separable lattice 2-D HMMs for rotational data variations,'' 2010 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2010), pp.2206-2209, Dallas, Texas, U.S.A., March 14-19, 2010.

Heiga Zen, Mark Gales, Yoshihiko Nankaku, Keiichi Tokuda, ``Statistical parametric speech synthesis based on product of experts,'' 2010 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2010), pp.4242-4545, Dallas, Texas, U.S.A., March 14-19, 2010.

Yi-Jian Wu, Yoshihiko Nankaku, Keiichi Tokuda, ``State Mapping Based Method for Cross-Lingual Speaker Adaptation in HMM-Based Speech Synthesis,'' Interspeech 2009, pp.528-531, Brighton, U.K., 6-10 September, 2009.

Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda, ``Deterministic Annealing Based Training Algorithm for Bayesian Speech Recognition,'' Interspeech 2009, pp.680-683, Brighton, U.K., 6-10 September, 2009.

Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda, ``A Bayesian Approach to Hidden Semi-Markov Model Based Speech Synthesis,'' Interspeech 2009, pp.1751-1754, Brighton, U.K., 6-10 September, 2009.

Keiichiro Oura, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda, ``Tying Covariance Matrices to Reduce the Footprint of HMM-Based Speech Synthesis Systems,'' Interspeech 2009, pp.1759-1762, Brighton, U.K., 6-10 September 2009.

Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, ``A Bayesian approach to HMM-based speech synthesis,'' 2009 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2009), pp.4029-4032, Taipei, Taiwan, April 19-24, 2009.

Kaori Yutani, Yosuke Uto, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda, ``Voice conversion based on simultaneous modeling of spectrum and F0,'' 2009 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2009), pp.3897-3900, Taipei, Taiwan, April 19-24, 2009.

Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, ``Stereo-based stochastic noise compensation based on trajectory GMMs,'' 2009 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2009), pp.4577-4580, Taipei, Taiwan, April 19-24, 2009.

Keiichiro Oura, Yoshihiko Nankaku, Tomoki Toda, Keiichi Tokuda, Rannierry Maia, Shinsuke Sakai, Satoshi Nakamura, ``Simultaneous Acoustic, Prosodic, and Phrasing Model Training for TTS Conversion Systems,'' International Symposium on Chinese Spoken Language Processing (ISCSLP2008), SPE1.1, pp.1-4, Kunming, China, December 16-19, 2008 (Best Student Paper Award).

Zhi-Peng Yu, Yi-Jian Wu, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, ``Analysis of stream-dependent tying structure for HMM-based speech synthesis,'' International Conference on Signal Processing (ICSP'08), pp.655-658, Beijing, China, October 26-29, 2008.

Yoshitaka Yoshimi, Ryota Kakitsuba, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda, ``Probabilistic Answer Selection Based on Conditional Random Fields for Spoken Dialog System,'' Interspeech 2008, pp.215-218, Brisbane, Australia, September 22-26, 2008.

Sayaka Shiota, Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda, ``Acoustic Modeling Based on Model Structure Annealing for Speech Recognition,'' Interspeech 2008, pp.932-935, Brisbane, Australia, September 22-26, 2008.

Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda, ``Bayesian Context Clustering Using Cross Valid Prior Distribution for HMM-Based Speech Recognition,'' Interspeech 2008, pp.936-939, Brisbane, Australia, September 22-26, 2008.

Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, ``Probabilistic Feature Mapping Based on Trajectory HMMs,'' Interspeech 2008, pp.1068-1071, Brisbane, Australia, September 22-26, 2008.

Kaori Yutani, Yosuke Uto, Yoshihiko Nankaku, Tomoki Toda, Keiichi Tokuda, ``Simultaneous Conversion of Duration and Spectrum Based on Statistical Models Including Time Sequence Matching,'' Interspeech 2008, pp.1072-1075, Brisbane, Australia, September 22-26, 2008.

Yi-Jian Wu, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, ``Minimum generation error criterion considering global/local variance for HMM-based speech synthesis,'' 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp.4621-4624, Las Vegas, Nevada, U.S.A., March 30-April 4, 2008.

Yoshihiko Nankaku, Kazuhiro Nakamura, Heiga Zen, Keiichi Tokuda, ``Acoustic modeling with contextual additive structure for HMM-based speech recognition,'' 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp.4469-4472, Las Vegas, Nevada, U.S.A., March 30-April 4, 2008.

Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, ``Model-Space MLLR for Trajectory HMMs,'' Interspeech 2007 - EUROSPEECH, pp.2065-2068, Antwerp, Belguim, August 27-31, 2007.

Ranniery Maia, Tomoki Toda, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, ``A trainable excitation model for HMM-based speech synthesis,'' Interspeech 2007 - EUROSPEECH, pp,1909-1912, Antwerp, Belguim, August 27-31, 2007.

Ranniery Maia, Tomoki Toda, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, ``An excitation model for HMM-based speech synthesis based on residual modeling,'' Proc. of 6th ISCA Speech Synthesis Workshop, pp.131-136, Bonn, Germany, August 22-24, 2007.

Yoshihiko Nankaku, Kenichi Nakamura, and Keiichi Tokuda, ``Spectral conversion based on statistical models including time-frequency matching,'' Proc. of 6th ISCA Speech Synthesis Workshop, pp.333-338, Bonn, Germany, August 22-24, 2007.

Yoshihiko Nankaku, and Keiichi Tokuda, ``Face recognition using hidden Markov eigenface models,'' 2007 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2007), Vol. 2, pp.469-472, Hawaii, USA, April 15-20, 2007.

Kazuhiro Nakamura, Heiga Zen, Yoshihiko Nankaku, and Keiichi Tokuda, ``Acoustic modeling with contextual additive structure for hidden Markov model-based speech recognition,'' Proc. of The 4th Joint Meeting of ASA/ASJ, Honolulu, Hawai, Nov. 28-Dec. 2, 2006 (in J. Acoust. Soc. Am., vol.120, no.5, Part.2, p.3042, November 2006) (abstract paper).

Yoshihiro Itogawa, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, and Keiichi Tokuda, ``Decision-tree-based F0 quantization for hidden Markov model-based speech coding at 100 bit/s,'' Proc. of The 4th Joint Meeting of ASA/ASJ, Honolulu, Hawai, Nov. 28-Dec. 2, 2006 (in J. Acoust. Soc. Am., vol.120, no.5, Part.2, p.3038, November 2006) (abstract paper).

Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, and Keiichi Tokuda, ``Hyperparameter estimation for speech recognition based on variational Bayesian approach,'' Proc. of The 4th Joint Meeting of ASA/ASJ, Honolulu, Hawai, Nov. 28-Dec. 2, 2006 (in J. Acoust. Soc. Am., vol.120, no.5, Part.2, p.3042, November 2006) (abstract paper).

Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, Tadashi Kitamura, ``Speaker adaptation of trajectory HMMs using feature-space MLLR,'' Interspeech 2006 - ICLSP, pp.1141-1144, Sep. 2006.

Keijiro Saino, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda, ``HMM-based singing voice synthesis system,'' Interspeech 2006 - ICSLP, pp.2274-2277, Sep. 2006.

Yosuke Uto, Yoshihiko Nankaku, Tomoki Toda, Akinobu Lee, Keiichi Tokuda, ``Voice conversion based on mixtures of factor analyzers,'' Interspeech 2006 - ICSLP, pp.2278-2281, Sep. 2006.

Tomohiro Hakamata, Akinobu Lee, Yoshihiko Nankaku, Keiichi Tokuda, ``Reducing computation on Parallel decoding using frame-wise confidence scores,'' Interspeech 2006 - ICSLP, pp.1638-1641, Sep. 2006.

Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, Tadashi Kitamura, ``Estimating trajectory HMM parameters using Monte Carlo EM with Gibbs sampler,'' IEEE International Conference on Acoustics Speech, and Signal Processing (ICASSP), vol.1, pp.I-1173-I-1176, May 2006.

Keiichiro Oura, Heiga Zen, Yoshihiko Nankaku, Akinobu Lee, Keiichi Tokuda, ``Hidden semi-Markov model based speech recognition system using weighted finite-state transducer,'' IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), vol.1, pp.I-33-I-36, May 2006.

Kenichi Nakamura, Tomoki Toda, Yoshihiko Nankaku, Keiichi Tokuda, ``On the use of phonetic information for mapping from articulatory movements to vocal tract spectrum,'' IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), vol.1, pp.I-93-I-96, May 2006.

Daisuke Kurata, Yoshihiko Nankaku, Keiichi Tokuda, Tadashi Kitamura, Zoubin Ghahramani, ``Face recognition based on separable lattice HMMs,'' IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2006), vol.5, pp.V-737-V-740, May 2006 (Student Paper Award).

Amaro A. de Lima, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, Tadashi Kitamura and FernandoGil Resende, ``Sparse KPCA for Feature Extraction in Speech Recognition,'' IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), vol.1, pp.353--356, Mar. 2005.

Hiroyoshi Yamamoto, Yoshihiko Nankaku, Chiyomi Miyajima, Keiichi Tokuda and Tadashi Kitamura, ``Parameter Sharing and Minimum Classification Error Training of Mixtures of Factor Analyzers for Speaker Identification,'' IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), vol.1, pp.29--32, May 2004.

Yohei Itaya, Heiga Zen, Yoshihiko Nankaku, Chiyomi Miyajima, Keiichi Tokuda, and Tadashi Kitamura, ``Deterministic Annealing EM algorithm in parameter estimation for acoustic model,'' International Conference on Spoken Language Processing (ICSLP), vol.1, pp.433--436, Oct. 2004.

Hiroyuki Suzuki, Heiga Zen, Yoshihiko Nankaku, Chiyomi Miyajima, Keiichi Tokuda and Tadashi Kitamura, ``Speech recognition using voice-characteristic-dependent acoustic models,'' IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), vol.1, pp.740--743, 2003.

Amaro Azevedo de Lima, Heiga Zen, Yoshihiko Nankaku, Chiyomi Miyajima, Keiichi Tokuda, Tadashi Kitamura, ``On the Use of Kernel PCA for Feature Extraction in Speech Recognition,'' Proceedings of European Conference on Speech Communication and Technology (Eurospeech), pp.2625--2628, Sep. 2003.

Yoshihiko Nankaku, Keiichi Tokuda, Tadashi Kitamura and Takao Kobayashi, ``Normalized Training for HMM-Based Visual Speech Recognition,'' IEEE International Conferece on Image Processing (ICIP), WA07.07, Vancouver, Canada, Sep. 2000.

Yoshihiko Nankaku, Keiichi Tokuda and Tadashi Kitamura, ``Intensity- and location-normalized training for HMM-based visual speech recognition,'' Proceedings of European Conference on Speech Communication and Technology (Eurospeech), vol.3, pp.1287--1290, Sep. 1999.

国内研究会

中尾健人, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, "時間構造を考慮したニューラルネットワークに基づく音声合成における話者適応の検討," Technical Report of IEICE, vol. 118, no. 112, SP2018-11, pp. 53-58, 長野, June 28-29, 2018.

丹羽純平, 吉村建慶, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, ``WaveNetに基づく声質変換の検討,'' Technical Report of IEICE, vol. 117, no. 393, SP2017-84, pp. 99-104, 東京, January 20-21, 2018.

吉村建慶, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, ``メルケプストラムに基づくノイズシェーピング量子化法のWaveNet音声合成への適用,'' Technical Report of IEICE, vol. 117, no. 393, SP2017-83, pp. 93-98, 東京, January 20-21, 2018.

船戸涼平, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, ``DNN音声合成のためのパワーを考慮したトラジェクトリ学習,'' Technical Report of IEICE, vol. 117, no. 393, SP2017-74, pp. 43-48, 東京, January 20-21, 2018. (電子情報通信学会・日本音響学会学生ポスター賞)

橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, ``DNN音声合成における音響特徴量系列とその時間構造の同時モデル化,'' Technical Report of IEICE, vol. 116, no. 414, SP2016-76, pp. 71-76, 東京, January 21, 2017. (2016年度電子情報通信学会・日本音響学会音声研究会研究奨励賞)

浅井千明, 沢田慶, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, ``オーディオブックを用いた表現豊かな音声合成のための言語特徴量の検討,'' Technical Report of IEICE, vol. 116, no. 414, SP2016-70, pp. 35-40, 東京, January 21, 2017.

都築良成, 沢田慶, 橋本佳, 南角吉彦, 徳田恵一, ``分離型格子HMMによる特徴量生成を用いた識別モデルに基づく画像認識,'' Technical Report of IEICE, vol.116, no.89, PRMU2016-36, pp.7-12, 東京, June 13-14, 2016.

助川正人，沢田　慶，橋本　佳，南角吉彦，徳田恵一， ``画像認識のための混合出力分布を用いた分離型格子HMMにおけるパラメータ共有構造の検討,'' 信学技報, vol. 115, no. 456, PRMU2015-138, pp. 37-42, Feb. 2016.

沢田　慶，橋本　佳，大浦圭一郎，南角吉彦，徳田恵一， ``発音情報が未知の言語におけるテキスト音声合成システム構築法の評価,'' 電子情報通信学会技術研究報告（音声言語シンポジウム）, vol. 115, no. 346, SP2015-80, pp. 93-98, Dec. 2015.

虫鹿弘二，中村和寛，橋本佳，大浦圭一郎，南角吉彦，徳田恵一， ``HMM歌声合成における音声データの誤りに頑健なモデル化手法の検討,'' IPSJ SIG Technical Report, vol.2015-MUS-106, no.13, pp.1-6, March 2-3, 2015.

柘植彬史，橋本佳，南角吉彦，徳田恵一， ``変分ベイズ法による特徴量生成を用いた対数線形モデルに基づく話者認識,'', SP2014-1, 信学技報, vol.113, no.404, pp.13-18, January 2014.

牧野貴也，高木信二，橋本佳，南角吉彦，徳田恵一， ``状態継続長制御に基づいた拡張分離型格子HMMによる変動に頑健な画像認識,'' PRMU2013, 信学技報, vol.112, no.441, pp.149--154, February 2013.

沢田慶，橋本佳，南角吉彦，徳田恵一， ``変分ベイズ法を用いた可変固有画像モデルに基づく画像認識'' , PRMU2013, 信学技報, vol.112, no.441, pp.155--160, February 2013.

平野隆司，加藤杏樹，南角吉彦，李晃伸，徳田恵一， ``登録キーワードと汎用言語モデルを用いた音声認識部・応答選択部の密結合に基づく統計的音声対話システム,'' 2012 Information Processing Society of Japan, vol.2012-SLP-92, no.3, pp.1-6, July 19-21, 2012.

大浦圭一郎，間瀬絢美，南角吉彦，徳田恵一， ``HMM歌声合成における音高正規化学習の検討,'' Technical Report of IPSJ, SIGMUS2012, Feb. 2012.

沢田慶，玉森聡，橋本佳，南角吉彦，徳田恵一， ``変分ベイズ法を用いた分離型2次元格子HMMに基づく顔画像認識,'' 電子情報通信学会技術研究報告, vol. 111, no. 317, PRMU2011-120, pp. 125-130, Nov. 2011.

熊木慶介，南角吉彦，徳田恵一， ``分離型格子HMMの構造を用いた隠れ条件付確率場に基づく顔画像認識,'' 電子情報通信学会技術研究報告, vol. 111, no. 317, PRMU2011-121, pp. 131-136, Nov. 2011.

Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda, ``Bayesian speech recognition based on model structure integration,'' 電子情報通信学会技術研究報告，Vol. 111, No. 97, pp.11--16, Jun. 2011.

加藤杏樹, 南角吉彦, 李晃伸, 徳田恵一, ``音声対話システムのための複数キーワードの共起制約に基づくスポッティングアルゴリズムの評価,'' 電子情報通信学会技術研究報告（音声言語シンポジウム）, vol. 110, no. 357, SP2010-89, pp. 25-30, December, 2010.

大野博之, 小島弘, 南角吉彦, 李晃伸, 徳田恵一, ``連続単語認識における認識結果の逐次早期確定アルゴリズムの評価,'' 電子情報通信学会技術研究報告（音声言語シンポジウム）, vol. 110, no. 357, SP2010-94, pp. 77-82, December, 2010.

林豊大, 南角吉彦, 李晃伸, 徳田恵一, ``音声認識のための非線形スペクトル変換を用いた話者適応,'' 電子情報通信学会技術研究報告（音声言語シンポジウム）, vol.109, no.356, pp.1-6, SP2009-76, December, 2009.

斎藤彰, 南角吉彦, 李晃伸, 徳田恵一, ``複数の特徴量による条件付確率場に基づく音声区間検出,'' 電子情報通信学会技術研究報告（音声言語シンポジウム）, vol.109, no.356, pp.59-64, SP2009-82, December, 2009.

吉見孔孝, 南角吉彦, 李晃伸, 徳田恵一, ``音声対話システムのためのN-gramに基づくキーワードからの文生成,'' 電子情報通信学会技術研究報告（音声言語シンポジウム）, vol.109, no.356, pp.71-76, SP2009-83, December, 2009.

鹿住恭介, 南角吉彦, 徳田恵一, ``多様な声質を表現するための因子分析モデルに基づくHMM音声合成,'' 電子情報通信学会技術研究報告（音声言語シンポジウム）, vol.109, no.356, pp.177-182, SP2009-92, December, 2009.

福田敏則, 吉見孔孝, 南角吉彦, 李晃伸, 徳田恵一, ``ユーザ生成型音声対話コンテンツを用いた音声情報案内システム,'' 電子情報通信学会技術研究報告（音声言語シンポジウム）, vol.109, no.356, pp.207-212, SP2009-94, December, 2009.

高橋良彰, 玉森聡, 南角吉彦, 徳田恵一, ``状態継続長を考慮した分離型2次元格子HMMによる顏画像認識,'' 電子情報通信学会技術研究報告, vol.108, no.484, PRMU2008-262, pp.153-158, March 2009.

玉森聡, 南角吉彦, 徳田恵一, ``回転変動を考慮した分離型2 次元HMM による顔画像認識,'' 電子情報通信学会技術研究報告, vol.108, no.484, PRMU2008-263, pp.159-164, March 2009.

小島弘, 南角吉彦, 李晃伸, 徳田恵一, ``信頼度基準による解探索打ち切りに基づく超早音声認識,'' 電子情報通信学会技術研究報告, vol.108, no.422, SP2008-128, pp.13-18, January 2009.

Kei Hashimoto, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, ``Bayesian Context Clustering Using Cross Validation for HMM-Based Speech Synthesis,'' 情報処理学会研究報告「音声言語情報処理」, 2008-SLP-74-13, December 2008.

Kaori Yutani, Yoshihiko Nankaku, Tomoki Toda, Keiichi Tokuda, ``Simultaneous Transformation of Duration and Spectrum Using Statistical Models Including Time-Sequence Matching,'' 情報処理学会研究報告「音声言語情報処理」, 2008-SLP-74-14, December 2008.

Tatsuya Ito, Kei Hashimoto, Yoshihiko Nankaku, Akinobu LEE, and Keiichi Tokuda, ``Speaker Recognition Based on Gaussian Mixture Models Using Variational Bayesian Method,'' 情報処理学会研究報告「音声言語情報処理」, 2008-SLP-74-32, December 2008.

大浦圭一郎, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``HMM音声合成における共分散パラメータの共有に関する検討,'' 情報処理学会研究報告「音声言語情報処理」, 2008-SLP-74-37, December 2008.

Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, Akinobu LEE, and Keiichi Tokuda, `Speech recognition based on statistical models including multiple decision trees,'' 情報処理学会研究報告「音声言語情報処理」, 2008-SLP-74-38, December 2008.

酒向慎司，才野慶二郎，南角吉彦，徳田恵一，北村　正, ``声質と歌唱スタイルを自動学習可能な歌声合成システム,'' 情報処理学会研究報告「音声言語情報処理」, Vol.2008, no.12, 2008-SLP-70-7, pp.39-44, Feb. 2008.

宇藤陽介, 南角吉彦, 李晃伸, 徳田恵一, ``声質変換のためのスペクトル・F0の同時モデリング,'' 電子情報通信学会技術研究報告（音声言語シンポジウム）, vol.107, no.406, pp.103-108, SP2007-113, December, 2007.

丸目雅浩, 南角吉彦, 酒向慎司, 徳田恵一, 北村正, ``変分ベイズ法に基づく声質変換,'' 電子情報通信学会技術研究報告（音声言語シンポジウム）, vol.107, no.406, pp.247-252, SP2007-138, December, 2007.

垣鍔亮太, 南角吉彦, 李晃伸, 徳田恵一, ``音声対話システムにおける発話文の自動クラスタリングに基づく応答選択,'' 情報処理学会研究報告「音声言語情報処理」, vol.2007, no.75, 2007-SLP-75, pp.7-12, July 2007.

塩田さやか, 橋本佳, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``音素決定木構造のアニーリングに基づく音響モデリング,'' 電子情報通信学会技術研究報告, vol.107, no.165, SP2007-35, pp.67-72, July 2007.

袴田智博, 南角吉彦, 李晃伸, 徳田恵一, ``フレーム単位の信頼度を用いた並列音声認識におけるデコーダ間枝刈りの検討,'' 情報処理学会研究報告, vol.2006, no.73, 2006-SLP-62, pp.31-36, July 2006.

檜垣幸司, 南角吉彦, 徳田恵一, ``可変固有顔モデルによる顔画像認識,''電子情報通信学会技術研究報告, vol.106, no.428, PRMU2006-162, pp.7-12, Dec. 2006.

大野也澄志, 南角吉彦, 徳田恵一, 北村正, Zoubin Ghahramani, ``変分近似に基づいた分離型2次元HMMの学習アルゴリズム,'' 電子情報通信学会技術研究報告, vol.102, No.652, PRMU2002-211, pp.1-6. Feb. 2003.

板谷洋平, 全炳河, 南角吉彦, 宮島千代美, 徳田恵一, 北村正, ``DAEMアルゴリズムの音声・話者認識における有効性の検討,'' 電子情報通信学会技術研究報告, vol.103, no.519, pp.1--6, Dec. 2003.

山本啓善, 南角吉彦, 宮島千代美 , 徳田恵一, 北村正, ``混合因子分析に基づく話者識別モデルのパラメータ共有構造,'' 電子情報通信学会技術研究報告, vol.103, no.519, pp.91--96, Dec. 2003.

鈴木浩之, 全柄河, 南角吉彦, 宮島千代美, 徳田恵一, 北村正, ``認識時に非観測な変動要因を考慮可能な音響モデリング,'' 電子情報通信学会技術研究報告, vol.103, no.519, pp.157--162, Dec. 2003.

南角吉彦，全炳河，徳田恵一，北村正，益子貴史, ``ベイズ的アプローチに基づくHMM音声合成,'' 電子情報通信学会技術研究報告, vol.103, No.264, SP2003-77, pp.19--24. Aug. 2003.

南角吉彦, 徳田恵一, 北村正, 小林隆夫, ``Normalized Training for HMM-Based Automatic Lipreading,'' 電子情報通信学会技術研究報告, vol.99, no.450, PRMU99-158, pp.61--66, Nov. 1999.

国内会議

法野行哉, 村田舜馬, 中村和寛, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, "Deep Neural Networkに基づく歌声合成システム -- Sinsy," 日本音響学会2018年秋季研究発表会講演論文集, pp. 1099-1102, 大分, September 12-14, 2018.

藤本崇人, 吉村建慶, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, "周期・非周期成分の分離に基づくWaveNetボコーダを用いた音声合成," 日本音響学会2018年秋季研究発表会講演論文集, pp. 1125-1126, 大分, September 12-14, 2018.

次井貴浩, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, "公共空間におけるスマートデバイスを用いた音声入力のためのサウンドマスキングに関する検討," 日本音響学会2018年秋季研究発表会講演論文集, pp. 883-884, 大分, September 12-14, 2018.

吉村建慶, 小池なつみ, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, "話者認識のためのSequential VAEに基づく特徴抽出の検討," 日本音響学会2018年秋季研究発表会講演論文集, pp. 1341-1344, 大分, September 12-14, 2018.

沢田慶, 吉村建慶, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, "Blizzard Challenge 2018のためのNITechテキスト音声合成システム," 日本音響学会2018年秋季研究発表会講演論文集, pp. 1091-1094, 大分, September 12-14, 2018.

法野行哉, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, "隠れセミマルコフモデルの構造を利用したニューラルネットワークに基づく歌声合成," 日本音響学会2018年春季研究発表会講演論文集, pp. 247-248, 埼玉, March 13-15, 2018.

村田舜馬, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, "DNNに基づく発声タイミングモデルを利用した歌声合成," 日本音響学会2018年春季研究発表会講演論文集, pp. 245-246, 埼玉, March 13-15, 2018.

沢田慶, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, ''Blizzard Challenge 2017のためのNITechテキスト音声合成システム,'' 日本音響学会2017年秋季研究発表会講演論文集, pp. 287-290, 愛媛, September 25-27, 2017.

法野行哉, 沢田慶, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, 近藤大介, 石川大輔, ``音楽SNSの投稿データを利用した歌唱声質変換,'' 日本音響学会2017年秋季研究発表会講演論文集, pp. 209-210, 愛媛, September 25-27, 2017.

Jumpei Niwa, Takenori Yoshimura, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``WaveNet-based voice conversion,'' Proceedings of ASJ2017 autumn meeting, pp. 207-208, Ehime, September 25-27, 2017.

吉村建慶, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, ``WaveNetにおけるメルケプストラムに基づくノイズシェーピング量子化法の適用,'' 日本音響学会2017年秋季研究発表会講演論文集, pp. 193-194, 愛媛, September 25-27, 2017.

村瀬栞, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, ``ニューラルネットワークに基づく音声合成における音響特徴量抽出条件の検討,'' 日本音響学会2017年春季研究発表会講演論文集, pp. 263-264, 神奈川, March 15-17, 2017.

市川裕詞, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一, ``DNN-GMMハイブリッドモデルに基づく声質変換の検討,'' 日本音響学会2017年春季研究発表会講演論文集, pp. 233-234, 神奈川, March 15-17, 2017. (学生優秀発表賞)

西村方成，橋本佳，大浦圭一郎，南角吉彦，徳田恵一， ``Deep Neural Networkに基づく歌声合成の検討,'' 日本音響学会春季研究発表会講演論文集, pp.213-214, Mar. 9-11, 2016.

沢田慶，伊神和輝，浅井千明，佐藤雄介，橋本佳，大浦圭一郎，南角吉彦，徳田恵一， ``統計的パラメトリック音声合成のためのオーディオブックを用いた学習コーパス自動構築,'' 日本音響学会春季研究発表会講演論文集, pp.219-220, Mar. 9-11, 2016. (学生優秀発表賞)

吉村建慶，橋本佳，大浦圭一郎，南角吉彦，徳田恵一， ``クラウドソーシングによる音声収集のための収録ソフトウェアの設計,'' 日本音響学会春季研究発表会講演論文集, pp.307-308, Mar. 9-11, 2016.

保坂尚紀，橋本佳，大浦圭一郎，南角吉彦，徳田恵一， ``ニューラルネットワークに基づく声質変換における系列内変動を考慮したトラジェクトリ学習,'' 日本音響学会春季研究発表会講演論文集, pp.239-240, Mar. 9-11, 2016.

大浦圭一郎，橋本佳，南角吉彦，徳田恵一， ``楽譜情報に基づく事前分布を用いたHMM歌声合成の検討,'' 日本音響学会春季研究発表会講演論文集, pp.245-246, Mar. 9-11, 2016.

鈴木達也，橋本佳，大浦圭一郎，南角吉彦，徳田恵一， ``条件付確率場に基づく音声の基本周波数推定の検討,'' 日本音響学会春季研究発表会講演論文集, pp.279-280, Mar. 9-11, 2016.

橋本聖矢，橋本佳，大浦圭一郎，南角吉彦，徳田恵一， ``複数の音響特徴量を用いた対数線形モデルに基づく話者認識の検討,'' 日本音響学会秋季研究発表会講演論文集, pp.25-26, Sep. 16-18, 2015.

沢田慶，橋本佳，大浦圭一郎，南角吉彦，徳田恵一， ``発音情報が未知の言語におけるテキスト音声合成システム構築法の検討,'' 日本音響学会秋季研究発表会講演論文集, pp.231-232, Sep. 16-18, 2015.

中村和寛，橋本佳，大浦圭一郎，南角吉彦，徳田恵一，　　 ''音声の高帯域成分復元を考慮したメルケプストラム分析に基づくHMM音声合成の検討,'' 日本音響学会秋季研究発表会講演論文集, pp.233-234, Sep. 16-18, 2015.

橋本佳，大浦圭一郎，南角吉彦，徳田恵一， ''ニューラルネットワークに基づく音声合成における系列内変動を考慮したトラジェクトリモデル学習,'' 日本音響学会秋季研究発表会講演論文集, pp.237-238, Sep. 16-18, 2015.

橋本佳，大浦圭一郎，南角吉彦，徳田恵一， ``ニューラルネットワークに基づく音声合成における生成モデルの利用の検討,'' 日本音響学会秋季研究発表会講演論文集, pp.245-246, Sep. 3-5, 2014. (粟屋潔学術奨励賞)

吉村建慶，橋本佳，南角吉彦，徳田恵一，``因子分析に基づくHMM音声合成における基底クラスタリングの検討,'' 日本音響学会秋季研究発表会講演論文集, pp.239-240, Sep. 3-5, 2014.

神谷翔大，橋本佳，大浦圭一郎，南角吉彦，徳田恵一， ``H/L型アクセント推定と音響モデリングを統合したHMM音声合成の検討,'' 日本音響学会秋季研究発表会講演論文集, pp.237-238, Sep. 3-5, 2014. (学生優秀発表賞)

伊神陽介，李晃伸，徳田恵一，南角吉彦， ``条件付き確率場に基づく仮説の逐次早期確定を用いた低遅延音声インタフェース,'' 日本音響学会春季研究発表会, pp.63-64, Mar. 2014.

佐藤雄介，中村和寛，橋本佳，大浦圭一郎，南角吉彦，徳田恵一， ``表現語空間を用いた連結固有声法に基づくクロスリンガル話者適応の検討,'' 日本音響学会春季研究発表会, pp.325-326, Mar. 2014.

鶴野高輝，橋本佳，南角吉彦，徳田恵一， ``GMM事後確率に基づいた重み付き変換関数による声質変換の検討,'' 日本音響学会春季研究発表会, pp.327-328, Mar. 2014.

虫鹿弘二，中村和寛，橋本佳，大浦圭一郎，南角吉彦，徳田恵一， ``HMM歌声合成における音声データの誤りに頑健なモデル学習手法の検討,'' 日本音響学会春季研究発表会, pp.335-336, Mar. 2014.

有竹貴士，中村和寛，橋本佳，大浦圭一郎，南角吉彦，徳田恵一， ``HMM音声合成におけるLSPに関連した特徴量表現の検討,'' 日本音響学会春季研究発表会, pp.337-338, Mar. 2014.

中村和寛，橋本佳，大浦圭一郎，南角吉彦，徳田恵一， ``低周波数標本化音声データの高帯域成分復元を考慮したメルケプストラム分析の検討,'' 日本音響学会春季研究発表会, pp.339-340, Mar. 2014. (学生優秀発表賞)

大浦圭一郎，橋本佳，南角吉彦，徳田恵一， ``状態レベルのコンテキストを用いたHMM音声合成の検討,'' 日本音響学会春季研究発表会, pp.341-342, Mar. 2014.

小升章裕，李晃伸，南角吉彦，徳田恵一， ``統計的音声対話システムにおける登録キーワードの近傍単語を優先した仮説生成に基づく応答選択,'' 日本音響学会春季研究発表会, pp.221-224, Mar. 2014.

神沼充伸，南角吉彦， ``運転信号を用いたドライバ行動および個人特性の自動推定,'' 自動車技術会秋季大会, No.128-13, p.1-7, Oct. 2013.

中村和寛，大浦圭一郎，南角吉彦，徳田恵一， ``HMMに基づく英語歌声合成の検討,'' 日本音響学会秋季研究発表会, pp.299-300, Sep. 2013.

柘植彬史，橋本佳，南角吉彦，徳田恵一， ``ベイズ統計量を用いた対数線形モデルに基づく話者認識,'' 日本音響学会秋季研究発表会, pp.73-74, Sep. 2013.

船谷内泰斗，大浦圭一郎，南角吉彦，李晃伸，徳田恵一， ``ユーザ生成型音声対話コンテンツに向けた有限状態トランスデューサに基づく簡潔な対話記述法の検討,'' 日本音響学会秋季研究発表会, pp.223-224, Sep. 2013.

岡田知大，高木信二，南角吉彦，徳田恵一， ``HMM音声合成におけるF0/有声・無声重みの個別クラスタリングによる合成音声の評価,'' 日本音響学会春季研究発表会, pp.293-294, Mar. 2013.

城田佳菜子, 中村和寛, 大浦圭一郎, 南角吉彦, 徳田恵一, ``HMM歌声合成における歌唱者適応学習の検討,'' 日本音響学会春季研究発表会, pp.339-340, Mar. 2013.

吉村建慶，橋本佳，大浦圭一郎，南角吉彦，徳田恵一，``HMM音声合成のためのバイリンガルデータを用いた因子分析に基づくクロスリンガル話者適応,'' 日本音響学会春季研究発表会, pp.267--268, Mar. 2013.

Viviane de Franca Oliveira, Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``Cross-lingual speaker adaptation for HMM-based speech synthesis using joint-eigenvoices with a space of perceptual characteristics,'' 日本音響学会春季研究発表会, pp.269--270, Mar. 2013.

中村和寛，橋本佳，南角吉彦，徳田恵一，``HMM音声合成におけるメルケプストラム分析を統合した音響モデリングの検討'' , 日本音響学会春季研究発表会, pp.289--290, Mar. 2013.

桑子修一，高木信二，橋本佳，南角吉彦，徳田恵一，``HMM音声合成における因子分析を用いた発話適応学習の検討,'' 日本音響学会春季研究発表会, pp.291--292, Mar. 2013.

喜多村翔斗，中村和寛，橋本佳，大浦圭一郎，南角吉彦，徳田恵一，`` 音高正規化学習を用いたHMM歌声合成における調子外れの補正,'' 日本音響学会春季研究発表会, pp.337--338, Mar. 2013.

服部貴文，橋本佳，南角吉彦，徳田恵一， ``複数のモデル構造を用いた変分ベイズ法に基づく話者認識,'' 日本音学会秋季研究発表会, 1-1-13, pp.39-40, Sep. 2012.

真野翔平，南角吉彦，徳田恵一， ``隠れ条件付確率場を用いた音声認識のためのアニーリングに基づく学習アルゴリズムの検討,'' 日本音学会秋季研究発表会, 2-1-10, pp.79-80, Sep. 2012.

大浦圭一郎，南角吉彦，徳田恵一， ``HMM歌声合成における状態数可変のモデル構造の検討,'' 日本音学会秋季研究発表会, 2-2-2, pp.275-276, Sep. 2012.

高木信二，南角吉彦，徳田恵一， ``HMM音声合成のための加算モデル構造に基づく複数話者同時モデリングの検討,'' 日本音学会秋季研究発表会, 2-2-5, pp.281-282, September 2012.

神沼充伸, 西崎友規子, ブエ・ステファン, 南角吉彦, 李晃伸, ``ドライバの社会性に関するCharacter自動推定,'' Human Interface 2012, 3123S, September, 2012.

高木信二，南角吉彦，徳田恵一， ``コンテキストの部分的な加算構造に基づくHMM音声合成,'' 日本音響学会2012年春季研究発表会, vol.I, 1-11-5, pp.303-304, Mar. 2012.

Viviane de F. Oliveira, Sayaka Shiota, Yoshihiko Nankaku, Keiichi Tokuda, ``Cross-lingual speaker adaptation for HMM-based speech synthesis using speaker interpolation based on perceptual characteristics,'' 日本音響学会2012 年春季研究発表会, vol.I, 3-11-12, pp.405-406, Mar. 2012.

沢田慶，玉森聡，橋本佳，南角吉彦，徳田恵一， ``変分ベイズ法を用いた分離型2次元格子HMMの学習におけるアニーリング制御の適用,'' 情報処理学会第74回全国大会, vol. 2, pp. 409--410, Mar. 2012.

間瀬絢美，大浦圭一郎，南角吉彦，徳田恵一， ``音高正規化学習を用いたHMM 歌声合成の検討,'' 日本音響学会2011年秋季研究発表会, vol.I, 1-8-20, pp.283-284, Aug. 2011.

大野博之，南角吉彦，李晃伸，徳田恵一， ``連続音声認識における仮説の低遅延逐次確定アルゴリズムの評価,'' 日本音響学会2011年秋季研究発表会, vol.I, 1-10-15, pp.45-46, Aug. 2011.

橋本佳，南角吉彦，徳田恵一， ``ベイズ音声合成における事前分布とモデル構造の話者間共有,'' 日本音響学会2011年秋季研究発表会, vol.I, 3-8-8, pp.345-348, Aug. 2011.

塩田さやか，橋本佳，南角吉彦，徳田恵一， ``複数のパラメータ共有構造を考慮したベイズ基準による音響モデリングの検討,'' 日本音響学会2011年春季研究発表会, vol.I, 1-5-8, pp.21-24, March 2011.

澤田俊彦，高木信二，南角吉彦，李晃伸，徳田恵一， ``HMM音声認識における平均・分散パラメータの共有構造に関する検討,'' 日本音響学会2011年春季研究発表会, vol.I, 1-5-9, pp.25-26, March 2011.

笠松幹郎，南角吉彦，李晃伸，徳田恵一， ``オンライン処理を考慮した条件付確率場に基づく音声区間検出の検討,'' 日本音響学会2011年春季研究発表会, vol.I, 1-5-13, pp.35-36, March 2011.

服部貴文，李蕾，南角吉彦，李晃伸，徳田恵一， ``複数のモデル構造を用いたGMMに基づく話者認識,'' 日本音響学会2011年春季研究発表会, vol.I, 2-5-3, pp.49-50, March 2011.

平野隆司，南角吉彦，李晃伸，徳田恵一， ``双方向探索に基づくN-gramを用いたキーワードからの文生成,'' 日本音響学会2011年春季研究発表会, vol.I, 2-P-40(b), pp.211-212, March 2011.

鹿住恭介，南角吉彦，徳田恵一， ``因子分析に基づくHMM音声合成における話者類似性の評価,'' 日本音響学会2011年春季研究発表会, vol.I, 3-7-2, pp.299-302, March 2011.

安達璃沙，間瀬絢美，南角吉彦，徳田恵一， ``HMMに基づく早口音声合成における話速と了解度に関する評価,'' 日本音響学会2011年春季研究発表会, vol.I, 3-7-4, pp.307-308, March 2011.

高木信二, 大浦圭一郎, 南角吉彦, 徳田恵一, ``MM音声合成における平均・分散パラメータ共有に関する検討,'' 日本音響学会2010年秋季研究発表会, vol.I, 2-1-8, pp.241-242, Sep. 2010.

伊藤直晃, 南角吉彦, 李晃伸, 徳田恵一, ``百万超語彙の連続音声認識におけるツリートレリス探索法の分析および評価,'' 日本音響学会2010年秋季研究発表会, vol.I, 1-Q-18, pp.155-156, Sep. 2010.

橋本佳，南角吉彦，徳田恵一， ``学習・合成過程が統合されたベイズ音声合成,'' 日本音響学会2010年秋季研究発表会, vol.I, 2-1-9, pp.243-244, Sep. 2010.

李蕾, 油谷かおり, 南角吉彦, 徳田恵一, ``複数のモデル構造を用いたGMMに基づく声質変換,'' 日本音響学会2010年春季研究発表会, vol.I, 1-7-20, pp.323-324, March 2010.

彭湘琳, 大浦圭一郎, 南角吉彦, 徳田恵一, ``言語依存平均声の差異を考慮したクロスリンガル話者適応,'' 日本音響学会2010年春季研究発表会, vol.I, 1-7-21, pp.325-326, March 2010.

林豊大, 南角吉彦, 李晃伸, 徳田恵一, ``音声認識のためのスペクトル変換を統合した音響モデルに基づく話者適応,'' 日本音響学会2010年春季研究発表会, vol.I, 1-Q-4, pp.155-158, March 2010.

大野博之, 南角吉彦, 李晃伸, 徳田恵一, ``音声認識における発話終了前確定のアルゴリズムの評価および改善,'' 日本音響学会2010年春季研究発表会, vol.I, 2-6-6, pp.67-68, March 2010.

鹿住恭介, 南角吉彦, 徳田恵一, ``多様な声質を表現するための因子分析に基づくHMM 音声合成,'' 日本音響学会2010年春季研究発表会, vol.I, 2-7-2, pp.331-334, March 2010.

高木信二, 南角吉彦, 徳田恵一, ``HMM音声合成のためのコンテキストの加算的構造に基づくスペクトルモデリング,'' 日本音響学会2010年春季研究発表会, vol.I, 2-7-3, pp.335-338, March 2010.

大浦圭一郎, 酒向慎司, 徳田恵一, ``日本語テキスト音声合成システムOpen JTalk,'' 日本音響学会2010年春季研究発表会, vol.I, 2-7-6, pp.343-344, March 2010.

間瀬絢美, 大浦圭一郎, 南角吉彦, 徳田恵一, ``音高シフトによる疑似学習データを用いたHMM歌声合成の高精度化,'' 日本音響学会2010年春季研究発表会, vol.I, 2-7-7, pp.345-346, March 2010.

武藤聡, 大浦圭一郎, 南角吉彦, 徳田恵一, ``HMM歌声合成における話者適応および楽譜情報を用いたモデル学習高速化,'' 日本音響学会2010年春季研究発表会, vol.I, 2-7-8, pp.347-348, March 2010.

吉見孔孝, 南角吉彦, 李晃伸, 徳田恵一, ``音声対話システムのためのタスク非依存言語モデルを用いたキーワードからの質問文生成,'' 日本音響学会2010年春季研究発表会, vol.I, 3-6-17, pp.139-140, March 2010.

加藤杏樹，南角吉彦，李晃伸，徳田恵一， ``音声対話システムのための複数キーワードを制約とするスポッティングアルゴリズム,'' 日本音響学会2010年春季研究発表会, vol.I, 3-6-18, pp.141-142, March 2010.

塩田さやか，橋本佳，南角吉彦，徳田恵一， ``Training Algorithm Based on Deterministic Annealing for Bayesian Speech Recognition,'' 日本音響学会2009年秋期研究発表会, vol.I, 1-1-2, pp.3-6, September 2009.

林豊大，南角吉彦，李晃伸，徳田恵一， ``音声認識のための非線形スペクトル変換に基づく話者適応,'' 日本音響学会2009年秋期研究発表会, vol.I, 1-1-6, pp.19-20, September 2009.

斎藤彰，南角吉彦，李晃伸，徳田恵一， ``複数の特徴量を用いた条件付確率場に基づく音声区間検出,'' 日本音響学会2009年秋期研究発表会, vol.I, 1-1-15, pp.47-48, September 2009.

橋本佳，南角吉彦，徳田恵一， ``ベイズ基準によるHSMM音声合成の評価,'' 日本音響学会2009年秋期研究発表会, vol.I, 1-2-11, pp.257-258, September 2009.

吉見孔孝，南角吉彦，李晃伸，徳田恵一， ``音声対話システムのためのN-gramに基づくキーワードを制約とする文生成手法の検討,'' 日本音響学会2009年秋期研究発表会, vol.I, 1-R-29, pp.209-210, September 2009.

福田敏則，吉見孔孝，南角吉彦，李晃伸，徳田恵一， ``ユーザ生成型音声対話コンテンツに基づく音声情報案内システムの構築,'' 日本音響学会2009年秋期研究発表会, vol.I, 1-R-30, pp.211-212, September 2009.

岩島匡秋，南角吉彦，李晃伸，徳田恵一， ``バイモーダル音声認識における特徴量重みの動的決定法に関する検討,'' 日本音響学会2009年秋期研究発表会, vol.I, 2-1-12, pp.81-82, September 2009.

山田知彦，武藤聡，南角吉彦，酒向慎司，徳田恵一， ``HMM歌声合成システムのためのビブラートモデルの導入,'' 日本音響学会2009年秋期研究発表会, vol.I, 2-2-11, pp.309-312, September 2009.

橋本佳, 南角吉彦, 徳田恵一, ``ベイズ基準による隠れセミマルコフモデルに基づく音声合成,'' 日本音響学会2009年春季研究発表会, vol.I, 1-6-7, pp.303-304, March 2009.

永尾京平, 全炳河, 南角吉彦, 徳田恵一, ``HMM 音声合成における発話内変動のモデル化手法に関する検討,'' 日本音響学会2009年春季研究発表会, vol.I, 1-R-19, pp.427-428, March 2009.

小島弘, 南角吉彦, 李晃伸, 徳田恵一, ``木構造化辞書の単語間非共有部のスコアを用いた認識結果の予測,'' 日本音響学会2009年春季研究発表会, vol.I, 3-Q-9, pp.225-256, March 2009.

橋本佳，全炳河，南角吉彦，徳田恵一, ``クロスバリデーションを用いたベイズ基準によるHMM音声合成,'' 日本音響学会2008年秋季研究発表会, vol.I, 1-4-7, pp.251-252, September 2008.

塩田さやか，橋本佳，南角吉彦，李晃伸，徳田恵一, ``複数の音素決定木構造を用いた音声認識の検討,'' 日本音響学会2008年秋季研究発表会, vol.I, 2-p-7, pp.125-126, September 2008.

油谷かおり，南角吉彦，戸田智基，徳田恵一, ``声質変換における時系列マッチングを含む統計モデルの拡張,'' 日本音響学会2008 年秋季研究発表会, vol.I, 2-p-24 , pp.411-412, September 2008.

大浦圭一郎，全炳河，南角吉彦，李晃伸，徳田恵一, ``HMM音声合成における分散パラメータの共有に関する検討,'' 日本音響学会 2008年秋季研究発表会, vol.I, 2-p-29, pp.421-422, September 2008.

小島弘，南角吉彦，李晃伸，徳田恵一, ``音声認識のビーム探索における複数枝刈り基準の統合に関する検討,'' 日本音響学会2008 年秋季研究発表会, vol.I, 3-q-27, pp.211-212, September 2008.

丸目雅浩, 南角吉彦, 酒向慎司, 徳田恵一, 北村正, ``変分ベイズ法に基づいた声質変換,'' 日本音響学会2008年春季研究発表会, vol.I, 2-11-7, pp.349-352, March 2008.

袴田智博，南角吉彦，李晃伸，徳田恵一, ``仮説の遅延確定による１パス信頼度計算の評価と複数デコーダ間枝刈りへの応用,'' 日本音響学会2008年春季研究発表会, vol.I, 1-Q-25, pp.217-218, March 2008.

宇藤陽介, 南角吉彦, 李晃伸, 徳田恵一, ``声質変換のためのスペクトルおよびF0の同時モデリング,'' 日本音響学会2008年春季研究発表会, vol.I, 2-11-8, pp.353-356, March 2008.

橋本佳, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``クロスバリデーションを用いたベイズ基準によるコンテキストクラスタリング,'' 日本音響学会2008年春季研究発表会, vol.I, 2-10-2, pp.69-70, March 2008.

伊藤達也, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``変分ベイズ法に基づく話者認識,'' 日本音響学会2008年春季研究発表会, vol.I, 3-11-3, pp.143-144, March 2008.

油谷かおり, 宇藤陽介, 南角吉彦, 戸田智基, 李晃伸, 徳田恵一, ``時系列マッチングを含む統計モデルに基づいた継続長およびスペクトルの同時変換,'' 日本音響学会2008年春季研究発表会, vol.I, 2-11-6, pp.347-348, March 2008.

吉見孔孝, 南角吉彦, 李晃伸, 徳田恵一, ``音声対話システムにおける条件付確率場に基づく自動応答文選択,'' 日本音響学会2008 年春季研究発表会, vol.I, 1-2-10-12, pp.95-96, March 2008.

大浦圭一郎, 戸田智基, 南角吉彦, 徳田恵一, マイアハニエリ, 坂井信輔, 中村哲, ``英語音声合成における韻律推定モデルと音響モデルの同時学習,'' 日本音響学会2008年春季研究発表会, vol.I, 2-11-1, pp.335-336, March 2008.

袴田智博, 南角吉彦, 李晃伸, 徳田恵一, ``仮説の遅延確定による１パス信頼度計算の高精度化,'' 日本音響学会2007年秋季研究発表会, vol.I, 2-8-9, pp.127-130, Sep. 2007.

橋本佳, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``変分ベイズ法に基づく音声認識のためのハイパーパラメータの共有構造,'' 日本音響学会2007年秋季研究発表会, vol.I, 3-3-4, pp.139-142, Sep. 2007.

才野慶二郎, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``因子分析に基づく固有声モデルを用いたHMM音声合成,'' 日本音響学会2007 年秋季研究発表会, vol.I, 3-4-8, pp.365-366, Sep. 2007.

塩田さやか, 橋本佳, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``音素決定木構造のアニーリングに基づく音声認識のためのモデル推定,'' 日本音響学会2007年秋季研究発表会, vol.I, 3-3-5, pp.143-146, Sep. 2007.

垣鍔亮太, 南角吉彦, 李晃伸, 徳田恵一, ``発話文の自動クラスタリングを用いた音声対話システムの評価,'' 日本音響学会2007年秋季研究発表会, vol.I, 3-Q-13, pp.237-240, Sep. 2007.

辻洋祐, 南角吉彦, 李晃伸, 徳田恵一, ``アレイ入力と接話マイク入力のデュアルデコーディングに基づくキャンパス音声情報案内端末の構築,'' 日本音響学会2007年秋季研究発表会, vol.I, 3-Q-2, pp.235-236, Sep. 2007.

大浦圭一郎, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``MEL-LSPを用いたHMM音声合成におけるポストフィルタリングの検討,'' 日本音響学会2007年秋季研究発表会, vol.I, 3-4-9, pp.367-368, Sep. 2007.

全炳河, 南角吉彦, 徳田恵一, ``モデル空間最尤線形回帰に基づくトラジェクトリHMMの話者適応,'' 日本音響学会2007年秋季研究発表会, vol.I, 2-3-15, pp.91-92, Sep. 2007.

Yi-Jian Wu, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, ``Evaluation of parameter optimization methods for minimum generation error based HMM training,'' 日本音響学会2007年秋季研究発表会, vol.I, 3-4-10, pp.370-371, Sep. 2007.

Ranniery Maia, Tomoki Toda, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, ``Mixed excitation for HMM-based speech synthesis based on state-dependent filtering,'' 日本音響学会 2007年春季研究発表会, vol.I, 1-8-4, pp.199-200, March 2007.

渡邉俊明, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``HMM音声合成のためのフィルタの高速化,'' 日本音響学会2007年春季研究発表会, vol.I, 1-8-9, pp.209-210, March 2007.

中村和寛, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ''HMM音声認識におけるコンテキストの加算的構造を考慮した音響モデリング,'' 日本音響学会2007年春季研究発表会, vol.I, 1-P-13, pp.149-150, March 2007.

中村憲一, 南角吉彦, 戸田智基, 徳田恵一, ``時系列マッチングを含む統計モデルに基づく声質変換,'' 日本音響学会2007年春季研究発表会, vol.I, 1-8-11, pp.213-214, March 2007.

丸目雅浩, 全炳河, 南角吉彦, 徳田恵一, 北村正, ``HMM音声合成における特徴パラメータに関する検討,'' 日本音響学会2006年秋季研究発表会講演論文集, vol.I, 2-6-1, pp.185-186, Sep. 2006.

檜垣幸司, 南角吉彦, 徳田恵一, ``可変固有顔による顔画像認識,'' 第5回情報科学技術フォーラム講演論文集 (FIT2006), I-010, pp.21-22, Sep. 2006.

豊倉行崇, 南角吉彦, 後藤富朗, 徳田恵一, 北村正, ``基本動作HMMに基づく手話単語認識手法,'' 電子情報通信学会2006ソサイエティ大会講演論文集, A-4-5, Sep. 19-22, 2006.

宇藤陽介, 南角吉彦, 戸田智基, 李晃伸, 徳田恵一, ``MFAに基づく声質変換,'' 日本音響学会2006年春季研究発表会講演論文集, vol.I, 1-4-14, pp.239-240, Mar. 2006.

糸川喜裕, 全炳河, 南角吉彦, 李晃伸, 徳田恵一, ``英語音声におけるHMMに基づいた100bit/s音声符号化システム,'' 日本音響学会2006年春季研究発表会講演論文集, vol.I, 1-Q-32, pp.397-398, Mar. 2006.

大浦圭一郎, 南角吉彦, 李晃伸, 徳田恵一, ``WFSTを用いたHSMM音声認識,'' 2005年音響学会秋期大会， pp.87--88, Sep. 2005.

全炳河, 南角吉彦, 徳田恵一, 北村正, ``トラジェクトリHMMのためのギブスサンプリングによるEM型学習アルゴリズム,'' 2005年音響学会秋期大会， pp.89--90, Sep. 2005.

中村憲一, 戸田智基, 南角吉彦, 徳田恵一, ``声道形状からスペクトルへの変換における音素情報利用に関する検討,'' 2005年音響学会秋期大会， pp.353--354, Sep. 2005.

中邨一仁, 南角吉彦, 徳田恵一, 北村正, ``HMM音声合成における動的特徴量抽出法に関する検討,'' 2005年音響学会秋期大会， pp.359--360, Sep. 2005.

粉川久, 南角吉彦, 徳田恵一, 北村正, ``モーラ単位H/L型アクセントラベルに基づくHMM音声合成,'' 2005年音響学会秋期大会， pp.365--366, Sep. 2005.

全炳河, 南角吉彦, 徳田恵一, 北村正, ``トラジェクトリHMM の制約付き最尤線形回帰による話者適応,'' 2005年音響学会秋期大会， pp.113--114, Sep. 2005.

倉田大介, 南角吉彦, 徳田恵一, 北村正, ``分離型2次元格子HMMを用いた顔画像認識のための状態クラスタリング,'' 情報科学技術フォーラム(FIT), pp.23--24, Sep. 2005.

布目哲也, 南角吉彦, 徳田恵一, 北村正, ``分離型2次元格子HMMに基づく顔画像認識,'' 情報科学技術フォーラム(FIT), pp.25--26, Sep. 2005.

森健史, 南角吉彦, 宮島千代美, 徳田恵一, 北村正, ``隠れマルコフモデルに基づく指文字動画像生成,'' 情報科学技術フォーラム(FIT), pp.569--570, Sep. 2005.

山本貢嗣, 野村健, 南角吉彦, 後藤富朗, 北村正, ``HMMに基づく日本手話認識のための特徴の統合に関する検討,'' 電子情報通信学会総合大会, A-4-28, Sep. 2005.

片岡俊介, 全柄河, 南角吉彦, 徳田恵一, 北村正, ``スペクトル、F0、継続長決定木の同時バックオフに基づくHSMM音声合成,'' 日本音響学会2004年春季研究発表会講演論文集, vol.I, 1-1-20, pp. 193--194, Mar. 2005.

山本貢嗣, 野村健, 南角吉彦, 後藤富朗, 北村正, ``日本手話認識に用いる特徴量の検討,'' 電子情報通信学会総合大会, D-12-121, Mar. 2005.

山本啓善, 南角吉彦, 宮島千代美, 徳田恵一, 北村正, ``混合因子分析に基づく話者モデルの構造に関する検討,'' 日本音響学会2004年秋季研究発表会講演論文集, vol.I, 2-4-5, pp.95--96, Sep. 2004.

布目哲也, 南角吉彦, 徳田恵一, 北村正, ``分離型2次元格子HMMに基づく音声認識の検討,'' 日本音響学会2004年秋季研究発表会講演論文集, vol.I, 2-1-18, pp.71--72, Sep. 2004.

Amaro Lima, Heiga Zen, Yoshihiko Nankaku, Keiichi Tokuda, and Tadashi Kitamura, Fernando Gil Resende, ``Feature extraction for speech recognition using Sparse KPCA,'' 日本音響学会2004年秋季研究発表会講演論文集, vol.I, 2-1-18, pp.69--70, Sep. 2004.

森岡祐介, 片岡俊介, 全柄河, 南角吉彦, 徳田恵一, 北村正, ``HMM音声合成器の小型化に関する検討,'' 日本音響学会2004年秋季研究発表会講演論文集, vol.I, 3-2-5, pp. 325--326, Sep. 2004.

山本啓善，南角吉彦，宮島千代美，徳田恵一，北村正, ``混合因子分析に基づく話者識別モデルのパラメータ共有構造の検討,'' 日本音響学会2003年秋季研究発表会, vol.I, 2-6-21, pp.101--102, Sep. 2003.

杉浦真利, 全炳河, 南角吉彦, 徳田恵一, 北村正, ``相互情報量最大化基準に基づくコンテキストクラスタリング,'' 日本音響学会2003年秋季研究発表会, vol.I, 2-6-5, pp.69--70, Sep. 2003.

板谷洋平, 全炳河, 南角吉彦, 宮島千代美, 徳田恵一, 北村正, ``DAEMアルゴリズムに基づくHMMを用いた連続音声認識,'' 日本音響学会2003年秋季研究発表会, vol.I, 2-6-4, pp.67--68, Sep. 2003.

鈴木浩之, 全炳河, 南角吉彦, 宮島千代美, 徳田恵一, 北村正, ``雑音をコンテキストとした音響モデルによる音声認識,'' 日本音響学会2003年秋季研究発表会, vol.I, 1-6-13, pp.25--p26, Sep. 2003.

山本啓善，南角吉彦，宮島千代美，徳田恵一，北村正, ``混合因子分析に基づく話者識別モデルの最小分類誤り学習,'' 日本音響学会2003年秋季研究発表会, vol.I, 3-3-4, pp.111--112, Mar. 2003.

石川剛，全炳河，南角吉彦，宮島千代美，徳田恵一，北村正, ``音響尤度のリスコアリングによる結果統合を用いたバイモーダル連続音声認識,'' 日本音響学会2003年秋季研究発表会, vol.I, 3-Q-21, pp.193--194, Mar. 2003.

南角吉彦, 徳田恵一, 北村正, 益子貴史, ``変分ベイズHMMに基づく音声合成,'' 2003年音響学会秋期研究発表会, vol.I, 1-8-13, pp.207--208, Sep. 2003.

Amaro A. de Lima, Heiga Zen, Yoshihiko Nankaku, Chiyomi Miyajima, Keiichi Tokuda, and Tadashi Kitamura, ``On the use of KPCA for feature extraction in speech recognition,'' 日本音響学会2002年秋季研究発表会, vol.I, 1-9-4, pp.7--8, Sep, 2002.

鈴木浩之, 全炳河, 南角吉彦, 宮島千代美, 徳田恵一, 北村正, ``声質を考慮した音響モデルによる音声認識,'' 日本音響学会2002年秋季研究発表会講演論文集, vol.I, 1-9-19, pp.37--38, Sep. 2002.

石川剛，澤田裕子，全炳河，南角吉彦，宮島千代美，徳田恵一，北村正, ``初期統合によるバイモーダル大語彙連続音声認識,'' 情報科学技術フォーラム(FIT), pp.203--204, Sep. 2002.

山本真理, 柴田沙矢香, 南角吉彦, 宮島千代美，徳田恵一, 北村正, ``音声と顔画像を用いた個人認識,'' 情報科学技術フォーラム(FIT), pp.119--120, Sep. 2002.

奥田浩三, 南角吉彦, 中村哲, ``音響特徴パラメータの相関を利用した音素継続時間長の正規化,'' 日本音響学会2002年春季研究発表会, Vol.I, 1-5-10, pp.19--20, Mar. 2002.

南角吉彦, 徳田恵一, 北村正, ``自動リップリーディングのための輝度値，幾何学変換に基づく正規化学習,'' 2001年音響学会秋期大会， vol.I, pp.21--22, Oct. 2001.

南角吉彦, 徳田恵一, 北村正, 小林隆夫, ``視覚音声認識のためのコントラストの正規化,'' 2000年電子情報通信学会秋期大会, D-12-31, p.218, Sep. 2000.

南角吉彦, 徳田恵一, 北村正, 小林隆夫, ``視覚音声認識のための輝度および位置の正規化学習,'' 1999年電子情報通信学会春期大会, D-12-101, p.274, Mar. 1999.

招待講演・サーベイ・解説論文

南角吉彦, ''統計的機械学習問題としての音声研究,'' 信学技報, vol. 114, no. 151, SP2014-67, pp. 25-30, Jul. 2014.

Keiichi Tokuda, Yoshihiko Nankaku, Tomoki Toda, Heiga Zen, Junichi, Yamagishi, and Keiichiro Oura, ``Speech Synthesis Based on Hidden Markov Models,'' Proceedings of the IEEE, vol. 101, no. 5, pp. 1234-1252, May 2013.

全炳河，南角吉彦，戸田智基， ICSLP における研究動向 −音響モデル・音声合成を中心に−，信学技報, SP2006-115, pp. 1-6, 2006年12月.

トーク

``A Bayesian approach to speech synthesis and a short introduction of recent works,'' The Chinese Academy of Sciences (CAS), Beijing, 27 Oct. 2008.

``A Bayesian approach to speech synthesis and a short introduction of recent works,'' Microsoft Research Asia (MSRA), Beijing, 30 Oct. 2008.

``複数の特徴量を用いた条件付確率場に基づく音声区間検出と最近の研究内容の紹介,'' NTT コミュニケーション科学基礎研究所, 28 Jan. 2010.

著書　

　Keiichi Tokuda, Akinobu Lee, Yoshihiko Nankaku, Keiichiro Oura, Kei Hashimoto, Daisuke Yamamoto, Ichi Takumi, Takahiro Uchiya, Shuhei Tsutsumi, Steve Renals, and Junichi Yamagishi（分担執筆）, ``User generated dialogue systems: uDialogue,'' Human Harmonized Information Technology, Volume 2, Springer, pp. 77-114, May, 2017. (ISBN：978-4-431-56533-8) (DOI: 10.1007/978-4-431-56535-2)

チュートリアル講演

南角吉彦, ``Matlab実習：音声スペクトル解析,'' 平成20年度電気関係学会東海支部連合大会, 愛知県立大学, 18 September 2008.

テクニカルレポート

南角吉彦, ``講演音声のための Missing Feature Theory を用いた音素継続長の正規化,'' ATR Technical Report.