発表論文 - 2019
論文誌
- Xin Wang, Shinji Takaki, and Junichi Yamagishi, ``Neural source-filter waveform models for statistical parametric speech synthesis,'' IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 28, pp. 402-415, November 2019. (Full paper peer reviewed)
link
- Xin Wang, Shinji Takaki, Junichi Yamagishi, Simon King, and Keiichi Tokuda, ``A vector quantized variational autoencoder (VQ-VAE) autoregressive neural F0 model for statistical parametric speech synthesis,'' IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 28, pp. 157-170, October 2019. (Full paper peer reviewed)
link
- 高木信二, ``話声の合成における応用技術 : DNNテキスト音声合成システム,'' 日本音響学会誌, vol. 75, no. 7, pp. 393-399, 2019年7月. (解説論文)
link
国際会議
- Motoki Shimada, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``Low computational cost speech synthesis based on deep neural networks using hidden semi-Markov model structures,'' 10th ISCA Speech Synthesis Workshop (SSW10), pp. 177-182, Vienne, Austria, September, 2019. (Full paper peer reviewed)
- Takato Fujimoto, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``Impacts of input linguistic feature representation on Japanese end-to-end speech synthesis,'' 10th ISCA Speech Synthesis Workshop (SSW10), pp. 166-171, Vienne, Austria, September, 2019. (Full paper peer reviewed)
- Shuhei Kato, Yusuke Yasuda, Xin Wang, Erica Cooper, Shinji Takaki, and Junichi Yamagishi, ``Rakugo speech synthesis using segment-to-segment neural transduction and style tokens — toward speech synthesis for entertaining audiences,'' 10th ISCA Speech Synthesis Workshop (SSW10), pp. 111-116, Vienne, Austria, September, 2019. (Full paper peer reviewed)
- Keiichiro Oura, Kazuhiro Nakamura, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``Deep neural network based real-time speech vocoder with periodic and aperiodic inputs,'' 10th ISCA Speech Synthesis Workshop (SSW10), pp. 13-18, Vienne, Austria, September, 2019. (Full paper peer reviewed)
- Takenori Yoshimura, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``Speaker-dependent WaveNet-based delay-free ADPCM speech coding,'' 2019 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), pp. 7145-7149, Brighton, UK, May, 2019. (Full paper peer reviewed)
- Yukiya Hono, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``Singing voice synthesis based on generative adversarial networks,'' 2019 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), pp. 6955-6959, Brighton, UK, May, 2019. (Full paper peer reviewed)
研究会
- 和田蒼汰, 法野行哉, 高木信二, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一,
``歌声合成におけるニューラルボコーダの比較検討,'' 音声研究会, vol. 119, no. 321, SP2019-42, pp. 85-90, 東京, 日本, 2019年12月.
- 次井貴浩, 高木信二, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一,
``公共空間におけるスピーチプライバシー保護を目的とした合成音声によるサウンドマスキングの検討,'' 音声研究会, vol. 119, no. 321, SP2019-38, pp. 55-60, 東京, 日本, 2019年12月.
- 大浦圭一郎, 中村和寛, 橋本佳, 南角吉彦, 徳田恵一,
``周期・非周期信号を用いたDNNに基づくリアルタイム音声ボコーダ,'' 情報処理学会研究報告, vol. 2019-SLP-127, no.34, 京都, 日本, 2019年6月.
全国大会
- 大浦圭一郎, 高木信二, 中村和寛, 橋本佳, 南角吉彦, 徳田恵一,
``周期・非周期信号を用いた敵対的生成ネットワークに基づくリアルタイム音声ボコーダ,'' 日本音響学会2019年秋季研究発表会, pp. 997-998, 滋賀, 日本, 2019年9月.
- 中村和寛, 高木信二, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一,
``CNNに基づく歌声合成における計算量削減の検討,'' 日本音響学会2019年秋季研究発表会, pp. 939-940, 滋賀, 日本, 2019年9月.
- 加藤集平, 安田裕介, Xin Wang, Erica Cooper, 高木信二, 山岸順一,
``落語音声合成モデルの頑健な学習方法と発話様式の変動への対処,'' 日本音響学会2019年秋季研究発表会, pp. 957-960, 滋賀, 日本, 2019年9月.
- 村田舜馬, 藤本崇人, 法野行哉, 高木信二, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一,
``楽譜時間情報を用いたアテンション機構に基づく歌声合成の検討,'' 日本音響学会2019年秋季研究発表会, pp. 943-944, 滋賀, 日本, 2019年9月.
- 島田基樹, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一,
``隠れセミマルコフモデルの構造を用いたDNNに基づく音声合成における計算量削減手法の検討,'' 日本音響学会2019年春季研究発表会, pp. 1071-1072, 東京, 日本, 2019年3月.
- 藤本崇人, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一,
``日本語End-to-End音声合成における入力言語特徴量の影響,'' 日本音響学会2019年春季研究発表会, pp. 1061-1062, 東京, 日本, 2019年3月.
- 大浦圭一郎, 中村和寛, 橋本佳, 南角吉彦, 徳田恵一,
``周期・非周期信号から駆動するディープニューラルネットワークに基づく音声ボコーダ ,'' 日本音響学会2019年春季研究発表会, pp. 1049-1052, 東京, 日本, 2019年3月.(粟屋潔学術奨励賞)
- 沢田慶, 坪井一菜, Xianchao Wu, Zhan Chen, 法野行哉, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一,
``AI歌手りんな:ユーザ歌唱や楽譜を入力とする歌声合成システム,'' 日本音響学会2019年春季研究発表会, pp. 1041-1044, 東京, 日本, 2019年3月.
- 法野行哉, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一,
``敵対的生成ネットワークを用いた歌声合成の検討,'' 日本音響学会2019年春季研究発表会, pp. 1039-1040, 東京, 日本, 2019年3月.
- 中村和寛, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一,
``歌声合成における CNN に基づく音声パラメータ生成手法の検討,'' 日本音響学会2019年春季研究発表会, pp. 1033-1034, 東京, 日本, 2019年3月.
- 角谷健太, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一,
``DNNに基づく感情音声合成のための敵対的学習の検討,'' 日本音響学会2019年春季研究発表会, pp. 1359-1360, 東京, 日本, 2019年3月.
学位論文
- 牛田光一,
``効率的な情報伝達のための音声合成システム構築法の検討,''
卒業論文, 名古屋工業大学, 2019年2月.
- 木下耕介,
``統計的生成モデルの構造を組み込んだニューラルネットワークに基づく画像認識,''
卒業論文, 名古屋工業大学, 2019年2月.
- 小林樹,
``プライバシー保護を目的とした音声変換に基づく選択的情報マスキング,''
卒業論文, 名古屋工業大学, 2019年2月.
- 清水達也,
``Sequential VAE に基づく話者認識における入力発話長の影響に関する調査,''
卒業論文, 名古屋工業大学, 2019年2月.
- 角谷健太,
``ディープニューラルネットワークに基づく感情音声合成のための敵対的学習手法の検討,''
卒業論文, 名古屋工業大学, 2019年2月.
- 佐藤優介,
``Deep Neural Networkに基づく音声合成におけるクロスリンガル話者適応,''
卒業論文, 名古屋工業大学, 2019年2月.
- 中村洋太,
``深層学習に基づいた楽譜情報を入力とする楽器音合成の検討,''
卒業論文, 名古屋工業大学, 2019年2月.
- 和田蒼汰,
``歌声合成用WaveNetボコーダにおける最適なモデル構造と学習条件の調査,''
卒業論文, 名古屋工業大学, 2019年2月.
- 丹羽純平,
``WaveNetに基づく統計的声質変換,''
修士論文, 名古屋工業大学, 2019年2月.
- 脇口甲太郎,
``統計モデルに基づくドライバ認知負荷のリアルタイム推定,''
修士論文, 名古屋工業大学, 2019年2月.
- 小池なつみ,
``統計的生成モデルの構造を内包したニューラルネットワークに基づく話者認識,''
修士論文, 名古屋工業大学, 2019年2月.
- 市橋史也,
``連続値入出力に対応したWFSTに基づく階層型音声認識デコーダの開発,''
修士論文, 名古屋工業大学, 2019年2月.
- 市川英嗣,
``分離型格子構造を用いたDNN-HMMハイブリッドモデルに基づく幾何学的変動に頑健な画像認識,''
修士論文, 名古屋工業大学, 2019年2月.
- 池浦史芳,
``バス停雑音下における音声路線案内システムに適した合成音声の検討,''
修士論文, 名古屋工業大学, 2019年2月.
- 法野行哉,
``Deep Neural Networkに基づく歌声合成システムの構築,''
修士論文, 名古屋工業大学, 2019年2月.
講演・パネル
- 徳田恵一,
``統計的音声合成の進展と展望 ,'' 音声研究会, vol. 119, no. 321, SP2019-35, pp. 11-12, 東京, 日本, 2019年12月. (招待講演)
- 大浦圭一郎,
``統計的歌声合成技術とその実用化,'' 日本AI音楽学会, 神奈川, 日本, 2019年11月. (招待講演)
- Keiichi Tokuda, ``Statistical approach to speech synthesis: past, present and future,'' Interspeech 2019, Graz, Austria, September, 2019. (Keynote)
- 大浦圭一郎,
``統計的パラメトリック音声合成技術とその実用化,'' 情報処理学会研究報告, vol. 2019-MUS-123, no.11, 京都, 日本, 2019年6月. (招待講演)
過去の発表論文