発表論文 - 2020
論文誌
- Shuhei Kato, Yusuke Yasuda, Xin Wang, Erica Cooper, Shinji Takaki, and Junichi Yamagishi, ``Semi-supervised learning based on hierarchical generative models for end-to-end speech synthesis,'' IEEE Access, vol. 8, pp. 138149-1381612020, 27 July 2020. (Full paper peer reviewed)
link
国際会議
- Yukiya Hono, Kazuna Tsuboi, Kei Sawada, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``Hierarchical Multi-Grained Generative Model for Expressive Speech Synthesis,'' Interspeech 2020, pp. 3441–3445, Shanghai, China, October, 2020. (Full paper peer reviewed)
link (arXiv)
- Takato Fujimoto, Shinji Takaki, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``Semi-supervised learning based on hierarchical generative models for end-to-end speech synthesis,'' 2020 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), pp. 7644-7648, Barcelona, Spain, May, 2020. (Full paper peer reviewed)
(pdfのページ番号がずれてる)
- Kazuhiro Nakamura, Shinji Takaki, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``Fast and high-quality singing voice synthesis system based on convolutional neural networks,'' 2020 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), pp. 7239-7243, Barcelona, Spain, May, 2020. (Full paper peer reviewed)
(pdfのページ番号がずれてる)
全国大会
- 法野行哉, 坪井一菜, 沢田慶, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一,
``階層化多重粒度生成モデルを用いた表現豊かな音声合成,'' 日本音響学会2020年秋季研究発表会, pp. 791-794, 日本, 2020年9月.
(オンライン開催)
- 藤本崇人, 高木信二, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一,
``感情音声合成のためのDirichlet VAE,'' 日本音響学会2020年秋季研究発表会, pp. 789-790, 日本, 2020年9月.
(オンライン開催)
- 法野行哉, 高木信二, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一,
``DNNに基づく音声ボコーダにおける周期・非周期成分のモデル化の検討,'' 日本音響学会2020年秋季研究発表会, pp. 759-760, 日本, 2020年9月.
(オンライン開催)
- 大谷眞史, 佐藤優介, 高木信二, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一,
``音声合成における敵対的生成ネットワークを用いた複数言語・複数話者モデリング,'' 日本音響学会2020年秋季研究発表会, pp. 695-696, 日本, 2020年9月.
(オンライン開催)
- 三井健太郎, 法野行哉, 坪井一菜, 沢田慶,
``カスケード構造を用いた音声パラメータ予測に基づく統計的パラメトリック音声合成,''
日本音響学会2020年春季研究発表会, pp. 1107-1108, 埼玉, 日本, 2020年3月.
(中止)
- 藤本崇人, 高木信二, 橋本佳, 大浦圭一郎, 南角吉彦, 徳田恵一,
``End-to-End音声合成のための階層化生成モデルに基づく半教師あり学習,''
日本音響学会2020年春季研究発表会, pp. 1039-1042, 埼玉, 日本, 2020年3月.
(中止)
ワークショップ
- 平光啓祐,橋本佳,徳田恵一,南角吉彦,
``深層学習に基づく音声合成における顔画像を用いた話者適応,''
第18回情報学ワークショップ, 日本, 2020年11月.
- 車田智哉,木下耕介,吉村建慶,橋本佳,南角吉彦,徳田恵一,
``生成モデルの構造を組み込んだ系列変分オートエンコーダに基づく話者認識,''
第18回情報学ワークショップ, 日本, 2020年11月.
- 西村愛理,藤本崇人,橋本佳,大浦圭一郎,南角吉彦,徳田恵一,
``出力遅延を考慮したアテンション機構に基づくリアルタイム声質変換,''
第18回情報学ワークショップ, 日本, 2020年11月.
- 久野宏彰,高木信二,橋本佳,大浦圭一郎,南角吉彦,徳田恵一,
``音声合成における特徴的な発話スタイルの転移学習,''
第18回情報学ワークショップ, 日本, 2020年11月.
- 成田哲郎,吉村建慶,橋本佳,南角吉彦,徳田恵一,
``ニューラルボコーダを用いた音声符号化手法の検討,''
第18回情報学ワークショップ, 日本, 2020年11月.
- 大谷眞史,佐藤優介,高木信二,橋本佳,大浦圭一郎,南角吉彦,徳田恵一,
``音声合成における敵対的生成ネットワークを用いた複数言語・複数話者モデリングの検討,''
第18回情報学ワークショップ, 日本, 2020年11月.
- 佐々木一匡,吉村建慶,橋本佳,大浦圭一郎,南角吉彦,徳田恵一,
``大規模音楽データを活用した汎用WaveNetボコーダ構成法の検討,''
第18回情報学ワークショップ, 日本, 2020年11月.
- 厚地俊哉,橋本佳,大浦圭一郎,南角吉彦,徳田恵一,
``音声プライバシー保護のためのノンパラレル声質変換による話者匿名化の検討,''
第18回情報学ワークショップ, 日本, 2020年11月.
- 岩田康平,高木信二,橋本佳,南角吉彦,徳田恵一,
``勾配ブースティング決定木を用いた高速な音声合成手法の検討,''
第18回情報学ワークショップ, 日本, 2020年11月.
- 前川遼太朗,高木信二,橋本佳,大浦圭一郎,南角吉彦, 徳田恵一,
``深層学習に基づく楽器音合成における音響モデルの比較検討,''
第18回情報学ワークショップ, 日本, 2020年11月.
- 木村俊介,橋本佳,南角吉彦,徳田恵一,
``幾何学的変動に頑健な画像認識のための深層学習モデルの検討,''
第18回情報学ワークショップ, 日本, 2020年11月.
- 小林睦,橋本佳,南角吉彦,徳田恵一,
``統計モデルに基づくドライバ認知負荷推定の検討,''
第18回情報学ワークショップ, 日本, 2020年11月.
学位論文
- 李宗承,
``Dirichlet分布を用いたVariational Auto-Encoderによる感情音声合成,''
卒業論文, 名古屋工業大学, 2020年2月.
- 田口義明,
``隠れセミマルコフモデルを用いたニューラルネットワークに基づく感情音声合成,''
卒業論文, 名古屋工業大学, 2020年2月.
- 厚地俊哉,
``音素事後確率に基づくノンパラレル声質変換による話者匿名化,''
卒業論文, 名古屋工業大学, 2020年2月.
- 佐々木一匡,
``多様な発話スタイルを表現可能な音声合成のための継続長と音響特徴量の同時モデル化手法,''
卒業論文, 名古屋工業大学, 2020年2月.
- 久野宏彰,
``音響特徴量の時系列構造を考慮した敵対的生成ネットワークに基づく感情音声合成,''
卒業論文, 名古屋工業大学, 2020年2月.
- 前川遼太朗,
``WaveNetに基づく楽器音合成における音高再現性能の改善,''
卒業論文, 名古屋工業大学, 2020年2月.
- 車田智哉,
``Sequential Variational Autoencoderに基づく話者認識の性能改善に関する検討,''
卒業論文, 名古屋工業大学, 2020年2月.
- 平光啓祐,
``深層学習に基づく音声合成における顔画像を用いた話者適応,''
卒業論文, 名古屋工業大学, 2020年2月.
- 小林睦,
``統計モデルに基づく ドライバ認知負荷推定のための 教師ラベル作成手法,''
卒業論文, 名古屋工業大学, 2020年2月.
- 西村愛理,
``出力遅延を考慮したアテンション機構に基づくリアルタイム声質変換,''
卒業論文, 名古屋工業大学, 2020年2月.
- 岩田康平,
``畳み込みニューラルネットワークに基づく音声合成における決定木構造を用いた計算量削減手法,''
卒業論文, 名古屋工業大学, 2020年2月.
- 成田哲郎,
``音声合成におけるニューラルボコーダの性能の比較,''卒業論文, 名古屋工業大学, 2020年2月.
- 大谷眞史,
``音声合成における敵対的生成ネットワークを用いたクロスリンガル話者適応,''卒業論文, 名古屋工業大学, 2020年2月.
- 木村俊介,
``位置エンコーディングを用いた系列変分オートエンコーダに基づく画像認識,''
卒業論文, 名古屋工業大学, 2020年2月.
- 中尾健人,
``隠れセミマルコフモデルの構造を導入したニューラルネットワークに基づく音声合成における話者適応,''
修士論文, 名古屋工業大学, 2020年2月.
- 千田航己,
``音素認識と標準基本周波数推定に基づくノンパラレル声質変換,''
修士論文, 名古屋工業大学, 2020年2月.
- 小嶋康雅,
``デコーディング時の仮説探索プロセスを考慮した学習に基づくEnd-to-End音声認識,''
修士論文, 名古屋工業大学, 2020年2月.
- 春日井貴之,
``分離型格子HMMとニューラルネットワークの統合に基づく幾何学的変動に頑健な画像認識,''
修士論文, 名古屋工業大学, 2020年2月.
- 村田舜馬,
``楽譜時間情報を用いたアテンション機構に基づく歌声合成,''
修士論文, 名古屋工業大学, 2020年2月.
- 藤本崇人,
``階層化生成モデルに基づいた半教師あり学習によるEnd-to-End音声合成,''
修士論文, 名古屋工業大学, 2020年2月.
- 次井貴浩,
``公共空間におけるスピーチプライバシー保護のための音声合成を利用したサウンドマスキング,''
修士論文, 名古屋工業大学, 2020年2月.
- 島田基樹,
``低リソースデバイスのための隠れセミマルコフモデルの構造を用いたニューラルネットワークに基づく音声合成,''
修士論文, 名古屋工業大学, 2020年2月.
- 加藤 大輝,
``視覚障害者のための早口人工音声における聞き取りやすさの調査,''
卒業論文, 名古屋工業大学, 2020年2月.
プレプリント
- Yukiya Hono, Kazuna Tsuboi, Kei Sawada, Kei Hashimoto, Keiichiro Oura, Yoshihiko Nankaku, and Keiichi Tokuda, ``Hierarchical Multi-Grained Generative Model for Expressive Speech Synthesis,'' arXiv preprint arXiv:2009.08474, September, 2020.
link
その他
- 大浦圭一郎,
``音声合成技術の研究とその社会実装,''
情報処理, vol. 61, no. 8, p. 882, 2020年7月.
過去の発表論文