発表論文 - 2022

国際会議

  1. Kentaro Mitsui, Tianyu Zhao, Kei Sawada, Yukiya Hono, Yoshihiko Nankaku, and Keiichi Tokuda, ``End-to-End Text-to-Speech Based on Latent Representation of Speaking Styles Using Spontaneous Dialogue,'' Interspeech 2022, pp. 2328–2332, Incheon, Korea, September, 2022. (Full paper peer reviewed, On-Site Special Session) link (arXiv)
  2. Takato Fujimoto, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``Autoregressive variational autoencoder with a hidden semi-Markov model-based structured attention for speech synthesis,'' 2022 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), pp. 7462-7466, Singapore, Singapore, May, 2022. (Full paper peer reviewed)

全国大会

  1. 西原美玖, 法野行哉, 橋本佳, 南角吉彦, 徳田恵一, ``Sequence-to-sequence歌声合成のための発声タイミングのモデル化に関する検討,'' 日本音響学会2022年秋季研究発表会, pp. 1359-1362, 北海道, 日本, 2022年9月.
  2. 石田龍成, 藤本崇人, 橋本佳, 南角吉彦, 徳田恵一, ``隠れセミマルコフモデルに基づく構造化アテンションを用いた音声合成におけるパラメータ共有構造の検討,'' 日本音響学会2022年秋季研究発表会, pp. 1199-1202, 北海道, 日本, 2022年9月.
  3. 白木佑弥, 橋本佳, 南角吉彦, 徳田恵一, ``デコーディング時の探索を考慮した系列識別学習によるEnd-to-End音声認識,'' 日本音響学会2022年秋季研究発表会, pp. 1141-1144, 北海道, 日本, 2022年9月.
  4. 三井健太郎, 趙天雨, 沢田慶, 法野行哉, 南角吉彦, 徳田恵一, ``自発的対話を用いた潜在スタイル表現の抽出・予測に基づく音声合成,'' 日本音響学会2022年秋季研究発表会, pp. 1593-1596, 北海道, 日本, 2022年9月. (スペシャルセッション)
  5. 法野行哉, 橋本佳, 南角吉彦, 徳田恵一, ``Sequence-to-sequence歌声合成のための音符位置に基づくアテンション機構の検討,'' 日本音響学会2022年秋季研究発表会, pp. 1589-1592, 北海道, 日本, 2022年9月. (スペシャルセッション)
  6. 吉村建慶, 高木信二, 中村和寛, 大浦圭一郎, 法野行哉, 橋本佳, 南角吉彦, 徳田恵一, ``微分可能なメルケプストラム合成フィルタを組み込んだend-to-end 音声合成システムの検討,'' 日本音響学会2022年秋季研究発表会, pp. 1585-1588, 北海道, 日本, 2022年9月.
  7. 藤本崇人, 橋本佳, 南角吉彦, 徳田恵一, ``半教師あり学習を用いた階層化生成モデルに基づく日本語 end-to-end 音声合成,'' 日本音響学会2022年秋季研究発表会, pp. 1579-1582, 北海道, 日本, 2022年9月. (スペシャルセッション) (第7回 IEEE Signal Processing Society Tokyo Joint Chapter Student Award受賞 link)
  8. 法野行哉, 高木信二, 橋本佳, 中村和寛, 大浦圭一郎, 南角吉彦, 徳田恵一, ``非周期性指標を考慮したニューラルボコーダの学習,'' 日本音響学会2022年春季研究発表会, pp. 973-976, 日本, 2022年3月. (オンライン開催, 粟屋潔学術奨励賞)
  9. 藤本崇人, 橋本佳, 南角吉彦, 徳田恵一, ``HSMM構造化アテンションに基づく音声合成のためのメモリ削減手法,'' 日本音響学会2022年春季研究発表会, pp. 969-972, 日本, 2022年3月. (オンライン開催)
  10. 佐々木一匡, 吉村建慶, 高木信二, 橋本佳, 南角吉彦, 徳田恵一, ``声質・声の高さ・話速を変更可能なニューラルボコーダ構成法の検討,'' 日本音響学会2022年春季研究発表会, pp. 935-938, 日本, 2022年3月. (オンライン開催)
  11. 平光啓祐, 橋本佳, 南角吉彦, 徳田恵一, ``深層学習に基づく音声合成における顔画像情報を用いたクロスモーダル話者適応,'' 日本音響学会2022年春季研究発表会, pp. 905-906, 日本, 2022年3月. (オンライン開催)

学位論文

  1. Yukiya Hono, ``Acoustic and waveform modeling for singing voice synthesis based on deep neural networks,'' Doctor thesis, Nagoya Institute of Technology, February, 2022.
  2. 谷口晃平, ``デコーディング時を想定したEnd-to-End音声認識における系列識別学習のための損失関数の改良'' 卒業論文, 名古屋工業大学, 2022年2月.
  3. 田中琉聖, ``自己教師あり学習による特徴抽出を用いたノンパラレル歌声声質変換の検討'' 卒業論文, 名古屋工業大学, 2022年2月.
  4. 鈴木涼, ``Variational AutoEncoderに基づく声質変換における潜在変数表現の検討'' 卒業論文, 名古屋工業大学, 2022年2月.
  5. 石田龍成, ``隠れセミマルコフモデルを用いた構造化アテンションに基づく音声合成におけるパラメータ共有構造の検討,'' 卒業論文, 名古屋工業大学, 2022年2月.
  6. 伊藤天良, ``リアルタイム歌声変換のためのピッチ・音圧変換聴覚フィードバックの検討,'' 卒業論文, 名古屋工業大学, 2022年2月.
  7. 西原美玖, ``Sequence-to-sequence歌声合成における発声タイミングのモデル化手法,'' 卒業論文, 名古屋工業大学, 2022年2月.
  8. 倉田颯人, ``隠れセミマルコフモデルの構造を導入したDNNに基づく音声合成におけるクロスリンガル話者適応,'' 卒業論文, 名古屋工業大学, 2022年2月.
  9. 須内翔, ``隠れセミマルコフモデルに基づく構造化アテンションを用いた音声合成におけるモデル化単位の検討,'' 卒業論文, 名古屋工業大学, 2022年2月.
  10. 中塚恭平, ``敵対的生成モデルに基づく音声合成におけるテキストデータを利用した半教師あり学習法,'' 卒業論文, 名古屋工業大学, 2022年2月.
  11. 中村朋生, ``触覚情報を入力としたクロスモーダル感情音声合成,'' 卒業論文, 名古屋工業大学, 2022年2月.
  12. 片山優太, ``深層距離学習を導入したSequential Variational Autoencoderに基づく話者照合,'' 卒業論文, 名古屋工業大学, 2022年2月.
  13. 都築伸武, ``周波数ワーピングに基づいた声質変更を可能とするニューラルボコーダ構成法,'' 卒業論文, 名古屋工業大学, 2022年2月.
  14. 堀尾凌汰, ``Transformerに基づくEnd-to-End音声合成における最適モデル構造の検討,'' 卒業論文, 名古屋工業大学, 2022年2月.
  15. 川村莉子, ``Sequential Variational Autoencoderに基づく話者認識における半教師あり学習法,'' 卒業論文, 名古屋工業大学, 2022年2月.
  16. 車田智哉, ``生成モデルの構造を組み込んだSequential Variational Autoencoderに基づく話者認識,'' 修士論文, 名古屋工業大学, 2022年2月.
  17. 岩田康平, ``勾配ブースティング決定木を用いた音声合成手法,'' 修士論文, 名古屋工業大学, 2022年2月.
  18. 厚地俊哉, ``音声プライバシー保護を目的としたノンパラレル声質変換による話者匿名化,'' 修士論文, 名古屋工業大学, 2022年2月.
  19. 成田哲郎, ``ニューラルネットワークを用いた音声符号化におけるモデル構造の調査,'' 修士論文, 名古屋工業大学, 2022年2月.
  20. 前川遼太朗, ``楽譜情報を用いた統計的楽器演奏音合成の検討,'' 修士論文, 名古屋工業大学, 2022年2月.
  21. 西村愛理, ``出力遅延と時間伸縮変換を考慮したリアルタイム声質変換,'' 修士論文, 名古屋工業大学, 2022年2月.
  22. 佐々木一匡, ``声質・声の高さ・話速を変更可能なニューラルボコーダ構成法,'' 修士論文, 名古屋工業大学, 2022年2月.
  23. 平光啓祐, ``深層学習に基づく音声合成における顔画像を用いたクロスモーダル話者適応,'' 修士論文, 名古屋工業大学, 2022年2月.
  24. 久野宏彰, ``音声合成における希少な発話スタイルの転移学習,'' 修士論文, 名古屋工業大学, 2022年2月.
  25. 木村俊介, ``幾何学的変動に頑健な画像認識のためのAttention機構に基づく深層学習モデル,'' 修士論文, 名古屋工業大学, 2022年2月.
  26. 大谷眞史, ``深層生成モデルに基づく音声合成におけるクロスリンガル話者適応,'' 修士論文, 名古屋工業大学, 2022年2月.
  27. 小林睦, ``車内音声対話のための統計モデルに基づくドライバ認知負荷推定,'' 修士論文, 名古屋工業大学, 2022年2月.

講演

  1. 徳田恵一, ``音声合成技術の発展と未来 -個人的視点から雑談風に,'' JST CREST「共創型音メディア機能拡張」中間シンポジウム 2022, December, 2022.(招待講演)

プレプリント

  1. Yukiya Hono, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``Singing Voice Synthesis Based on a Musical Note Position-Aware Attention Mechanism,'' arXiv preprint arXiv:2102.07786, December, 2022. link
  2. Takenori Yoshimura, Shinji Takaki, Kazuhiro Nakamura, Keiichiro Oura, Yukiya Hono, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``Embedding a differentiable mel-cepstral synthesis filter to a neural speech synthesis system,'' arXiv preprint arXiv:2211.11222, November, 2022. link
  3. Kentaro Mitsui, Tianyu Zhao, Kei Sawada, Yukiya Hono, Yoshihiko Nankaku, and Keiichi Tokuda, ``End-to-End Text-to-Speech Based on Latent Representation of Speaking Styles Using Spontaneous Dialogue,'' arXiv preprint arXiv:2108.02776, June, 2022. link

過去の発表論文





トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS