発表論文 - 2025

論文誌

  1. Takato Fujimoto, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, "V2Coder: A Non-Autoregressive Vocoder Based on Hierarchical Variational Autoencoders," in IEEE Access, vol. 13, pp. 92833-92847, 2025. (Full paper peer reviewed) link
  2. Sathvik Udupa,Jesuraja Bandekar,Abhayjeet Singh,Deekshitha G,Saurabh Kumar, and Sandhya Badiger, ``LIMMITS'24: Multi-Speaker, Multi-Lingual INDIC TTS With Voice Cloning'' in IEEE Open Journal of Signal Processing, vol. 6, pp. 293-302, 2025 link

国際会議

  1. Haruto Kikuchi, Takashi Nose, Yu Hayashizaki, Sumiharu Kobayashi, Kei Hashimoto, and Akinori Ito, ``JAFS: Construction of Japanese Anime Face and Speech Dataset for Cross-Modal Speech Synthesis,'' 2025 IEEE 14th Global Conference on Consumer Electronics (GCCE), pp. 798-799, Osaka, Japan, September, 2025. (Full paper peer reviewed)
  2. Takenori Yoshimura, Shinji Takaki, Kazuhiro Nakamura, Keiichiro Oura, Takato Fujimoto, Kei Hashimoto, Yoshihiko Nankaku, and Keiichi Tokuda, ``SSLZip: Simple autoencoding for enhancing self-supervised speech representations in speech generation,'' 13th ISCA Speech Synthesis Workshop, pp. 117-122, Leeuwarden, Netherlands, August, 2025. (Full paper peer reviewed)
  3. Masato Takagi, Miku Nishihara, Yukiya Hono, Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda, ``PeriodCodec: A Pitch-Controllable Neural Audio Codec Using Periodic Signals for Singing Voice Synthesis,'' Interspeech 2025, pp. 4913-4917, Rotterdam, Netherlands, August 17-21, 2025, (Full paper peer reviewed)

研究会

  1. 山田美晴, 橋本佳, 南角吉彦, 徳田恵一, ``対照学習による顔画像と音声のモデル化に基づくクロスモーダル音声合成,'' 音声言語情報処理研究会, vol. 2025-SLP-156, no. 61, pp. 1-8, 東京, 日本, 2025年6月.
  2. 菊池遥斗, 能勢隆, 林崎由, 小林清流, 橋本佳, 伊藤 彰則, ``F2S-SBV2:任意のアニメ調キャラクター顔画像に適した話者性を有するテキスト音声合成の検討,'' 音声言語情報処理研究会, vol. 2025-SLP-156, no. 71, pp. 1-7, 東京, 日本, 2025年6月
  3. 中塚恭平, 橋本佳, 南角吉彦, 徳田恵一,``注意機構により目標話者音声を直接的に参照するzero-shot音声合成,'' 音声研究会, vol. 124, no. 391, SP2024-29, pp. 70-75, 沖縄, 日本, 2025年3月.
  4. 佐藤恵哉, 橋本佳, 南角吉彦, 徳田恵一,``Deformable Convolutional Networks に基づく話者照合,'' 音声研究会, vol. 124, no. 391, SP2024-29, pp. 40-45, 沖縄, 日本, 2025年3月.

全国大会

  1. 今村優太, 法野行哉,吉村建慶,橋本佳, 南角吉彦, 徳田恵一,``メルケプストラム合成フィルタを用いた周期・非周期分離型ニューラルボコーダ,'' 日本音響学会2025年秋季研究発表会, pp.1177-1180, 宮城, 日本, 2025年9月.
  2. 苅谷楓, 藤本崇人,橋本佳,南角吉彦,徳田恵一,``日本語テキスト音声合成のための高低アクセントの直接推定に関する検討,'' 日本音響学会2025年秋季研究発表会, pp.1131-1134, 宮城, 日本, 2025年9月.
  3. 淺野友紀, 橋本佳, 南角吉彦, 徳田恵一,``Rectified Flowを組み込んだ深層隠れセミマルコフモデルに基づく音声合成,'' 日本音響学会2025年春季研究発表会, pp.883-886, 埼玉, 日本, 2025年3月.
  4. 堀尾凌汰, 橋本佳, 南角吉彦, 徳田恵一,``感情音声合成のための自己教師あり学習モデルによる音声表現抽出,'' 日本音響学会2025年春季研究発表会, pp.897-900, 埼玉, 日本, 2025年3月.
  5. 高木真人, 西原美玖, 法野行哉, 橋本佳, 南角吉彦, 徳田恵一,``歌声合成に適したNeural Audio Codec構成法の検討,'' 日本音響学会2025年春季研究発表会, pp. 947-950, 埼玉, 日本, 2025年3月.
  6. 薫田基広, 藤本崇人, 法野行哉, 吉村建慶, 橋本佳, 南角吉彦, 徳田恵一,``周期信号の位相情報を用いたフレーム駆動形ニューラルボコーダ,'' 日本音響学会2025年春季研究発表会, pp. 905-908, 埼玉, 日本, 2025年3月.
  7. 飯田諒, 橋本佳, 南角吉彦, 徳田恵一,``双方向の自己回帰構造を導入した深層隠れセミマルコフモデルに基づく音声合成,'' 日本音響学会2025年春季研究発表会, pp. 887-890, 埼玉, 日本, 2025年3月.
  8. 三宅恭平,藤本崇人, 橋本佳, 南角吉彦, 徳田恵一,``発話単位の潜在変数を導入した深層隠れセミマルコフモデルに基づく音声合成,'' 日本音響学会2025年春季研究発表会, pp. 879-882, 埼玉, 日本, 2025年3月.
  9. 田牧宏都, 橋本佳, 南角吉彦, 徳田恵一,``自然言語による声質制御のための音声・声質説明文ペアデータの作成・評価システムの検討,'' 日本音響学会2025年春季研究発表会, pp. 1039-1040, 埼玉, 日本, 2025年3月.

学位論文

  1. 淺野友紀, ``Rectified Flowと深層隠れセミマルコフモデルの統合に基づく音声合成,'' 卒業論文, 名古屋工業大学, 2025年2月.
  2. 薫田基広, ``周期信号の初期位相情報を用いたフレーム駆動形ニューラルボコーダ,'' 卒業論文, 名古屋工業大学, 2025年2月.
  3. 苅谷楓, ``日本語テキスト音声合成のためのニューラルネットワークによるアクセント推定,'' 卒業論文, 名古屋工業大学, 2025年2月.
  4. 柏木勇飛, ``音声特徴を制御可能な深層隠れセミマルコフモデルに基づく音声合成における非周期性指標の適用,'' 卒業論文, 名古屋工業大学, 2025年2月.
  5. 佐藤恵哉, ``Deformable Convolutional Networks を用いた話者照合の検討,'' 卒業論文, 名古屋工業大学, 2025年2月.
  6. 今村優太, ``微分可能なメルケプストラム合成フィルタを用いたニューラルボコーダ,'' 卒業論文, 名古屋工業大学, 2025年2月.
  7. 井川恭輔, ``SpecAugmentを用いたニューラルボコーダの学習法,'' 卒業論文, 名古屋工業大学, 2025年2月.
  8. 高木真人, ``周期信号を用いた基本周波数制御可能なNeural Audio Codec構成法,'' 卒業論文, 名古屋工業大学, 2025年2月.
  9. 山下敦生, ``聴覚フィードバック制御を導入したリアルタイム声質変換のための自己発声骨導音のアクティブノイズキャンセリング,'' 卒業論文, 名古屋工業大学, 2025年2月.
  10. 川崎健生, ``顔画像を用いたクロスモーダル音声合成における事前学習モデルの利用法の検討,'' 卒業論文, 名古屋工業大学, 2025年2月.
  11. 渡邊達哉, ``Guided Attentionを組み込んだTransformer Decoderに基づく音声合成の検討,'' 卒業論文, 名古屋工業大学, 2025年2月.
  12. 花井謙志郎, ``ベクトル量子化変分オートエンコーダを用いた事前学習に基づく自動車操作信号からのドライバ状態推定,'' 修士論文, 名古屋工業大学, 2025年2月.
  13. 水野優, ``大規模データによる自己教師あり学習モデルを用いた音声表現抽出に基づく話者照合,'' 修士論文, 名古屋工業大学, 2025年2月.
  14. 臼井嵩人, ``深層隠れセミマルコフモデルに基づく音声合成における学習基準に関する検討,'' 修士論文, 名古屋工業大学, 2025年2月.
  15. 佐藤鈴夏, ``特徴分離に基づいた基本周波数制御可能なニューラルボコーダ構成法,'' 修士論文, 名古屋工業大学, 2025年2月.
  16. 福田至音, ``基本周波数の制御性を考慮した歌声合成のためのニューラルボコーダ学習法,'' 修士論文, 名古屋工業大学, 2025年2月.
  17. 勅使河原勇希, ``深層隠れマルコフモデルに基づくEnd-to-End音声合成の検討,'' 修士論文, 名古屋工業大学, 2025年2月.
  18. 長谷川郁弥, ``自己教師あり学習による特徴抽出に基づいた深層学習に基づく歌声変換,'' 修士論文, 名古屋工業大学, 2025年2月.
  19. 長谷川太一, ``顔画像を用いたクロスモーダル音声合成における半教師あり学習の検討,'' 修士論文, 名古屋工業大学, 2025年2月.
  20. 堀尾凌汰, ``感情音声合成のための自己教師あり学習モデルによる参照音声からの音声表現抽出,'' 修士論文, 名古屋工業大学, 2025年2月.
  21. 山田洸太朗, ``微分可能なメルケプストラム合成フィルタを組み込んだニューラル音声合成システムの敵対的学習,'' 修士論文, 名古屋工業大学, 2025年2月.
  22. 島崎秀太, ``深層学習に基づく歌声に着目した楽曲推薦法の検討,'' 修士論文, 名古屋工業大学, 2025年2月.
  23. 中山航輔, ``ニューラルオーディオコーデックに基づく音響信号の再生速度・ピッチの変換手法に関する検討,'' 修士論文, 名古屋工業大学, 2025年2月.
  24. 小林悠佑, ``階層化生成モデルに基づくEnd-to-End複数話者音声合成の検討,'' 修士論文, 名古屋工業大学, 2025年2月.
  25. 中邑草太, ``オンラインコミュニケーションのための触覚・音声のクロスモーダルインタフェース,'' 修士論文, 名古屋工業大学, 2025年2月.
  26. 中塚恭平, ``注意機構を用いて目標話者音声を直接的に参照するzero-shot音声合成,'' 修士論文, 名古屋工業大学, 2025年2月.
  27. 伊藤哲平, ``言語特徴の潜在変数を用いた深層隠れセミマルコフモデルに基づく音声合成,'' 修士論文, 名古屋工業大学, 2025年2月.

過去の発表論文





トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS