* 研究内容 - 音声合成 [#p3d10e95]

&ref(speechsynthesis.jpg,nolink,center,40%);
//&ref(speechsynthesis.jpg,nolink,center,40%);

現在,技術の進歩に伴い複雑となった機械の操作を補助するために,様々なインターフェイスの研究が進められています.その中でも,人間のコミュニケーションツールとして使用されている音声に着目したインターフェイスの研究が盛んになっており,すでに一部では実用化もされていますが,現在はまだ発展途上の段階です.機械と人間の円滑なコミュニケーションの実現のためには機械による話す・聞くの動作をより自然なものにする必要があり,それに関わる研究のひとつが機械に人間のように自然な発話をさせる音声合成技術です.
** はじめに [#pf659477]
> 音声合成とはコンピュータに人間のような自然な発話をさせる技術です.~
より滑らかで,より自然な発声にする研究を進めています.

音声合成には単位選択型など様々な手法が提案されていますが,本研究室では主に隠れマルコフモデルなどの統計的な枠組みに基づいた手法を扱っています.
** HMM音声合成 [#sea29cfd]

> 音声合成には単位選択型など様々な手法が提案されていますが,
本研究室では主に隠れマルコフモデル(HMM)などの統計的な枠組みに
基づいた手法を扱っています.~
HMM音声合成システムではHMMに基づいて,音声に含まれる特徴量を統計
的にモデル化して音声を合成します.

** 研究分野 [#ja3e7fa4]

** 分野 [#ja3e7fa4]
*** テキスト音声合成 [#z35e765d]

- テキスト音声合成
- 話者補間
- 固有声
- 歌声合成
- 感情音声合成
- 低ビットレート音声符号化
- 声質変換
- 感情音声合成
- 話者適応
> 任意のテキストから音声を合成する技術です.~
Text To Speech (TTS) とも呼ばれています.~
デモンストレーションは[[こちら>http://www.sp.nitech.ac.jp/~demo/gtalk/demo.php]]

** 研究テーマ例 [#n650d86b]
*** 話者補間 [#y6f91f75]

- [[隠れマルコフモデルに基づくテキスト音声合成システムの実現 -喜んだり悲しんだりするコンピュータを目指して->https://www.sp.nitech.ac.jp/~demo/emotion_demo.ppt]]
- [[声質変換システムの構築に関する研究>https://www.sp.nitech.ac.jp/~demo]]
- [[固有声に関する研究>https://www.sp.nitech.ac.jp/~demo]]
- 歌声合成に関する研究
- [[極低ビットレート(100bit/s)音声符号化システムの構築>https://www.sp.nitech.ac.jp/~demo/demo2/]]
> 複数話者のモデルを組み合わせて,新しい話者のモデルをつくり出す技術です.~
デモンストレーションは[[こちら>ホーム/デモンストレーション/話者補間]]

*** 固有声 [#s89b708f]

> 複数の話者や話し方のスタイルを少量のパラメータによるモデル空間で表し,
それらのパラメータに重み付けすることで任意の声質を表現して音声を合成する
技術です.~
様々な声質,話し方を生み出すことができます.~
デモンストレーションは[[こちら>ホーム/デモンストレーション/固有声]]

*** 歌声合成 [#eea1a126]

> 歌詞や楽譜を与えることで,任意の歌を合成する技術です.~
エンターテインメントやアミューズメントの分野においてさまざまな用途が
期待できます.~
デモンストレーションは[[こちら>ホーム/デモンストレーション/歌声合成]]

*** 声質変換 [#l09817c6]

> ある話者の音声をあたかも別の話者の話した音声のように変換する技術です.~
2人の話者の発話データからモデルを学習し,一方の話者の発話データをもう一
方の話者の発話データに変換します.

*** 話者適応 [#s81e61d6]

> 目標とする話者の少量のデータから,HMMのモデルパラメータを変換し,目標
話者の声質を変換する技術です.~
デモンストレーションは[[こちら>ホーム/デモンストレーション/話者適応]]





トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS