トップQs
タイムライン
チャット
視点
波形接続型音声合成
ウィキペディアから
Remove ads
波形接続合成(英: concatenative synthesis;[脚注 1] あるいは素片接続型、素片連結方式、連結的合成)とは、録音された音の断片(「単位」と呼ばれる)を連結し合成する手法である。単位の長さに厳密な定義はないが、およそ10 ms~1秒程度の範囲である。この手法は音声合成や楽音合成で、多数の録音フレーズを集めたデータベース(音声コーパスや歌手ライブラリ、楽音コーパス)から、ユーザが指定したフレーズの音を生成するのに使用される。
技法
波形接続合成を実現するための様々な要素技術が提案されている。以下はその一例である:
音声
→詳細は「音声合成 § 波形接続型音声合成」を参照
波形接続合成による音声合成は、「波形接続型音声合成」と表現される事がある。[脚注 2]
歌唱
→「ボーカルシンセサイザー」も参照
![]() | この節の加筆が望まれています。 |
音楽
音楽のための波形接続合成は、2000年代に特にSchwarz[2]と Pachet[3]の研究を通じて開発が始まった(musaicingとも呼ばれる[要検証])。基本技術は音声の場合と同様だが、音声と音楽の性質の違いにより相違がある: たとえば分割は音素や音節等の単位ではなく、ノートやイベント等のサブ単位[要説明]で行なう。[2][4][5]
波形接続合成による楽音合成の研究事例については、Schwarzがサーベイ結果を公開している[6]。
関連項目
- グラニュラー・シンセシス
- ボーカルシンセサイザー
脚注
- この記事は、音声 (人の声) 以外のconcatenate synthesisを主に扱う記事なので、音声限定の訳語「波形接続型音声合成」ではなく、より広いニュアンスを持つ訳語「波形接続合成」を用いる。この分野の開拓者Schwarzのサーベイ結果 Schwarz 2006 によれば、国際的に広く認知された成果はまだ日本からは出現しておらず、日本語による定番訳語は不明である。なお「波形接続合成」という表現は、たとえば下記をはじめとする十数件程度の論文で使用されている:
“"波形接続合成"の検索結果: 約14件”, Google Scholar 2013年2月15日閲覧。- 望月, 亮; 本多, 高; 新居, 康彦 (1996-09-01), “VCV波形接続合成のためのピッチ変換法の検討”, 日本音響学会研究発表会講演論文集 1996 (2): pp. 233–234
- 「波形接続型音声合成」という表現の初出論文および一般性は定かではないが、たとえば下記をはじめ数十件程度の日本語論文で使用されている:
“"波形接続型音声合成"の検索結果: 約55件”. Google Scholar. 2013年2月15日閲覧。- 居村太介; 村上仁一; 池原悟 (2008年3月). “波形接続型音声合成のフレーズへの適用” (PDF). 言語処理学会 第14回年次大会 発表論文集. 鳥取大学工学部知能情報工学科. 2013年1月30日閲覧。
- 大本浩司 (2000年11月8日). “音声イメージの製品開発への応用”. 日本心理学会第64回大会. オムロンIT研究所. 2013年1月30日閲覧。
- 世木寛之; 田高礼子; 清山信正; 都木徹 (2009年2月). “ニュース番組の収録音声を利用した波形接続型音声合成システム” (PDF). 情報処理学会論文誌 Vol.50 No.2. 情報処理学会. pp. 575-586. 2013年1月30日閲覧。
Remove ads
参考文献
外部リンク
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads