トップQs
タイムライン
チャット
視点

アディティブ・シンセシス

倍音を加算して音色を作成する手法 ウィキペディアから

Remove ads

音響信号処理における加算合成(かさんごうせい、: additive synthesis)は複数の純音を重ね合わせ(加算して)音響信号を合成する、音声合成の一種である[1][2]アディティブ・シンセシスとも呼ばれる。対比される合成手法に減算合成がある。

概要

音響信号は正弦波の重ね合わせで表現できる。またヒトの聴覚には可聴域が存在するため聞こえる周波数に上限がある。このことは周期信号と聴覚上等価な合成音を正弦波の有限和で表現できることを示唆する(詳細: #理論的背景)。

加算合成は有限個の正弦波を加算して音を合成する手法の総称である。正弦波の周波数・振幅・位相を適切に設定することで多様な音を生成・再現できる。

実装としては事前計算した波形テーブル(ウェーブテーブル・シンセシス)や逆高速フーリエ変換を活用できる。

合成要素となる個々の正弦波は部分音パーシャル)と呼ばれる。特に倍音はハーモニックパーシャル(調波)、非倍音はインハーモニック・パーシャル(非調波)と呼ばれる。

理論的背景

Thumb
フーリエ級数による
方形波の近似(最初の4項)

音響信号は正弦波の重ね合わせで表現できる(フーリエ変換)。さらに信号が周期性を持っていれば、その信号は正弦波の無限和で(積分せずに)表現できる(フーリエ級数)。

また、ヒトには知覚可能な周波数範囲(可聴域)が存在する。標準的には15kHzが上限でありそれ以上の音を聞き取ることができない。これは信号から可聴域外の成分を取り除いても聴覚上の差がない(=等価である)ことを意味する。

この2つの事実は、ある周期的な音響信号と聴覚上等価な信号を正弦波の有限和で表現できることを示唆する。なぜなら正弦波の無限和に含まれる15kHz以上の正弦波成分を除いても聴覚上等価な信号が構成でき、それは有限個の正弦波の和を意味するからである。

Remove ads

手法

要約
視点

加算合成は有限個の正弦波を加算して音を合成する手法の総称である。パラメータの時変性や周波数制約に基づき、様々なタイプの加算合成が存在する。

以下、各部分音のインデックスを 、初期位相を 、部分音の総数を 、合成音を とする。各部分音において周波数を 、振幅を とし、これが時変の場合は瞬時周波数 、瞬時振幅 を用いる。

次の表は様々な制約をもった加算合成を表現する式の一覧である。各手法は以降の節で詳説されている。

さらに見る , ...

時不変

Thumb
時不変加算合成器の構成定周波数・振幅の正弦波が生成(〜)、加算(+)されて合成音となる。

単純な加算合成では単一合成区間内で周波数と振幅を固定する(時不変)。この方式は次のように定義される[3]

時変振幅

Thumb
振幅が時間変化するハーモニック・アディティブ・シンセシスの例
(基本周波数 f0 = 440 Hz)

振幅を時間に応じて変化させる場合(c.f. 振幅変調)、次のように定義される:

帯域制限(band-limited signal)の観点から、 の変化は振幅変調による帯域の広がり が 隣接部分音間の周波数間隔より有意に小さくなるよう[4][5][注釈 1]、充分ゆっくりした速度で変化させる必要がある[1][注釈 2]。すなわち次の制約を留意する必要がある。

時変周波数

周波数を時間に応じて変化させる場合(c.f. 周波数変調)、次のように定義される[注釈 3]

Thumb
振幅と周波数の両方が時間変化するインハーモニック・アディティブ・シンセシスの例

時変振幅・時変周波数

最も一般化された加算合成は次のように定義される:

調波加算合成

自然界に存在する多くの音は調波構造を有している。すなわち基本周波数 成分(基音)とその整数倍成分(倍音)を多分に含んでいる。このことに注目し、部分音として基音および倍音のみを加算して音を合成する手法を調波加算合成(ハーモニック・アディティブ・シンセシス)という。

時不変振幅・周波数を用いた調波加算合成は次のように定義される:

周波数が で定義されるため、部分音#k はk次倍音(k=1なら基音)に相当する。

広義の定義

アディティブ・シンセシス」という用語は広義に、正弦波ベースか否かを問わず「単純な基本要素を足し合わせて複雑な音色を合成する」タイプのサウンド・シンセシス手法全般を指す包括的用語として使われる事がある。[6][7] 例えば F. Richard Mooreはサウンド・シンセシスの「四つの基本カテゴリー」として、アディティブ・シンセシスを他の三つと共に挙げている。[7]

この広義の意味で、正弦波以外の音色(パイプやストップ)を組み合わせるパイプオルガン電子オルガンも広義のアディティブ・シンセサイザーと見なせる。また主成分(変量間の相関行列の固有値分解で得られる合成基底)やウォルシュ関数英語版Walsh-Hadamard変換の基底関数)の総和による音響合成も、広義のアディティブ・シンセシスに分類できる。[8]

Remove ads

加算分析/再合成

音声信号の分析により周波数・振幅・位相が得られれば、これを加算合成に用いて音声を再構築できる。分析合成を一体で捉えた音声処理を音声分析合成という。合成部に加算合成を用いる場合、分析部に用いられる手法の例として帯域通過フィルタバンク短時間フーリエ変換McAulay-Quatieriアナリシス[9][10])、経験的モード分解[11]が挙げられる。

合成部に加算合成を用いる具体的な手法としては以下が一例に挙げられる。

  • Sinusoidal Modeling[12] 正弦波の総和による調波合成モデル
  • Reassigned Bandwidth-Enhanced Additive Sound Model[13][14]
    McAuley-Quatieriアルゴリズムのノイズ耐性改善のために、Bandwidth-enhanced Oscillatorを導入したSinusoidal Model。

またソフトウェア実装には下記がある:

Remove ads

応用例

楽器

アディティブ・シンセシスは、ハモンド・オルガンや、シンセサイザー電子楽器に応用されている。

音声合成

Thumb
音声波形とスペクトログラム(下):
赤点列は5つのフォルマント周波数、
下側水色カーブは基底周波数(ピッチ)

言語学の研究では1950年代初頭より、合成あるいは変更した音声スペクトログラムの再生にハーモニック・アディティブ・シンセシスが使用されている。[20] 1980年代初頭には、音声の音響的手がかり(acoustic cues)の意義を評価するために、それらを取り去った合成音声の聴取テストが行われた。[21] また線形予測符号で抽出したフォルマント周波数と振幅の時系列を使う音声合成手法の一つ sinewave synthesis は、インハーモニックな正弦波パーシャルの加算合成を行う。[22](関連:Sinusoidal Modeling

Remove ads

実装方式

今日のアディティブ・シンセシス実装系は、主にデジタル処理で実装されている(#離散表現参照)。

オシレータ・バンク

アディティブ・シンセシスは、各パーシャルに対応して正弦波オシレータを複数用意したオシレータ・バンクで実装できる[1](記事冒頭の図参照)。

ウェーブテーブル・シンセシス

楽音がハーモニックで準周期的な場合、ウェーブテーブル・シンセシスは時間発展のあるアディティブ・シンセシスと同様な一般性を備え、しかも合成に必要な計算量は少なくて済む。[23] 従って、ハーモニックな音色合成のための時間発展のあるアディティブ・シンセシスは、ウェーブテーブル・シンセシスで効率的に実装できる。

グループ・アディティブ・シンセシス(Group additive synthesis)[24][25][26] は、各パーシャルを基本周波数の異なるハーモニック・グループに分け、各グループ個別にウェーブテーブル・シンセシスで合成後、ミックスして結果を得る手法である。

逆高速フーリエ変換

高速フーリエ変換は、変換周期を均等分割した周波数[注釈 4] に関する(加算)合成を効率的に行える。また、離散フーリエ変換の周波数領域表現を注意深く考慮すれば、複数の逆高速フーリエ変換結果をオーバーラップさせた列を使って、任意周波数の正弦波による(加算)合成を効率的に行える。[27]

Remove ads

歴史的背景

要約
視点

調和解析

調和解析は、1822年フランスの数学者ジョゼフ・フーリエ[28]熱伝導の文脈で彼の研究に関する広範な論文を発表して、研究が端緒に付いた。[29] この理論の初期の応用には、潮の干満の予測がある。1876年頃、[30] ケルビン卿ことウィリアム・トムソンは機械式の潮汐予測機(Tide-predicting machine)を構築した。この装置はharmonic analyzerharmonic synthesizerで構成され、それらは19世紀に既に前述の名で呼ばれていた。[31][32] 潮汐の測定値は、ケルビン卿の兄ジェームズ・トムソン積分機integrating machine)を使い分析された。結果として得られたフーリエ係数は、紐と滑車のシステムを使ったsynthesizerに入力され、将来の潮汐の予測のための正弦波基底の調和部分波が生成され足し合わされた。同様な装置は1910年にも、音の周期波形の解析を目的として構築された。[33] この装置のsynthesizer部は合成波形をグラフに描画し、それは主に解析結果の視覚的検証に使用された。[33]

フーリエ理論の音への応用

フーリエ理論の音への応用は、1843年ゲオルク・オームによって行われた。この系統の研究はヘルマン・フォン・ヘルムホルツにより大きな進歩を遂げ、彼は8年間の成果を1863年出版した。[34] 彼は、音色の心理的知覚は学習によるものだが、官能的感覚は純粋に生理的なものだと信じていた。[35] また彼は、音の知覚は基底膜の神経細胞からの信号に由来し、これら細胞の弾性付属物は適切な周波数の純粋な正弦波トーンに共鳴振動する、という考えを支持した。[33] この他ヘルムホルツは、ある種の音源はインハーモニック(基底周波数の非整数倍)な振動モードを含むとする エルンスト・クラドニの1787年の発見に同意した。[35]

ヘルムホルツのサウンド・シンセサイザー

ヘルムホルツ の サウンド・シンセサイザーと
ケーニッヒ の サウンド・アナライザー
Thumb
Sound synthesizer
Thumb
Sound analyzer
Thumb
Thumb
ヘルムホルツのトーンジェネレータ(左図):電磁石で音叉を励起し、ヘルムホルツ・レゾネータ(右図)で音響増幅する。

ヘルムホルツの時代、電子的な音響増幅手段(アンプ)はまだ存在しなかった。ヘルムホルツは、ハーモニック・パーシャルに基づく音色合成(ハーモニック・アディティブ・シンセシス)を目的として、パーシャル生成用の電磁石励起式音叉と、音量調整用のアコースティックな共鳴チャンバー (ヘルムホルツ・レゾネータ) の組を並べた装置を製作した。[36] 製作は少なくとも1862年という早い時期に行われ、[36] 次にルドルフ・ケーニッヒ英語版により洗練され、1872年ケーニッヒの装置の実演が行われた。[36] ハーモニック・アディティブ・シンセシスに関し、ケーニッヒは彼の音波サイレン(wave siren)に基づく大型装置も製作した。この装置は空気圧式で、切断したトーンホイールを使っていたが、パーシャルの正弦波精度が低い点を批評された。[30] なお19世紀末に登場したシアター・オルガン英語版Tibiaパイプは正弦波に近い音波を発生でき、アディティブ・シンセシスと同様な方法で組み合わせる事ができる。[30]

アディティブとサブトラクティブ

1938年ポピュラーサイエンス誌で、人間の声帯は消防サイレンのように機能して、倍音に富んだ音色を生成し、その音色は声道でフィルタリングされ、異なる母音の音色が生成される、とする説が新しい重要な証拠と共に[37]報じられた。[38](関連:ソース・フィルタモデル)既に当時、アディティブ方式のハモンドオルガン(トーンホイールによる電気機械式実装)が市販されていた。しかし初期の電子オルガン・メーカの大多数は、大量のオシレータを要するアディティブ方式オルガンの製造は高価過ぎると判断し、代わりにサブトラクティブ方式オルガンの製造を開始した。[39] 1940年無線学会(IRE)の会議でハモンドのフィールド・エンジニア長は、従来の「音波を組合せて最終的な音色を組み上げる[注釈 5]ハモンドオルガンとは対照的な、「サブトラクティブ・システム」を採用した同社の新製品ノヴァコードについて詳しい説明を行った。[40]

Alan Douglasは1948年のRoyal Musical Associationの論文で、異なる方式の電子オルガンを説明するために修飾子「アディティブ」と「サブトラクティブ」を使った。[41] 現代的な用法のアディティブ・シンセシスサブトラクティブ・シンセシスという用語は、彼の1957年著作“The electrical production of music”に登場しており、音色生成の3つの手法が次の3つの章に示されている:[42]

  • アディティブ・シンセシス(additive synthesis
  • サブトラクティブ・シンセシス(subtractive synthesis
  • 他の形態の組合せ(Other forms of combinations

現代のアディティブ・シンセサイザーは典型的に、出力を電気アナログ信号やデジタルオーディオの形で生成する。後者の例には2000年前後に一般化したソフトウェア・シンセサイザーが含まれる。[43]

年表

以下に、歴史的もしくは技術的に注目に値するアディティブ・シンセシスの実装例(電気/アナログ/デジタル式のシンセサイザーやデバイス)を年表形式で示す。

さらに見る 初期実装, 商用化 ...
Remove ads

離散表現

要約
視点

アディティブ・シンセシスのデジタル実装では、これまで扱ってきた連続時間の式(連続時間形式)の代わりに、離散時間の式(離散時間形式)を用いる。

連続時間形式(3)を出発点とする:

連続時間形式を書き換えて離散時間形式を得るために、下記の置換を使う:

時刻:     
出力:    
振幅:   
瞬時周波数: [注釈 6]
瞬時位相: 
 

すると次の離散時間形式が得られる:

ここで の差分より

である。[27]

Remove ads

脚注

参考文献

関連項目

外部リンク

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads