热门问题
时间线
聊天
视角

加伯轉換

来自维基百科,自由的百科全书

Remove ads

加伯轉換窗函數高斯函數短時距傅立葉變換

數學定義

短時距傅立葉轉換中的窗函數代入高斯函數,即可得下面的標準定義:

以下是幾種常見的替代定義:

  • 註:在文獻上可能會看到不同形式的加伯轉換,但本質上都是一樣的。

由於實作時,不能計算無限大的積分式子,所以根據高斯函數會從兩側遞減的性質,我們可以將上式進一步化簡:

Remove ads

為何選擇高斯函數作為窗函數

  1. 其他窗函數短時距傅立葉變換,如利用方型窗函數的短時距傅立葉變換,無法同時兼顧時間軸和頻率軸的解析度;一者解析度提升,另一者解析度必定下降。但高斯函數由海森堡測不準原理可得知,是最能同時讓兩軸兼顧解析度的窗函數(將於下面章節詳述)。
  2. 高斯函數傅立葉轉換的特徵函數:

因此經過轉換後其性質不變。因此可讓加伯轉換後在時間軸和頻率軸的性質相互對稱。

Remove ads

由測不準原理了解高斯函數的性質

上述提到,高斯函數是最能兼顧時間與頻率解析度的窗函數。我們利用這個章節來詳細討論。

對於一個信號 ,當,若,則
其中
由於兩者標準差相乘有下限,這個定理說明了我們沒有辦法同時精準量測時間和頻率,其中一者標準差下降(解析度上升),另一者標準差就上升(解析度下降)。
Thumb
加伯轉換後的結果,橫軸是時間(秒),縱軸是頻率(赫茲)
套用以上函式求得變異數(其中由於高斯函數為偶對稱函數,所以其)
藉由微積分公式可得:
即高斯函數滿足測不準定理的最下限,所以是所有窗函數中能使時間和頻率兩者解析度都達到最高的函數。
  • 變形的高斯函數同樣會滿足測不準原理的下限,如以下例子:
  1. :對機率分布做位移,標準差不會改變。
  2. :分子與分母同乘A,可消掉。因此標準差不會改變。
  3. :在時域乘上相當於在頻域對頻率做位移,標準差一樣不會改變。
  4. :在時域做縮放,頻域會做相反的縮放,因此標準差也不會改變。
  • 以下提供一個簡單的例子來做模擬,
右圖為即加伯轉換的結果,可以看出其時間和頻率都維持相當程度的解析度。
Remove ads

高斯窗函數與方形窗函數比較

以下提供一個簡單的範例來比較加伯轉換以及利用方形窗函數的短時傅立葉轉換:

Thumb
方形窗函數短時傅立葉轉換(橫軸:時間, 縱軸:頻率)
Thumb
加伯轉換(橫軸:時間, 縱軸:頻率)

從圖中可以發現方形窗函數的短時傅立葉轉換會有能量擴散的情形,而加伯轉換則是清晰的時頻圖。

Remove ads

加伯轉換的縮放

由於高斯窗函數的寬度可以由一常數做調整,因此我們將這個參數加入加伯轉換的數學式子中,讓轉換更加彈性,如下式:
而根據前面章節所述。實作時,不能計算無限大的積分式子,所以根據高斯函數會從兩側遞減的性質,我們可以將上式進一步化簡:
  • 根據傅立葉轉換的縮放公式,假設,則傅立葉轉換後為,使其能根據需求而調整時域解析度或頻域解析度
  • 改變高斯函數的寬度,和改變方形窗函數短時距傅立葉變換的效果類似。若選取較大的,時域的高斯窗函數較窄,則時域有較高的解析度,而頻域的高斯窗函數較寬,所以頻域的解析度會下降(通常用於需要時域解析度較高的應用,例如:音樂訊號);反之,若選取較小的,時域的高斯窗函數較寬,則時域的解析度下降,而頻域的高斯窗函數較窄,所以頻域的解析度會上升(通常運用在需要頻域解析度較高的應用,例如:氣候)。雖然還是有兩軸之間的解析度的犧牲,但比起其他無法滿足測不準原理下限的窗函數,加伯轉換的兩軸還是能相對維持較高的解析度。
  • 若應用於瞬時頻率改變較劇烈的應用,則可考慮使用窗寬度隨時間而變動的加伯轉換數學式子,如下
當瞬時頻率變動非常快時,使用較大的值,使其時域解析度能較高;當瞬時頻率變動很慢時,使用較小的值,使其頻域解析度能較高。
Remove ads

實現方法及注意事項

Direct Implementation


  • Discrete Form:

可將式子改寫為離散形式:


, therefore,only when is nonzero 可改寫為:

按照此式即可實現

Remove ads

限制

  • 避免贋頻效應(aliasing effect)

(1)

Remove ads

時間複雜度

O(TFQ) T:時間取樣點數 F:頻率取樣點數 Q:

優缺點

優點:簡單實現,限制條件少
缺點:時間複雜度高

FFT-Based Method(快速傅立葉轉換)

由Direct Implementation可得下式


且離散傅立葉轉換標準式 可將式子整理為:

按照此式將以fft()算出帶入即可實現

其中 ,,

  • Matlab及python 皆可呼叫fft函式完成
  • 演算法

假設

step 1:計算
step 2:
step 3:決定
step 4:
step 5:轉換
step 6:設 and return to Step 3 until

限制

  • 避免贋頻效應(aliasing effect)
(1)(基本上任何實現方法都要避免贋頻效應)
(2)
(3)

時間複雜度

優缺點

優點:時間複雜度低
缺點:限制條件較直接實現法多

Chirp Z Transform

可改寫為: 由Direct Implementation可得下式


可將式子改寫為:

按此式即可實現
  • 演算法
Step1:
Step2:
Step3:

限制

  • 避免贋頻效應(aliasing effect)

(1)

時間複雜度

優缺點

優點:限制條件與Direct Implementation法一樣基本上沒有限制
缺點:時間複雜度與FFT-Based Method(快速傅立葉轉換)一樣
  • 但由於加伯轉換無法使用Recursive Method(遞迴法)所以此不能算是缺點

特性

加伯轉換的大部分的特性和方形窗函數短時距傅立葉轉換的特性都相似,有些特性甚至更加接近傅立葉轉換的特性。

  • 積分特性
(還原成原始信號)
  • 位移特性
,則
  • 調變特性
,則
  • 線性特性
若有一信號分別為做加伯轉換的結果,則
  • 功率衰減特性
,則
  • 能量積分特性
  • 能量總和特性
  • 特殊信號
1. 當
2. 當
和方形窗函數短時距傅立葉轉換不同的是,加伯轉換的結果對於時間和頻率軸較對稱,也比較沒有旁波(sidelobe);也印證了上述所說的,加伯轉換較能維持兩個軸的解析度。

優缺點

Gabor Transform 的優點

  • 最佳時間-頻率局部化特性
    • Gabor Transform 使用高斯窗函數,與其他常見窗函數(如Rectangle、Triangle、Hanning、Hamming)相比,滿足測不準定理的最小下限(Minimum Uncertainty Principle)。這意味著,高斯函數能夠在時間域和頻率域中同時提供最佳的解析度,避免信號特徵的模糊或失真。
      • 高時間解析度:能捕捉信號的快速變化,對於瞬態信號(如語音中的短促音位或振動信號中的瞬時變化)尤為重要。
      • 高頻率解析度:能精確分辨信號中的穩態頻率成分,特別適合於分析連續且平穩的周期信號。
  • 算法穩健且實現簡單
    • Gabor Transform 基於傅里葉變換的數學理論,其結構清晰、明了且實現相對簡單。現代數值計算技術(如快速傅里葉變換,FFT)的發展進一步提升了 Gabor Transform 的計算效率,使其能夠在高效實現的同時保持穩健性。
    • 穩健性:由於其依賴於成熟的數學基礎,在實施中容易檢測和修正潛在錯誤。
    • 實現便利性:現有的數學工具庫(如 MATLAB、Python 的 Scipy、Octave)提供了高度封裝的 Gabor Transform 函數,大幅降低了實現門檻,讓開發者能更專注於應用場景設計,而非底層算法調試。
  • 廣泛的應用場景
    1. 語音去噪:利用 Gabor Transform 可以有效提取語音信號的時頻特徵,通過將語音信號分解為多個頻帶,對噪聲進行有效抑制,從而提升語音的清晰度和識別準確度,特別是在低信噪比環境下[1]
    2. 圖像處理
      • 紋理分析:有效捕捉圖像的方向與頻率特徵,用於紋理分類和圖像分割。
      • 邊緣檢測:適用於醫學圖像和場景理解,改善邊緣檢測效果。
    3. 機械振動信號分析
      • 故障檢測:由於Gabor Transform能夠提供高時間和頻率解析度,它能有效捕捉非平穩信號中的瞬時頻率變化。這使得它特別適合用於檢測如軸承、齒輪等機械部件的故障。轉換後的信號圖像可以作為特徵輸入至卷積神經網絡(CNN),進行自動化分類和故障診斷。[2]

Gabor Transform 的缺點

  • 計算複雜度較高
    • Gabor Transform 在處理高維數據(如圖像信號處理)時,計算複雜度可能大幅增加。每個窗函數的計算都需要執行一次傅立葉變換,這對於大數據集或實時應用場景來說,可能會成為系統性能的瓶頸。
    • 在圖像處理中,Gabor 變換通常需要對圖像的不同尺度和方向應用一組 Gabor 濾波器,以提取豐富的特徵資訊。這意味著每個尺度和方向都需要單獨進行濾波操作,隨著濾波器數量的增加,計算量會線性增長。此外,對於高解析度圖像,每次濾波操作都需要處理大量像素,從而進一步增加了計算負擔。
    • 為了提高計算效率,基於離散傅立葉變換(DFT)的快速算法應運而生,快速算法用於二維離散 Gabor 變換。可以顯著降低了計算複雜度[3]
  • 解析度折衷的不可避免性
    • 根據測不準定理,Gabor Transform 的時間和頻率解析度達到了理論的最佳折衷,但這也意味著:
      • 受測不凖定理約束,當需要同時對信號的快速變化與細微頻率差異進行精確分析時,時間和頻率的解析度會有可能不足以同時滿足所有需求。
      • 相較於 Gabor Transform, Wigner Distribution Function(WDF)等方法,因是對訊號的自相關函數做傅立葉轉換,可以超越測不準原理約束的下限,因此能提供更高的時頻解析度,尤其是對於結構複雜的信號。然而,WDF 的非線性特性容易引入交叉干擾項(cross-terms),而為了為了結合兩者的優點,Gabor Wigner Transform應運而生

參見

參考書目、資料來源

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads