热门问题
时间线
聊天
视角

漸近等同分割特性

来自维基百科,自由的百科全书

Remove ads

信息論中,漸近等同分割特性AEP)是隨機源輸出樣本的普遍性質,它是數據壓縮理論中典型集概念的基礎。

簡言之,該定理指出:儘管隨機過程可能產生多種結果序列,但實際出現的結果極大概率來自一個鬆散定義的集合——該集合中所有結果成為現實的可能性基本均等(這是大數定律遍歷理論的推論)。儘管存在某些單個結果的概率高於此集合中的任意結果,但集合內龐大的結果數量幾乎保證了最終結果必將源自該集合。克萊默大偏差定理為理解該特性提供了一種直觀路徑:偏離均值的程度越大,其概率隨樣本數量增加呈指數級衰減(這類現象由大偏差理論專門研究)。直觀來說,大偏差現象可能違背等概率分配原則,但這類情況幾乎不可能發生。

偽隨機數生成領域,如果候選生成器的輸出序列質量不確定,且根據某些統計標準,其輸出序列偏離典型值過遠,則會被視為隨機性不足而遭到拒絕。因此,儘管典型值的定義較為寬泛,但在實際應用中,關於充分典型性的概念已逐漸興起。

Remove ads

定義

給定一個概率空間 上的離散時間平穩遍歷隨機過程,漸近均分性質斷言:幾乎必然,對於所有離散時間平穩過程(包括遍歷過程)都有時,其中(簡寫為)表示熵率[1]對於有限值(即 ) 平穩遍歷隨機過程的情況,漸近均分性質在香農-麥克米倫-布萊曼定理中使用遍歷理論得以證明。對於任何獨立同分布源,不論是在離散值情況下(其中僅僅是符號的)還是在連續值的情況下(其中是微分熵),該性質都可以直接使用大數定律得以證明。(見下文)漸近均分性質的定義也可以擴展到某些連續時間隨機過程,這些過程在足夠長的觀察時間內存在一個典型集。在所有情況下,收斂性被證明是幾乎必然的。

Remove ads

離散時間獨立同分布源

是一個可以採用字母表中的值的獨立同分布源 ,其時間序列獨立同分布,。可以由弱大數定律得到依概率收斂漸近均分性質,即這是因為熵等於的期望。[1]

強大數定律斷言了更強的結論,幾乎必然收斂於熵, 即L1意義上的趨同表明

Remove ads

離散時間有限值平穩遍歷源

下面考慮有限值樣本空間的情況, 即,對於在概率空間上定義的離散時間平穩遍歷過程英語Stationary ergodic process,由克勞德·香農布羅克韋·麥克米倫英語Brockway McMillan利奧·布萊曼英語Leo Breiman提出的香農-麥克米倫-布萊曼定理指出,在L1意義上收斂於熵。[2]鍾開來將此定理推廣到以下情況:可以在可數無窮大集合中取值,前提是熵率仍然是有限的。 [3]

證明簡述[3]
  • x表示某個可測集,其中.
  • 將聯合概率用nx參數化為
  • 將條件概率用ikx參數化為
  • 取條件概率在k → ∞時的極限,並將其表示為
  • 論證兩種熵率存在,且對於包括平穩遍歷過程X內的任何平穩過程相等.記為H.
  • 論證均為平穩遍歷過程,其中i是時間指標,其樣本均值幾乎必然收斂到某些值,分別用表示.
  • 將概率的k階馬爾可夫近似定義為 .
  • 從有限值假設論證是有限的.
  • 的樣本均值來表示,並證明其幾乎必然收斂到Hk.
  • 定義概率測度
  • 的樣本均值表示並證明其幾乎必然收斂到H.
  • 利用過程的平穩性,論證k → ∞時.
  • 利用Lévy鞅收斂定理英語Lévy's martingale convergence theorem和有限值假設論證H = H.
  • 證明如前所述,它是有限的.
  • 通過以無窮歷史為條件并迭代期望,證明.
  • 使用馬爾可夫不等式和先前推導出的期望證明.
  • 類似地,證明該式等價於
  • 設對於任意β > 1,α = nβ,應用波萊爾-坎泰利引理,證明的上確界幾乎肯定為非正的.
  • 通過分解前面結果中的對數,證明的上下確界分別由HHk約束.
  • 通過指出當k→∞時上限和下限趨近於H來完成證明.
Remove ads

產生獨立符號的非平穩離散時間源

平穩性/遍歷性/隨機變量同分布的假設對於漸近均分性質的成立並非必要條件。事實上,正如直觀上顯而易見的那樣,漸近均分性質只需要某種形式的大數定律成立,這相當具有普遍性。但在這種情況下,漸進等同分割性質的表達式需要適當推廣,條件也需要精確地表述。

考慮一個產生獨立符號的源,該源每個時刻可能輸出不同的統計量,並且該過程的統計量完全已知,也就是說,該過程在每個時刻的邊際分布是已知的。聯合分布就是邊際分布的乘積。然後,在以下條件下(可以放寬):對於所有i,都有,對於某些M>0,下式(AEP)成立: 其中

證明

該項證明是由馬爾可夫不等式的一個簡單應用導出的(應用於的二階矩).

顯然,若任意矩r>1一致有界(同樣由應用於第r個矩的馬爾可夫不等式導出). Q.E.D.

上述條件其實也不是必要的,但給定一個非平穩隨機過程,使用上述方法檢驗漸進等同分割性質會比較容易。

Remove ads

應用

非平穩離散時間獨立過程的漸近均分性質可以推導出非平穩源(具有獨立輸出符號)的信源編碼定理和非平穩無記憶信道的噪聲信道編碼定理,還能推導出一些其他的結論。

測度論形式

是概率空間上的一個保測度映射。

如果的有限或可數劃分,那麼它的熵為,習慣上規定

我們只考慮熵有限的劃分,亦即

的有限或可數劃分,我們通過迭代映射構建一個劃分序列: 其中是最小上界劃分,即能細化的最低細化劃分: 所處的中的集合為。例如,名稱的前符號初始段。

如果我們知道落在劃分的哪個元素中,令為我們可以恢復的關於的信息量(以納特為單位): 類似地,劃分以劃分為條件關於的條件信息是Kolmogorov-Sinai熵(測度論熵)換句話說,根據定義,期望存在收斂。SMB定理指出,當是遍歷的,在L1中收斂。[4]

定理 (遍歷情形) — 是遍歷的,則在L1中收斂於常數函數.

換而言之,.

特別的,由於L1收斂意味着幾乎必然收斂,以概率1.

推論 (熵均分性質) — ,我們可以將劃分分成兩部分,「好(good)」部分和「壞(bad)」部分 .

壞的部分很小:

好的部分根據熵幾乎均分:

如果𝑇不一定具有遍歷性,那麼基礎概率空間將被分解為多個在𝑇下不變的子集。在這種情況下,我們仍能獲得向某個函數的L1收斂,但該函數不再是一個常值函數。[5]

定理 (一般情形) — 是由的所有-不變子集生成的σ-代數 L1收斂至

遍歷時, 是平凡的,所以函數簡化為常數函數,根據定義,上式等於,根據命題,它等於

Remove ads

連續時間平穩遍歷源

離散時間函數可以插值為連續時間函數。若此類插值函數f可測,則我們可將插值後的連續時間平穩過程定義為。若離散時間過程(如上文所示的獨立同分布或有限值平穩遍歷情形)滿足漸近等同分割特性,則該特性自然地適用於通過可測插值導出的連續時間平穩過程,即其中n對應於時間τ的自由度。nH(X)/τH(X)是分別香農定義的單位時間熵和單位自由度熵。

此類連續時間平穩過程的一個重要類別是帶限平穩遍歷過程,其樣本空間是連續函數的子集。若該過程為白過程(此時時間樣本呈獨立同分布),或存在T > 1/2W(其中W標稱帶寬)使得T間隔時間樣本取值於有限集合(此時轉化為離散時間有限值平穩遍歷過程),則漸近等同分割特性成立。

任何時不變操作也會保留漸近均分性質、平穩性和遍歷性,並且我們可以通過消除過程中有限數量的時間樣本,輕鬆地將平穩過程轉變為非平穩過程,而不會丟失漸近均分性質。

Remove ads

範疇論

格羅莫夫給出了漸近等同分割特性的範疇論定義。[6]給定測度空間P笛卡爾冪序列,,該序列允許一個漸近等價的齊性測度空間序列HN (即所有集合具有相同的測度;所有態射在自同構群下不變,因此可分解為指向終對象的態射)。

上述內容需要定義漸近等價性。該定義通過一個距離函數給出,用於度量單射對應同構之間的差異。單射對應是一個部分定義雙射映射;也就是說,它是子集之間的雙射。然後定義其中|S|表示集合S的測度。在下文中,默認PQ的測度取1,因此這些測度空間都是概率空間。該距離通常被稱為動土距離沃瑟斯坦度量

類似地,定義其中被視為P上的計數測度。因此,此定義要求P為有限測度空間。最後,令

那麼當時,單射對應是漸近等價的。

給定一個漸近等價於PN的齊次空間序列HN ,則P的熵H(P)可以取為

Remove ads

參見

注釋

參考文獻

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads