熵 (資訊理論)

在資訊理論中，熵（英語：entropy，又稱資訊熵、信源熵、平均資訊本體量）是接收的每條訊息中包含的資訊的平均量。這裡的「訊息」代表來自分布或資料流中的事件、樣本或特徵。（熵最好理解為不確定性的量度而不是確定性的量度，因為越隨機的信源的熵越大。）來自信源的另一個特徵是樣本的機率分布。這裡的想法是，比較不可能發生的事情，當它發生了，會提供更多的資訊。由於一些其他的原因，把資訊（熵）定義為機率分布的對數的相反數是有道理的。事件的機率分布和每個事件的資訊量構成了一個隨機變數，這個隨機變數的均值（即期望值）就是這個分布產生的資訊量的平均值（即熵）。熵的單位通常為位元，但也用Sh、nat、Hart計量，取決於定義用到對數的底。

採用機率分布的對數作為資訊的量度的原因是其可加性。例如，投擲一次硬幣提供了1 Sh的資訊，而擲m次就為m位。更一般地，你需要用log₂(n)位來表示一個可以取n個值的變數。

在1948年，克勞德·艾爾伍德·夏農將熱力學的熵，引入到資訊理論，因此它又被稱為夏農熵（Shannon entropy）^[1]^[2]。

[1]

[2]

熵 (資訊理論)

簡介

熵的計算

定義

範例

熵的特性

連續性

對稱性

極值性

可加性

進一步性質

和熱力學熵的聯繫

.mw-parser-output .template-facttext{color:inherit;margin:-.3em 0;padding:.3em 0}@media screen{.mw-parser-output .template-facttext{background-color:var(--background-color-neutral,#eaecf0)}}語言學[查證請求]

逸聞

參見

參考

外部連結

Wikiwand - on