香农-范诺编码

在数据压缩的领域里，香农-范诺编码（英语：Shannon–Fano coding）是一种基于一组符号集及其出现的或然率（估量或测量所得）构建前缀码的技术。其名称来自于克劳德·香农和罗伯特·范诺。在编码效率上，它并不能与霍夫曼编码一样实现编码（code word）长度的最低期望；然而，与霍夫曼编码不同的是，它确保了所有的编码长度在一个理想的理论范围 ${-\log }P(x)$ 之内。这项技术是香农于1948年，在他介绍信息理论的文章“通信数学理论”中提出的^{[来源请求]}。范诺则在不久以后独立地以技术报告形式将其发布。^[1] 香农-范诺编码不应该与香农编码混淆，后者的编码方法用于证明Shannon's noiseless coding theorem，或与Shannon–Fano–Elias coding（又被称作Elias coding）一起，被看做算术编码的先驱。

香农-范诺编码将符号从最大可能性到最少可能性排序，并将排列好的信源符号分为两大组，使两组的概率和接近，并各赋予一个二进制符号“0”和“1”。只要有符号剩余，就以同样的过程重复这些步骤以此确定这些代码的连续编码数字。依次下去，直至每一组的只剩下一个信源符号为止。当一组已经仅剩余一个符号，显然，这意味着这一符号的编码是完整的，也不会成为任何其他符号的代码前缀。

香农-范诺编码能够产生相对高效的可变长度编码；对于每一个比特位而言，当两个较小的集合具有恰好相等的概率时，这一方法就能最有效地利用这一位编码的信息。然而，香农-范诺并不总是产生最优的前缀码：例如对概率{0.35，0.17，0.17，0.16，0.15}，香农-范诺算法就无法给出理想的编码。出于这个原因，香农-范诺编码几乎从不被使用。^{[来源请求]}

[1]