齐夫定律(英語:Zipf's law,IPA)是由哈佛大學的語言學家喬治·金斯利·齊夫于1949年发表的实验定律。它可以表述为:在自然语言的語料庫裡,一个单词出现的频率与它在频率表里的排名成反比。所以,频率最高的单词出现的频率大约是出现频率第二位的单词的2倍,而出现频率第二位的单词则是出现频率第四位的单词的2倍。这个定律被作为任何与冪定律概率分布有关的事物的参考。
事实速览 参数, 值域 ...
齐夫定律
概率质量函數 横纵坐标均为对数比例下,齐夫定律的概率质量函数的图像,其中N = 10。横坐标是指数k 。(注意,函数仅在k为整数时有定义,图上的连线不代表函数连续。) |
累積分布函數 横纵坐标均为对数比例下,齐夫定律的累计分布函数的图像,其中N = 10。横坐标是指数k 。(注意,函数仅在k为整数时有定义,图上的连线不代表函数连续。) |
参数 |
(实数) (正整数) |
---|
值域 |
|
---|
概率质量函数 |
|
---|
累積分布函數 |
|
---|
期望值 |
|
---|
眾數 |
|
---|
熵 |
|
---|
矩生成函数 |
|
---|
特徵函数 |
|
---|
关闭