Параметры | (целое число ). (вещественное ). (реальный ) | ||
---|---|---|---|
Поддержка | |||
PMF | |||
CDF | |||
Среднее | |||
Режим | |||
Энтропия |
В теории вероятностей и статистике, закон Ципфа – Мандельброта представляет собой дискретное распределение вероятностей. Также известное как Парето - закон Ципфа, это степенное распределение для ранжированных данных, названное в честь лингвиста Джорджа Кингсли Зипфа, который предложил более простое распределение под названием Закон Ципфа и математик Бенуа Мандельброт, который впоследствии обобщил его.
функция массы вероятности определяется как:
где определяется выражением:
, что можно рассматривать как обобщение номер гармоники. В формуле - это ранг данных, а и - параметры распределения. В пределе, когда приближается к бесконечности, это становится дзета-функцией Гурвица . Для конечных и закон Ципфа – Мандельброта становится законом Ципфа. Для бесконечного и он становится дзета-распределением.
Распределение слов, ранжированных по их частоте в случайном текстовый корпус аппроксимируется степенным распределением, известным как закон Ципфа.
. Если построить график частоты слов, содержащихся в корпусе среднего размера текстовых данных в зависимости от числа появлений или фактических частот, можно получить распределение по степенному закону с показателем, близким к единице (но см. Powers, 1998 и Gelbukh Sidorov, 2001). Закон Ципфа неявно предполагает фиксированный размер словаря, но Гармонический ряд с s = 1 не сходится, в то время как обобщение Ципфа-Мандельброта с s>1 сходится. Кроме того, есть свидетельства того, что закрытый класс функциональных слов, определяющих язык, подчиняется распределению Ципфа-Мандельброта с параметрами, отличными от открытых классов соответствующих слов, которые различаются в зависимости от темы, поля и регистра.
В экологической области В исследованиях распределение относительной численности (т. е. график количества наблюдаемых видов в зависимости от их численности) часто соответствует закону Ципфа-Мандельброта.
В музыке, многие метрики измерения "приятной" музыки соответствуют распределению Ципфа – Мандельброта.
| journal =
()