В статистике, rankits набора данных являются ожидаемыми значениями статистики порядка выборки из стандартного нормального распределения того же размера, что и данные. Они в основном используются в графике нормальной вероятности, графическом методе для проверки нормальности.
Образец график нормальной вероятности ; Координаты горизонтальной оси - это ранги.Это, пожалуй, легче всего понять на примере. Если образец iid из шести элементов взят из нормально распределенной совокупности с ожидаемым значением 0 и дисперсией 1 (стандартное нормальное распределение ), а затем отсортированные в порядке возрастания, ожидаемые значения результирующей статистики порядка будут:
Предположим, что числами в наборе данных являются
Затем их можно отсортировать и выровнять с соответствующими рангами; в порядке
, что дает точки:
точка данных | rankit |
---|---|
16 | -1,2672 |
22 | -0,6418 |
40 | −0.2016 |
43 | 0.2016 |
65 | 0,6418 |
75 | 1,2672 |
Затем эти точки наносятся на график как вертикальные и горизонтальные координаты диаграммы рассеяния.
В качестве альтернативы, Вместо того, чтобы сортировать точки данных, их можно ранжировать и соответственно изменять ранжирование. Это дает те же пары чисел, но в другом порядке.
Для:
соответствующие ранги:
т.е., число, которое появляется первым, является 5-м наименьшим, число, появляющееся вторым, является 6-м наименьшим, число, которое появляется третьим, является наименьшим, число, появляющееся четвертым, является 2-м наименьшим и т. д. Соответственно изменяются ожидаемые статистические данные нормального порядка, получая ранг этого набора данных:
точка данных | ранг | рангит |
---|---|---|
65 | 5 | 0,6418 |
75 | 6 | 1,2672 |
16 | 1 | -1,2672 |
22 | 2 | -0,6418 |
43 | 4 | 0.2016 |
40 | 3 | −0.2016 |
График, отображающий ранжирование на горизонтальной оси и точки данных на вертикальной оси, называется графиком ранжирования или график нормальной вероятности. Такой сюжет обязательно неубывающий. В больших выборках из нормально распределенной совокупности такой график будет приближаться к прямой линии. Существенные отклонения от прямолинейности считаются свидетельством против нормальности распределения.
Графики Rankit обычно используются для визуальной демонстрации того, относятся ли данные к заданному распределению вероятностей.
График rankit - это своего рода график QQ - он отображает статистику порядка ( квантилей) выборки по отношению к определенным квантилям (рангитам) предполагаемого нормального распределения. Однако графики Q-Q могут использовать другие квантили для нормального распределения.
График рангита и слово рангит были введены биологом и статистиком Честером Иттнером Блиссом (1899–1979).