A рейтинг - это взаимосвязь между набором элементов, такая, что для любых двух элементов, первый либо «ранжируется выше, чем», «ранжируется ниже, чем», либо «оценивается как равный» второму. В математике это известно как слабый порядок или общий предварительный порядок объектов. Это не обязательно общий порядок объектов, потому что два разных объекта могут иметь одинаковый рейтинг. Сами рейтинги полностью упорядочены. Например, материалы полностью упорядочены по твердости , тогда как степени твердости полностью заказаны. Если два предмета имеют одинаковый ранг, это считается ничьей.
Сокращая подробные измерения до последовательности порядковых чисел, ранжирование позволяет оценивать сложную информацию по определенным критериям. Таким образом, например, поисковая машина в Интернете может ранжировать найденные страницы в соответствии с оценкой их релевантности, давая пользователю возможность быстро выбирать страницы, которые он, вероятно, захочет увидеть.
Для анализа данных, полученных путем ранжирования, обычно требуется непараметрическая статистика.
Не всегда возможно однозначно присвоить рейтинги. Например, в гонке или соревновании два (или более) участника могут претендовать на место в рейтинге. При вычислении порядкового измерения две (или более) ранжируемых величины могут быть равными. В этих случаях может быть принята одна из приведенных ниже стратегий для присвоения рейтингов. Распространенный сокращенный способ отличить эти стратегии ранжирования - это числа ранжирования, которые будут получены для четырех элементов, при этом первый элемент занимает первое место по сравнению со вторым, а третий (которые сравниваются одинаково), которые оба занимают место впереди четвертого. Эти имена также показаны ниже.
В конкурентном рейтинге элементы, которые сравнивают равные, получают одинаковый рейтинг, а затем в номерах рейтинга остается пробел. Число ранжируемых номеров, оставленных в этом промежутке, на единицу меньше числа сравниваемых элементов, равных. Эквивалентно, номер рейтинга каждого элемента равен 1 плюс количество элементов, ранжированных выше него. Эта стратегия ранжирования часто применяется для соревнований, так как это означает, что если два (или более) спортсмена занимают место в рейтинге, положение всех тех, кто занимает место ниже, не изменяется (т. Е. Участник становится вторым только в том случае, если ровно один человек набирает больше, чем они, третье, если ровно два человека набирают больше, чем они, четвертое, если ровно три человека набирают больше, чем они, и т. д.).
Таким образом, если A занимает место впереди B и C (которые сравнивают равные), которые оба занимают место впереди D, тогда A получает рейтинг номер 1 ("первый"), B получает номер рейтинга 2 ("совместный второй"), C также получает рейтинг 2 («совместная секунда»), а D - номер 4 («четвертый»).
Иногда для ранжирования соревнования оставляют пробелы в номерах ранжирования перед наборами элементов равного ранга (а не после них, как в стандартный рейтинг конкурса). Число ранжируемых номеров, оставленных в этом промежутке, остается на единицу меньше числа сравниваемых элементов, равных. Эквивалентно, номер ранжирования каждого элемента равен количеству элементов, ранжированных равным ему или выше. Такой рейтинг гарантирует, что участник занимает второе место только в том случае, если он набирает больше всех своих противников, кроме одного, третье, если он набирает больше, чем все его противники, кроме двух, и т. Д.
Таким образом, если A занимает первое место над B и C (которые сравнивают равные), которые оба занимают первое место в D, тогда A получает рейтинг 1 ("первый"), B получает рейтинг номер 3 ("совместная третья"), C также получает рейтинг-номер 3 ("совместная третья") и D получает рейтинг 4 («четвертый»). В этом случае никто не получит рейтинг 2 («второй»), и это останется как пробел.
При плотном ранжировании элементы, которые сравниваются в равной степени, получают одинаковый ранговый номер, а следующий (-ые) элемент (-ы) получает следующий за ним ранговый номер. Эквивалентно, номер ранжирования каждого элемента равен 1 плюс количество элементов, ранжированных выше него, которые различаются по порядку ранжирования.
Таким образом, если A занимает место впереди B и C (которые сравнивают равные), которые оба занимают место выше D, тогда A получает рейтинг номер 1 («первый»), B получает номер рейтинга 2 («совместный второй»), C также получает рейтинг 2 («совместная секунда»), а D - номер 3 («третий»).
При порядковом ранжировании все элементы получают различные порядковые номера, включая элементы, которые сравниваются с равными. Присвоение различных порядковых номеров элементам, которые сравниваются одинаково, может выполняться случайным образом или произвольно, но обычно предпочтительно использовать произвольную, но последовательную систему, поскольку это дает стабильные результаты, если ранжирование выполняется несколько раз. Примером произвольной, но последовательной системы может быть включение других атрибутов в порядок ранжирования (таких как алфавитный порядок имени участника), чтобы гарантировать, что никакие два элемента не совпадают в точности.
С этой стратегией, если A занимает место впереди B и C (которые сравнивают равные), которые оба занимают место впереди D, тогда A получает рейтинг 1 ("первый"), а D получает рейтинг 4 (" четвертый "), и либо B получает ранжирующий номер 2 (" второй "), а C получает ранжирующий номер 3 (" третий "), либо C получает ранжирующий номер 2 (" второй ") и B получает рейтинг 3 («третий»).
При компьютерной обработке данных порядковое ранжирование также называется «нумерацией строк».
Элементы, которые сравнивают равные, получают одинаковый ранжирующий номер, который является средним того, что они имели бы под порядковым номером. рейтинги. Эквивалентно, номер ранжирования 1 плюс количество элементов, ранжированных выше него, плюс половина количества элементов, равных ему. Эта стратегия обладает тем свойством, что сумма номеров ранжирования такая же, как и при порядковом ранжировании. По этой причине он используется при вычислении количества Борда и в статистических тестах (см. Ниже).
Таким образом, если A опережает B и C (которые сравнивают равные), которые оба занимают место впереди D, то A получает рейтинг 1 ("первый"), B и C получают рейтинг 2,5 (средний «совместных второго / третьего»), а D получает рейтинг 4 («четвертый»).
Вот пример: Предположим, у вас есть набор данных 1.0, 1.0, 2.0, 3.0, 3.0, 4.0, 5.0, 5.0, 5.0.
Порядковые ранги: 1, 2, 3, 4, 5, 6, 7, 8, 9.
Для v = 1.0 дробный ранг является средним порядковым рангом: (1 + 2) / 2 = 1,5. Аналогичным образом для v = 5.0 дробный ранг равен (7 + 8 + 9) / 3 = 8.0.
Таким образом, дробные ранги следующие: 1.5, 1.5, 3.0, 4.5, 4.5, 6.0, 8.0, 8.0, 8.0
В статистике, ранжирование - это преобразование данных, в котором числовые или порядковые значения заменяются их рангом при сортировке данных. Например, наблюдаются числовые данные 3.4, 5.1, 2.6, 7.3, ранги этих элементов данных будут 2, 3, 1 и 4 соответственно. Например, порядковые данные горячий, холодный, теплый будут заменены на 3, 1, 2. В этих примерах ранги присваиваются значениям в порядке возрастания. (В некоторых других случаях используются нисходящие ранги.) Ранги связаны с индексированным списком статистики порядка, который состоит из исходного набора данных, переставленного в порядке возрастания.
Некоторые виды статистических тестов используют вычисления на основе рангов. Примеры включают:
Распределение значений в порядке убывания ранга часто представляет интерес, когда значения сильно различаются по шкале; это распределение ранга и размера (или распределение ранга-частоты), например, для размеров города или частоты слов. Они часто подчиняются степенному закону .
Некоторые ранги могут иметь нецелые значения для связанных значений данных. Например, когда имеется четное количество копий одного и того же значения данных, вышеописанный дробный статистический ранг связанных данных заканчивается на 1/2.
Microsoft Excel предоставляет две функции ранжирования: функцию Rank.EQ, которая присваивает соревновательные ранги («1224») и ранг. Функция AVG, которая назначает дробные ранги («1 2,5 2,5 4»), как описано выше.
A ранговая корреляция может использоваться для сравнения двух рейтингов для одного и того же набора объектов. Например, коэффициент ранговой корреляции Спирмена полезен для измерения статистической зависимости между рейтингами спортсменов в двух турнирах. Другой подход - коэффициент ранговой корреляции Кендалла. В качестве альтернативы подходы, основанные на пересечении / наложении, предлагают дополнительную гибкость. Одним из примеров является подход «гипергеометрическое перекрытие рангов и рангов», который разработан для сравнения ранжирования генов, находящихся на «вершине» двух упорядоченных списков дифференциально экспрессируемых генов. Аналогичный подход применяется в «перекрытии смещенного ранга (RBO)», который также реализует регулируемую вероятность p для настройки веса, назначаемого на желаемой глубине ранжирования. Эти подходы имеют преимущества адресации непересекающихся наборов, наборов разных размеров и максимальной взвешенности (с учетом позиции абсолютного ранжирования, которую можно игнорировать в стандартных подходах с невзвешенной ранговой корреляцией).
Найдите ranking в Wiktionary, бесплатном словаре. |