Статистика Юдена J

редактировать

J-статистика Юдена (также называемая индексом Юдена ) - это отдельная статистика, которая фиксирует эффективность дихотомического диагностического теста. Информированность - это ее обобщение на мультиклассовый случай и оценивает вероятность обоснованного решения.

Определение

Статистика Юдена J составляет

{\ displaystyle J = {\ text {чувствительность}} + {\ text {специфичность}} - 1}

{\ displaystyle J = {\ text {чувствительность}} + {\ text {специфичность}} - 1}

где две правые величины - это чувствительность и специфичность. Таким образом, расширенная формула:

{\ displaystyle J = {\ frac {\ text {истинные положительные результаты}} {{\ text {истинные положительные результаты}} + {\ text {ложные отрицательные результаты}}}} + {\ frac {\ text {истинные отрицательные результаты}} {{ \ text {истинные отрицательные результаты}} + {\ text {ложные срабатывания}}}} - 1}

{\ displaystyle J = {\ frac {\ text {истинные положительные результаты}} {{\ text {истинные положительные результаты}} + {\ text {ложные отрицательные результаты}}}} + {\ frac {\ text {истинные отрицательные результаты}} {{ \ text {истинные отрицательные результаты}} + {\ text {ложные срабатывания}}}} - 1}

Индекс был предложен В. Дж. Юденом в 1950 году как способ обобщения результатов диагностического теста. Его значение находится в диапазоне от 0 до 1 (включительно) и имеет нулевое значение, когда диагностический тест дает одинаковую долю положительных результатов для групп с заболеванием и без него, т. Е. Тест бесполезен. Значение 1 указывает на отсутствие ложных срабатываний или ложных отрицательных результатов, т. Е. Тест идеален. Индекс дает равный вес ложноположительным и ложноотрицательным значениям, поэтому все тесты с одинаковым значением индекса дают одинаковую долю от общего числа неверно классифицированных результатов. Хотя технически возможно получить значение меньше нуля из этого уравнения, например, классификация дает только ложноположительные и ложноотрицательные значения, значение меньше нуля просто указывает на то, что положительные и отрицательные метки поменялись местами. После исправления меток результат будет в диапазоне от 0 до 1.

Пример кривой рабочих характеристик приемника. Сплошной красный: кривая ROC; Пунктирная линия: уровень вероятности; Вертикальная линия (J) максимальное значение индекса Юдена для кривой ROC

Индекс Юдена часто используется вместе с анализом рабочих характеристик приемника (ROC). Индекс определяется для всех точек кривой ROC, и максимальное значение индекса может использоваться в качестве критерия для выбора оптимальной точки отсечения, когда диагностический тест дает числовой, а не дихотомический результат. Индекс представлен графически в виде высоты над случайной линией, а также эквивалентен площади под кривой, охватываемой одной рабочей точкой.

Индекс Юдена также известен как deltaP и обобщается от дихотомического к мультиклассовому случаю как информированность.

Использование одного индекса «обычно не рекомендуется», но информированность или индекс Юдена - это вероятность принятия обоснованного решения (в отличие от случайного предположения), учитывающего все прогнозы.

Несвязанная, но обычно используемая комбинация основных статистических данных по поиску информации - это F-балл, представляющий собой (возможно, взвешенное) гармоническое среднее значение отзыва и точности, где отзыв = чувствительность = истинно положительный показатель, но специфичность и точность - это совершенно разные показатели. F-оценка, как и отзыв и точность, рассматривает только так называемые положительные прогнозы, при этом отзыв представляет собой вероятность предсказания только положительного класса, точность представляет собой вероятность того, что положительное предсказание окажется правильным, а F-оценка, приравнивающая эти вероятности к эффективное предположение о том, что положительные ярлыки и положительные прогнозы должны иметь одинаковое распределение и распространенность, аналогично предположению, лежащему в основе каппа Флейса. J Юдена, информированность, отзывчивость, точность и F-оценка по своей сути являются ненаправленными и направлены на оценку дедуктивной эффективности прогнозов в направлении, предлагаемом правилом, теорией или классификатором. Маркированность (deltaP) - это индекс Юдена, используемый для оценки обратного или абдуктивного направления, и хорошо соответствует человеческому изучению ассоциаций ; правила и суеверия как модели возможной причинности ; в то время как корреляция и каппа оцениваются двунаправленно.

Коэффициент корреляции Мэттьюз является геометрическое среднее из коэффициента регрессии этой проблемы и ее двойного, где составные коэффициенты регрессии коэффициента корреляции Matthews являются маркированностью (обратная J Youden или deltaP) и информированность (Дж Youden или deltaP '). Статистика Каппы, такие как каппа Фляйсса и каппа Коэна являются методами расчета надежности между оценщиками на основе различных предположений о маргинальных или априорных распределениях, и все чаще используются как шанс исправлена альтернатива точности в других контекстах. Каппа Фляйсс, как F-счет, предполагает, что обе переменные взяты из того же распределения, и, таким образом, имеют один и тот же ожидаемый показатель распространенности, в то время как каппа Коэна предполагает, что переменные взяты из различных распределений и ссылки на модели ожидания, что предполагает распространенность являются независимый.

Когда истинные распространенности для двух положительных переменных равны, как предполагается в каппе Флейса и F-score, то есть количество положительных прогнозов совпадает с количеством положительных классов в дихотомическом (двухклассном) случае, различная каппа и мера корреляции разрушаются. чтобы отождествить с J Юдена, и отзыв, точность и F-оценка аналогичным образом идентичны с точностью.

Рекомендации

^ ^а ^б Youden, WJ (1950). «Индекс рейтинговых диагностических тестов». Рак. 3 : 32–35. DOI : 10.1002 / 1097-0142 (1950) 3: 1 lt;32:: помощь-cncr2820030106gt; 3.0.co; 2-3. PMID 15405679.
^ Шистерман, EF; Перкинс, штат Нью-Джерси; Лю, А.; Бонделл, Х. (2005). «Оптимальная точка отсечения и соответствующий ей индекс Юдена для различения людей с использованием объединенных образцов крови». Эпидемиология. 16 (1): 73–81. DOI : 10,1097 / 01.ede.0000147512.81966.ba. PMID 15613948.
^ ^Б^с^д^е^е Пауэрс, Дэвид МВт (2011). «Оценка: от точности, запоминания и оценки F до ROC, информированности, значимости и корреляции». Журнал технологий машинного обучения. 2 (1): 37–63. hdl : 2328/27165.
^ ^a ^b Perruchet, P.; Переман, Р. (2004). «Использование распределительной информации при обработке слогов». J. Нейролингвистика. 17 (2–3): 97–119. DOI : 10.1016 / s0911-6044 (03) 00059-9.
^ Everitt BS (2002) Кембриджский статистический словарь. КУБОК ISBN 0-521-81099-X
^ ^a ^b ^c Пауэрс, Дэвид М.В. (2012). Проблема с Каппой. Конференция европейского отделения Ассоциации компьютерной лингвистики. С. 345–355. hdl : 2328/27160.