J-статистика Юдена (также называемая индексом Юдена ) - это отдельная статистика, которая фиксирует эффективность дихотомического диагностического теста. Информированность - это ее обобщение на мультиклассовый случай и оценивает вероятность обоснованного решения.
Статистика Юдена J составляет
где две правые величины - это чувствительность и специфичность. Таким образом, расширенная формула:
Индекс был предложен В. Дж. Юденом в 1950 году как способ обобщения результатов диагностического теста. Его значение находится в диапазоне от 0 до 1 (включительно) и имеет нулевое значение, когда диагностический тест дает одинаковую долю положительных результатов для групп с заболеванием и без него, т. Е. Тест бесполезен. Значение 1 указывает на отсутствие ложных срабатываний или ложных отрицательных результатов, т. Е. Тест идеален. Индекс дает равный вес ложноположительным и ложноотрицательным значениям, поэтому все тесты с одинаковым значением индекса дают одинаковую долю от общего числа неверно классифицированных результатов. Хотя технически возможно получить значение меньше нуля из этого уравнения, например, классификация дает только ложноположительные и ложноотрицательные значения, значение меньше нуля просто указывает на то, что положительные и отрицательные метки поменялись местами. После исправления меток результат будет в диапазоне от 0 до 1.
Пример кривой рабочих характеристик приемника. Сплошной красный: кривая ROC; Пунктирная линия: уровень вероятности; Вертикальная линия (J) максимальное значение индекса Юдена для кривой ROCИндекс Юдена часто используется вместе с анализом рабочих характеристик приемника (ROC). Индекс определяется для всех точек кривой ROC, и максимальное значение индекса может использоваться в качестве критерия для выбора оптимальной точки отсечения, когда диагностический тест дает числовой, а не дихотомический результат. Индекс представлен графически в виде высоты над случайной линией, а также эквивалентен площади под кривой, охватываемой одной рабочей точкой.
Индекс Юдена также известен как deltaP и обобщается от дихотомического к мультиклассовому случаю как информированность.
Использование одного индекса «обычно не рекомендуется», но информированность или индекс Юдена - это вероятность принятия обоснованного решения (в отличие от случайного предположения), учитывающего все прогнозы.
Несвязанная, но обычно используемая комбинация основных статистических данных по поиску информации - это F-балл, представляющий собой (возможно, взвешенное) гармоническое среднее значение отзыва и точности, где отзыв = чувствительность = истинно положительный показатель, но специфичность и точность - это совершенно разные показатели. F-оценка, как и отзыв и точность, рассматривает только так называемые положительные прогнозы, при этом отзыв представляет собой вероятность предсказания только положительного класса, точность представляет собой вероятность того, что положительное предсказание окажется правильным, а F-оценка, приравнивающая эти вероятности к эффективное предположение о том, что положительные ярлыки и положительные прогнозы должны иметь одинаковое распределение и распространенность, аналогично предположению, лежащему в основе каппа Флейса. J Юдена, информированность, отзывчивость, точность и F-оценка по своей сути являются ненаправленными и направлены на оценку дедуктивной эффективности прогнозов в направлении, предлагаемом правилом, теорией или классификатором. Маркированность (deltaP) - это индекс Юдена, используемый для оценки обратного или абдуктивного направления, и хорошо соответствует человеческому изучению ассоциаций ; правила и суеверия как модели возможной причинности ; в то время как корреляция и каппа оцениваются двунаправленно.
Коэффициент корреляции Мэттьюз является геометрическое среднее из коэффициента регрессии этой проблемы и ее двойного, где составные коэффициенты регрессии коэффициента корреляции Matthews являются маркированностью (обратная J Youden или deltaP) и информированность (Дж Youden или deltaP '). Статистика Каппы, такие как каппа Фляйсса и каппа Коэна являются методами расчета надежности между оценщиками на основе различных предположений о маргинальных или априорных распределениях, и все чаще используются как шанс исправлена альтернатива точности в других контекстах. Каппа Фляйсс, как F-счет, предполагает, что обе переменные взяты из того же распределения, и, таким образом, имеют один и тот же ожидаемый показатель распространенности, в то время как каппа Коэна предполагает, что переменные взяты из различных распределений и ссылки на модели ожидания, что предполагает распространенность являются независимый.
Когда истинные распространенности для двух положительных переменных равны, как предполагается в каппе Флейса и F-score, то есть количество положительных прогнозов совпадает с количеством положительных классов в дихотомическом (двухклассном) случае, различная каппа и мера корреляции разрушаются. чтобы отождествить с J Юдена, и отзыв, точность и F-оценка аналогичным образом идентичны с точностью.