В статистике, при выполнении множественных сравнений, коэффициент ложных срабатываний (также известный как выпадение или коэффициент ложных тревог) - это вероятность ложного отклонения нулевой гипотезы для конкретного теста. Частота ложных срабатываний рассчитывается как отношение количества отрицательных событий, ошибочно классифицированных как положительные (ложные срабатывания), и общего количества фактических отрицательных событий (независимо от классификации).
Коэффициент ложных срабатываний (или «уровень ложных тревог») обычно относится к ожидаемому ложному срабатыванию, коэффициент .
Содержание
- 1 Определение
- 1.1 Классификация множественных проверок гипотез
- 2 Отличие от «частоты ошибок типа I» и других близких терминов
- 3 См. Также
- 4 Ссылки
Определение
Ложь положительный коэффициент равен
где - количество ложных срабатываний, - это количество истинных отрицаний, а - общее количество основных истинных отрицаний.
Уровень значимости, который используется для проверки каждой гипотезы, устанавливается на основе формы вывода (одновременный вывод против выборочного вывода ) и его вспомогательных критериев (например, FWER или FDR ), которые были предварительно определены исследователем.
При выполнении множественных сравнений в статистической структуре, такой как выше, коэффициент ложных срабатываний (также известный как ложная тревога коэффициент, в отличие от ложноположительных уровень / ложных тревог уровень ) обычно относится к вероятности ложного отклонения нулевой гипотезы для конкретного тест. Используя предложенную здесь терминологию, это просто .
Поскольку V - случайная величина и - константа (), ложное срабатывание ratio также является случайной величиной, в диапазоне от 0 до 1.. частота ложных срабатываний (или «частота ложных тревог») обычно относится к ожидаемому соотношению ложных срабатываний, выраженному как .
Следует отметить, что два определения («коэффициент ложных срабатываний» / «коэффициент ложных срабатываний») в некоторой степени взаимозаменяемы. Например, в упомянутой статье служит ложноположительным "коэффициентом", а не его "соотношением".
Классификация тестов нескольких гипотез
В следующей таблице определены возможные результаты при проверке нескольких нулевых гипотез. Предположим, у нас есть число m нулевых гипотез, обозначенных как: H 1, H 2,..., H m. Используя статистический тест , мы отклоняем нулевую гипотезу, если тест объявлен значимым. Мы не отвергаем нулевую гипотезу, если тест несущественен. Суммирование каждого типа результата по всем H i дает следующие случайные величины:
| Нулевая гипотеза верна (H 0) | Альтернативная гипотеза верна (H A) | Итого |
---|
Тест объявлен значимым | V | S | R |
---|
Тест объявлен незначительным | U | T | |
---|
Total | | | m |
---|
- m - общее количество проверенных гипотез
- - количество истинных нулевых гипотез, неизвестный параметр
- - количество истинных альтернативных гипотез
- V - количество ложных срабатываний (ошибка типа I) (также называемые «ложными открытиями»)
- S - количество истинных положительных результатов (также называемых «истинными открытиями»)
- T - количество ложноотрицательных (ошибка типа II)
- U - количество истинных отрицаний
- - количество отклонил нулевые гипотезы (также называемые «открытиями», либо истинными, либо r false)
В m проверках гипотез, из которых - истинные нулевые гипотезы, R - наблюдаемая случайная величина, а S, T, U, и V - ненаблюдаемые случайные величины.
Отличие от «коэффициента ошибок I типа» и других близких значений
В то время как частота ложных срабатываний математически равна ошибке I типа, он рассматривается как отдельный термин по следующим причинам:
- Уровень ошибки типа I часто связан с априорной настройкой уровня значимости исследователем: уровень значимости представляет собой приемлемую частоту ошибок с учетом того, что все нулевые гипотезы верны («глобальная нулевая» гипотеза). Таким образом, выбор уровня значимости может быть несколько произвольным (например, установка 10% (0,1), 5% (0,05), 1% (0,01) и т. д.)
- В отличие от этого, частота ложных срабатываний связана с пост-предшествующий результат, который представляет собой ожидаемое количество ложных срабатываний, разделенное на общее количество гипотез при действительной комбинации истинных и ложных нулевых гипотез (без учета «глобального нуля» "гипотеза"). Поскольку частота ложных срабатываний - это параметр, который не контролируется исследователем, его нельзя идентифицировать с помощью уровня значимости.
- Более того, частота ложных срабатываний обычно используется в отношении медицинского теста или диагностического устройства (т.е. «частота ложных срабатываний определенного диагностического устройства составляет 1% "), в то время как ошибка типа I - это термин, связанный со статистическими тестами, где значение слова" положительный результат "не так ясно (например," ошибка типа I теста составляет 1% "
Не следует путать частоту ложных срабатываний с коэффициентом ошибок в семье, который определяется как . По мере увеличения количества тестов частота ошибок в семье обычно сходится к 1, в то время как частота ложных срабатываний остается неизменной.
Наконец, важно отметить глубокую разницу между частотой ложных срабатываний и частотой ложных обнаружений : первый определяется как , второй определяется как .
См. также
Ссылки
- ^Берк, Дональд; Брандейдж, Джон; Редфилд, Роберт (1988). «Измерение количества ложноположительных результатов в программе скрининга вирусных инфекций иммунодефицита человека». Медицинский журнал Новой Англии. 319 (15): 961–964. doi : 10.1056 / NEJM198810133191501. PMID 3419477.
=== !!! == Знак равно <2>E (V / R) <2><3>{\ displaystyle \ mathrm {TN}} <3><4>{\ displaystyle \ mathrm {FP}} <4><5>{\ displaystyle N = \ mathrm {FP} + \ mathrm {TN}} <5><6>V \ leq m_ {0} <6><7>m_ {0} <7><8>{\ displaystyle {\ frac {\ mathrm {FP}} {N}} = {\ frac {\ mathrm {FP}} {\ mathrm {FP} + \ mathrm {TN}}}} <8><9>E (В / м_ {0}) <9><10>{\ mathrm {FWER}} = \ Pr (V \ geq 1) \, <10><11>m - R <11><12>{\ displaystyle R = V + S} <12><13>В / м_ {0} <13><14>м - м_0 <14>html