Ложноположительный рейтинг

редактировать

В статистике, при выполнении множественных сравнений, коэффициент ложных срабатываний (также известный как выпадение или коэффициент ложных тревог) - это вероятность ложного отклонения нулевой гипотезы для конкретного теста. Частота ложных срабатываний рассчитывается как отношение количества отрицательных событий, ошибочно классифицированных как положительные (ложные срабатывания), и общего количества фактических отрицательных событий (независимо от классификации).

Коэффициент ложных срабатываний (или «уровень ложных тревог») обычно относится к ожидаемому ложному срабатыванию, коэффициент .

Содержание

1 Определение
- 1.1 Классификация множественных проверок гипотез
2 Отличие от «частоты ошибок типа I» и других близких терминов
3 См. Также
4 Ссылки

Определение

Ложь положительный коэффициент равен $FPN = FPFP + TN {\ displaystyle {\ frac {\ mathrm {FP}} {N}} = {\ frac {\ mathrm {FP}} {\ mathrm {FP} + \ mathrm {TN }}}}$ ${\frac {\mathrm {FP} }{N}}={\frac {\mathrm {FP} }{\mathrm {FP} +\mathrm {TN} }}$

где $FP {\ displaystyle \ mathrm {FP}}$ $\mathrm {FP}$ - количество ложных срабатываний, $TN {\ displaystyle \ mathrm {TN}}$ $\mathrm {TN}$ - это количество истинных отрицаний, а $N = FP + TN {\ displaystyle N = \ mathrm {FP} + \ mathrm {TN}}$ $N=\mathrm {FP} +\mathrm {TN}$ - общее количество основных истинных отрицаний.

Уровень значимости, который используется для проверки каждой гипотезы, устанавливается на основе формы вывода (одновременный вывод против выборочного вывода ) и его вспомогательных критериев (например, FWER или FDR ), которые были предварительно определены исследователем.

При выполнении множественных сравнений в статистической структуре, такой как выше, коэффициент ложных срабатываний (также известный как ложная тревога коэффициент, в отличие от ложноположительных уровень / ложных тревог уровень ) обычно относится к вероятности ложного отклонения нулевой гипотезы для конкретного тест. Используя предложенную здесь терминологию, это просто $V / m 0 {\ displaystyle V / m_ {0}}$ $V/m_{0}$ .

Поскольку V - случайная величина и $m 0 {\ displaystyle m_ {0}}$ $m_{0}$ - константа ( $V ≤ m 0 {\ displaystyle V \ leq m_ {0}}$ $V\leq m_{0}$ ), ложное срабатывание ratio также является случайной величиной, в диапазоне от 0 до 1.. частота ложных срабатываний (или «частота ложных тревог») обычно относится к ожидаемому соотношению ложных срабатываний, выраженному как $E (В / м 0) {\ displaystyle E (V / m_ {0})}$ $E(V/m_{0})$ .

Следует отметить, что два определения («коэффициент ложных срабатываний» / «коэффициент ложных срабатываний») в некоторой степени взаимозаменяемы. Например, в упомянутой статье $V / m 0 {\ displaystyle V / m_ {0}}$ $V/m_{0}$ служит ложноположительным "коэффициентом", а не его "соотношением".

Классификация тестов нескольких гипотез

В следующей таблице определены возможные результаты при проверке нескольких нулевых гипотез. Предположим, у нас есть число m нулевых гипотез, обозначенных как: H 1, H 2,..., H m. Используя статистический тест , мы отклоняем нулевую гипотезу, если тест объявлен значимым. Мы не отвергаем нулевую гипотезу, если тест несущественен. Суммирование каждого типа результата по всем H i дает следующие случайные величины:

	Нулевая гипотеза верна (H 0)	Альтернативная гипотеза верна (H A)	Итого
Тест объявлен значимым	V	S	R
Тест объявлен незначительным	U	T	$m - R {\ displaystyle mR}$ $m - R$
Total	$m 0 {\ displaystyle m_ {0}}$ $m_{0}$	$m - m 0 {\ displaystyle m-m_ {0}}$ $m - m_0$	m

m - общее количество проверенных гипотез
$m 0 {\ displaystyle m_ {0}}$ $m_{0}$ - количество истинных нулевых гипотез, неизвестный параметр
$m - m 0 {\ displaystyle m-m_ {0}}$ $m - m_0$ - количество истинных альтернативных гипотез
V - количество ложных срабатываний (ошибка типа I) (также называемые «ложными открытиями»)
S - количество истинных положительных результатов (также называемых «истинными открытиями»)
T - количество ложноотрицательных (ошибка типа II)
U - количество истинных отрицаний
$R = V + S {\ displaystyle R = V + S}$ $R=V+S$ - количество отклонил нулевые гипотезы (также называемые «открытиями», либо истинными, либо r false)

В m проверках гипотез, из которых $m 0 {\ displaystyle m_ {0}}$ $m_{0}$ - истинные нулевые гипотезы, R - наблюдаемая случайная величина, а S, T, U, и V - ненаблюдаемые случайные величины.

Отличие от «коэффициента ошибок I типа» и других близких значений

В то время как частота ложных срабатываний математически равна ошибке I типа, он рассматривается как отдельный термин по следующим причинам:

Уровень ошибки типа I часто связан с априорной настройкой уровня значимости исследователем: уровень значимости представляет собой приемлемую частоту ошибок с учетом того, что все нулевые гипотезы верны («глобальная нулевая» гипотеза). Таким образом, выбор уровня значимости может быть несколько произвольным (например, установка 10% (0,1), 5% (0,05), 1% (0,01) и т. д.)

В отличие от этого, частота ложных срабатываний связана с пост-предшествующий результат, который представляет собой ожидаемое количество ложных срабатываний, разделенное на общее количество гипотез при действительной комбинации истинных и ложных нулевых гипотез (без учета «глобального нуля» "гипотеза"). Поскольку частота ложных срабатываний - это параметр, который не контролируется исследователем, его нельзя идентифицировать с помощью уровня значимости.

Более того, частота ложных срабатываний обычно используется в отношении медицинского теста или диагностического устройства (т.е. «частота ложных срабатываний определенного диагностического устройства составляет 1% "), в то время как ошибка типа I - это термин, связанный со статистическими тестами, где значение слова" положительный результат "не так ясно (например," ошибка типа I теста составляет 1% "

Не следует путать частоту ложных срабатываний с коэффициентом ошибок в семье, который определяется как $FWER = Pr (V ≥ 1) {\ displaystyle \ mathrm {FWER} = \ Pr (V \ geq 1) \,}$ ${\mathrm {FWER}}=\Pr(V\geq 1)\,$ . По мере увеличения количества тестов частота ошибок в семье обычно сходится к 1, в то время как частота ложных срабатываний остается неизменной.

Наконец, важно отметить глубокую разницу между частотой ложных срабатываний и частотой ложных обнаружений : первый определяется как $E (В / м 0) { \ displaystyle E (V / m_ {0})}$ $E(V/m_{0})$ , второй определяется как $E (V / R) {\ displaystyle E (V / R)}$ $E(V/R)$ .

См. также

Ссылки

^Берк, Дональд; Брандейдж, Джон; Редфилд, Роберт (1988). «Измерение количества ложноположительных результатов в программе скрининга вирусных инфекций иммунодефицита человека». Медицинский журнал Новой Англии. 319 (15): 961–964. doi : 10.1056 / NEJM198810133191501. PMID 3419477.

=== !!! == Знак равно <2>E (V / R) <2><3>{\ displaystyle \ mathrm {TN}} <3><4>{\ displaystyle \ mathrm {FP}} <4><5>{\ displaystyle N = \ mathrm {FP} + \ mathrm {TN}} <5><6>V \ leq m_ {0} <6><7>m_ {0} <7><8>{\ displaystyle {\ frac {\ mathrm {FP}} {N}} = {\ frac {\ mathrm {FP}} {\ mathrm {FP} + \ mathrm {TN}}}} <8><9>E (В / м_ {0}) <9><10>{\ mathrm {FWER}} = \ Pr (V \ geq 1) \, <10><11>m - R <11><12>{\ displaystyle R = V + S} <12><13>В / м_ {0} <13><14>м - м_0 <14>html