Ошибка базовой ставки

редактировать

Статистическая формальная ошибка

Ошибка базовой ставки, также называемая базовой пренебрежение оценкой или отклонение базовой ставки, является ошибкой. При представлении связанной информации базовой ставки (т. Е. Общей информации о распространенности) и конкретной информации (т. Е. Информации, относящейся только к конкретному случаю) люди склонны игнорировать базовую ставку в пользу индивидуальной информации, вместо правильного объединения двух.

Пренебрежение базовой скоростью - это конкретная форма более общего пренебрежения расширением.

Содержание

1 Ложноположительный парадокс
2 Примеры
- 2.1 Пример 1: Болезнь
  - 2.1.1 Население с высокой заболеваемостью
  - 2.1.2 Население с низкой заболеваемостью
- 2.2 Пример 2: Водители в нетрезвом виде
- 2.3 Пример 3: Идентификация террористов
3 Выводы по психологии
4 См. Также
5 Ссылки
6 Внешние ссылки

Парадокс ложных срабатываний

Примером ошибки базовой ставки является то, насколько удивлены люди парадоксом ложных срабатываний, ситуации, когда имеется больше ложноположительных результатов теста, чем истинно-положительных. Например, это может быть так, что из 1000 человек, прошедших тестирование на инфекцию, 50 из них дали положительный результат на наличие инфекции, но это связано с тем, что у 10 действительно она была и у 40 ошибочных результатов тестов, потому что только 10 человек из тех, кто прошел тестирование, действительно инфицированы. но тест иногда дает ложные результаты. Вероятность положительного результата теста определяется не только точностью теста, но и характеристиками выборки. Когда распространенность, доля тех, у кого есть данное заболевание, ниже, чем уровень ложноположительных результатов теста, даже тесты, которые имеют очень низкий шанс дать ложноположительный результат в отдельном случае, будут давать больше ложных результатов. чем истинных положительных результатов в целом. Парадокс удивляет большинство людей.

Это особенно противоречит интуиции при интерпретации положительного результата теста на низкой распространенности популяции после того, как имеешь дело с положительными результатами, полученными из высокой распространенности. численность населения. Если ложноположительный уровень теста выше, чем доля новой популяции с заболеванием, то администратор теста, чей опыт был получен в результате тестирования в популяции с высокой распространенностью, может сделать вывод из Опыт, что положительный результат теста обычно указывает на положительный результат, тогда как на самом деле ложноположительный результат гораздо более вероятен.

Примеры

Пример 1: Болезнь

Население с высокой заболеваемостью

Количество. людей	Инфицированные	Незараженные	Всего
Тест. положительный	400. (истинно положительный)	30. (ложноположительный)	430
Тест. отрицательный	0. (ложноотрицательный)	570. (истинно отрицательный)	570
Всего	400	600	1000

Представьте, что вы проводите тест на инфекционное заболевание в популяции A из 1000 человек, 40% из которых инфицированы. Уровень ложноположительных результатов теста составляет 5% (0,05), а количество ложноотрицательных результатов отсутствует. ожидаемый результат из 1000 тестов в популяции A будет:

инфицировано, и тест указывает на болезнь (истинно положительный )

1000 × 40/100 = 400 человек получат истинно положительный результат

Незараженные и тест указывает на болезнь (ложноположительный)

1000 × 100 - 40/100 × 0,05 = 30 человек получат ложноположительный результат

Остальные 570 тестов правильно отрицательны.

Итак, в популяции A человек, получивший положительный результат теста, может быть уверен более чем на 93% (400/30 + 400), что он правильно указывает на инфекцию.

Население с низкой заболеваемостью

Количество. людей	Зараженные	Неинфицированные	Всего
Тест. положительный	20. (истинно положительный)	49. (ложноположительный)	69
Тест. отрицательный	0. (ложноотрицательный)	931. (истинно отрицательный)	931
Итого	20	980	1000

Теперь рассмотрим тот же тест, примененный к популяции B, в которой инфицировано только 2%. ожидаемый результат 1000 тестов в популяции B будет:

Заражено a -й тест указывает на болезнь (истинно положительный )

1000 × 2/100 = 20 человек получат истинно положительный результат

Неинфицированные, а тест указывает на болезнь (ложноположительный)

1000 × 100 - 2 / 100 × 0,05 = 49 человек получат ложноположительный результат

Остальные 931 (= 1000 - (49 + 20)) теста являются правильно отрицательными.

В популяции B только 20 из 69 человек с положительным результатом теста результат действительно заражены. Таким образом, вероятность действительно заразиться после того, как кому-то сказали, что он инфицирован, составляет всего 29% (20/20 + 49) для теста, который в противном случае кажется «точным на 95%».

Тестировщик, имеющий опыт работы с группой A, может найти парадокс в том, что в группе B результат, который обычно правильно указывал на инфекцию, теперь обычно является ложноположительным. Смешение апостериорной вероятности заражения с априорной вероятностью получения ложноположительного результата является естественной ошибкой после получения угрожающего здоровью результата теста.

Пример 2: Пьяные водители

У группы полицейских есть алкотестеры, показывающие ложное опьянение в 5% случаев, когда водитель трезв. Однако алкотестеры всегда обнаруживают по-настоящему пьяного человека. Один из тысячи водителей водит машину в нетрезвом виде. Предположим, полицейские наугад останавливают водителя, чтобы провести тест алкотестера. Это указывает на то, что водитель пьян. Мы предполагаем, что вы ничего о них не знаете. Насколько высока вероятность того, что они действительно пьяны?

Многие ответят как 95%, но правильная вероятность составляет около 2%.

Объяснение этому следующее: в среднем на каждую 1000 протестированных водителей

1 водитель находится в состоянии алкогольного опьянения, и 100% уверенности в том, что для этого драйвера существует истинно положительный результат теста, поэтому имеется 1 истинно положительный результат теста
999 водителей не находятся в состоянии алкогольного опьянения, и среди этих водителей имеется 5% ложноположительных результатов испытаний, поэтому имеется 49,95 ложноположительных результатов испытаний

Следовательно, вероятность того, что один из водители среди положительных результатов теста 1 + 49,95 = 50,95 действительно пьяны $1 / 50,95 ≈ 0,019627 {\ displaystyle 1 / 50.95 \ приблизительно 0,019627}$ ${\ displaystyle 1 / 50.95 \ приблизительно 0,019627}$ .

Однако достоверность этого результата зависит от достоверности Из первоначального предположения, что полицейский остановил водителя действительно случайно, а не из-за плохого вождения. Если присутствовала та или иная непроизвольная причина остановки водителя, то в расчет также включается вероятность того, что водитель в состоянии алкогольного опьянения будет управлять автомобилем грамотно, а водитель в нетрезвом виде водит (не) компетентно.

Более формально такая же вероятность примерно 0,02 может быть установлена с помощью теоремы Байеса. Цель состоит в том, чтобы найти вероятность того, что водитель пьян, учитывая, что алкотестер показал, что он пьян, что может быть представлено как

p (пьяный ∣ D) {\ displaystyle p (\ mathrm {drunk} \ mid D)}

{\ displaystyle p (\ mathrm {пьяный} \ mid D)}

где D означает, что алкотестер показывает, что водитель пьян. Теорема Байеса говорит нам, что

p (d r u n k ∣ D) = p (D ∣ d r u n k) p (d r u n k) p (D). {\ displaystyle p (\ mathrm {drunk} \ mid D) = {\ frac {p (D \ mid \ mathrm {drunk}) \, p (\ mathrm {drunk})} {p (D)}}.}.

{\ displaystyle p (\ mathrm {drunk} \ mid D) = {\ frac {p ( D \ mid \ mathrm {drunk}) \, p (\ mathrm {drunk})} {p (D)}}.}

В первом абзаце нам сказали следующее:

p (пьяный) = 0,001, {\ displaystyle p (\ mathrm {drunk}) = 0,001,}

{\ displaystyle p (\ mathrm {drunk}) = 0,001,}

p (трезвый) = 0,999, {\ displaystyle p (\ mathrm {sober}) = 0,999,}

{\ displaystyle p (\ mathrm {sober}) = 0,999,}

p (D ∣ drunk) = 1,00, {\ displaystyle p (D \ mid \ mathrm {drunk}) = 1,00,}

{\ displaystyle p (D \ mid \ mathrm {drunk}) = 1,00,}

p (D трезвый) = 0,05. {\ displaystyle p (D \ mid \ mathrm {sober}) = 0,05.}

{\ displaystyle p (D \ mid \ mathrm {sober}) = 0,05.}

Как видно из формулы, для теоремы Байеса требуется p (D), которую можно вычислить из предыдущих значений с помощью закон полной вероятности :

p (D) = p (D ∣ пьяный) p (пьяный) + p (D ∣ трезвый) p (трезвый) {\ displaystyle p (D) = p (D \ mid \ mathrm {drunk}) \, p (\ mathrm {drunk}) + p (D \ mid \ mathrm {sober}) \, p (\ mathrm {sober})}

{\ displaystyle p (D) = p (D \ mid \ mathrm {drunk}) \, p (\ mathrm {drunk}) + p (D \ mid \ mathrm {sober}) \, п (\ mathrm {трезвый})}

, что дает

p (D) = (1,00 × 0,001) + (0,05 × 0,999) = 0,05095. {\ displaystyle p (D) = (1,00 \ times 0,001) + (0,05 \ times 0,999) = 0,05095.}

{\ displaystyle p (D) = ( 1,00 \ раз 0,001) + (0,05 \ раз 0,999) = 0,05095.}

Подставляя эти числа в теорему Байеса, мы получаем, что

p (drunk ∣ D) = 1,00 × 0,001 0,05095 = 0,019627. {\ displaystyle p (\ mathrm {drunk} \ mid D) = {\ frac {1,00 \ times 0,001} {0,05095}} = 0,019627.}

{\ displaystyle p (\ mathrm {drunk} \ mid D) = {\ frac {1,00 \ раз 0,001} {0,05095}} = 0,0 19627.}

Пример 3: идентификация террориста

В городе 1 миллион жителей пусть будет 100 террористов и 999 900 нетеррористов. Для упрощения примера предполагается, что все люди, присутствующие в городе, являются его жителями. Таким образом, базовая вероятность того, что случайно выбранный житель города является террористом, равна 0,0001, а базовая вероятность того, что этот же житель не является террористом, равна 0,9999. В попытке поймать террористов город устанавливает систему сигнализации с камерой наблюдения и автоматическим программным обеспечением для распознавания лиц.

. Программное обеспечение имеет два уровня отказов по 1%:

Уровень ложных отрицательных результатов: если камера сканирует террориста, звонок будет звонить в 99% случаев, и он не будет звонить в 1% случаев.
Частота ложных срабатываний: если камера сканирует человека, не являющегося террористом, звонок не будет звонит 99% времени, но он будет звонить 1% времени.

Предположим теперь, что житель вызывает тревогу. Какова вероятность того, что это террорист? Другими словами, что такое P (T | B), вероятность того, что террорист был обнаружен при звонке в колокол? Кто-то, делающий «ошибку базовой ставки», сделает вывод о том, что с вероятностью 99% обнаруженный человек является террористом. Хотя этот вывод кажется логичным, на самом деле это неверное рассуждение, и приведенный ниже расчет покажет, что вероятность того, что они террористы, на самом деле составляет около 1%, а не около 99%.

Заблуждение возникает из-за смешения природы двух разных уровней отказов. «Количество не-колоколов на 100 террористов» и «количество нетеррористов на 100 колоколов» не связаны между собой. Один не обязательно равен другому, и они даже не обязательно должны быть почти равными. Чтобы продемонстрировать это, представьте, что произойдет, если во втором городе, где террористов вообще нет, была бы установлена идентичная система сигнализации. Как и в первом городе, тревога звучит для 1 из каждых 100 обнаруженных жителей, не являющихся террористами, но, в отличие от первого города, тревога никогда не звучит для террористов. Таким образом, 100% всех случаев срабатывания сигнализации относятся к нетеррористам, но ложноотрицательный показатель даже не может быть подсчитан. «Число нетеррористов на 100 колоколов» в этом городе равно 100, но P (T | B) = 0%. При звонке в колокол вероятность того, что террорист был обнаружен, равна нулю.

Представьте себе, что перед камерой проходит весь миллион жителей первого города. Около 99 из 100 террористов вызовут тревогу, равно как и около 9 999 из 999 900 нетеррористов. Таким образом, тревогу сработают около 10 098 человек, среди которых около 99 - террористы. Таким образом, вероятность того, что человек, вызвавший тревогу, на самом деле является террористом, составляет всего около 99 из 10 098, что меньше 1% и очень, очень сильно ниже нашего первоначального предположения в 99%.

Ошибка базовой ставки в этом примере вводит в заблуждение, потому что нетеррористов намного больше, чем террористов, а количество ложных срабатываний (нетеррористы сканируются как террористы) намного больше, чем истинных срабатываний ( реальное количество террористов).

Выводы по психологии

В ходе экспериментов было обнаружено, что люди предпочитают индивидуальную информацию общей информации, когда первая доступна.

В некоторых экспериментах студентов просили оценить средний балл (GPA) гипотетических студентов. Получая соответствующую статистику о распределении среднего балла, учащиеся, как правило, игнорировали ее, если давали описательную информацию о конкретном учащемся, даже если новая описательная информация явно не имела отношения к успеваемости в школе или не имела никакого отношения к ней. Этот вывод был использован, чтобы доказать, что собеседования являются ненужной частью процесса поступления в колледж, потому что интервьюеры не могут выбрать успешных кандидатов лучше, чем базовая статистика.

Психологи Дэниел Канеман и Амос Тверски попытались объяснить это открытие с помощью простого правила или «эвристики», называемого репрезентативностью.. Они утверждали, что многие суждения, касающиеся вероятности или причины и следствия, основаны на том, насколько одно репрезентативно для другого или для категории. Канеман считает, что пренебрежение базовой ставкой является особой формой пренебрежения расширением. Ричард Нисбетт утверждал, что некоторые предубеждения при атрибуции, такие как фундаментальная ошибка атрибуции являются примерами ошибки базовой ставки: люди не используют «консенсусную информацию» («базовую оценку») о том, как другие вели себя в аналогичных ситуациях, а вместо этого предпочитают более простые диспозиционные атрибуции.

В психологии ведутся серьезные споры об условиях, при которых люди ценят или не ценят информацию о базовой ставке. Исследователи программы эвристики и систематических ошибок подчеркнули эмпирические данные, показывающие, что люди склонны игнорировать базовые ставки и делать выводы, нарушающие определенные нормы вероятностного рассуждения, такие как теорема Байеса. Вывод, сделанный на основании этого направления исследований, заключался в том, что вероятностное мышление человека в корне ошибочно и подвержено ошибкам. Другие исследователи подчеркнули связь между когнитивными процессами и форматами информации, утверждая, что такие выводы обычно не являются обоснованными.

Еще раз рассмотрим пример 2, приведенный выше. Требуемый вывод заключается в оценке (апостериорной) вероятности того, что (случайно выбранный) водитель находится в состоянии алкогольного опьянения, при условии, что тест алкотестера положительный. Формально эту вероятность можно рассчитать с помощью теоремы Байеса, как показано выше. Однако существуют разные способы представления соответствующей информации. Рассмотрим следующий формально эквивалентный вариант проблемы:

1 из 1000 водителей водит машину в нетрезвом виде. Алкотестеры никогда не перестают определять по-настоящему пьяного человека. Для 50 из 999 водителей, не находящихся в состоянии алкогольного опьянения, алкотестер ложно показывает состояние опьянения. Предположим, полицейские наугад останавливают водителя и заставляют его пройти тест алкотестера. Это указывает на то, что они пьяны. Мы предполагаем, что вы ничего о них не знаете. Насколько высока вероятность, что они действительно пьяны?

В этом случае соответствующая числовая информация - p (пьяный), p (D | пьяный), p (D | трезвый) - представлена в виде собственных частот относительно к определенному эталонному классу (см. проблема эталонного класса ). Эмпирические исследования показывают, что выводы людей в большей степени соответствуют правилу Байеса, когда информация представлена таким образом, что помогает преодолеть пренебрежение базовой оценкой со стороны непрофессионалов и экспертов. Как следствие, такие организации, как Cochrane Collaboration, рекомендуют использовать такой формат для передачи статистики здравоохранения. Учить людей переводить подобные байесовские задачи мышления в форматы собственных частот более эффективно, чем просто учить их подставлять вероятности (или проценты) в теорему Байеса. Также было показано, что графическое представление собственных частот (например, массив значков) помогает людям делать более точные выводы.

Почему полезны форматы собственных частот? Одна из важных причин заключается в том, что этот формат информации облегчает требуемый вывод, поскольку упрощает необходимые вычисления. Это можно увидеть, используя альтернативный способ вычисления требуемой вероятности p (пьяный | D):

p (пьян ∣ D) = N (пьян ∩ D) N (D) = 1 51 = 0,0196 {\ displaystyle p (\ mathrm {drunk} \ mid D) = {\ frac {N (\ mathrm {drunk} \ cap D)} {N (D)}} = {\ frac {1} {51}} = 0,0196}

{\ displaystyle p (\ mathrm {drunk} \ mid D) = {\ frac {N (\ mathrm {drunk} \ cap D)} {N (D)}} = {\ frac {1 } {51}} = 0,0196}

где N (пьяный ∩ D) обозначает количество пьяных водителей, получивших положительный результат алкотестера, а N (D) обозначает общее количество случаев с положительным результатом алкотестера. Эквивалентность этого уравнения предыдущему следует из аксиом теории вероятностей, согласно которой N (drunk ∩ D) = N × p (D | drunk) × p (drunk). Важно отметить, что хотя это уравнение формально эквивалентно правилу Байеса, психологически оно не эквивалентно. Использование собственных частот упрощает вывод, поскольку требуемая математическая операция может выполняться с натуральными числами, а не с нормализованными дробями (т. Е. Вероятностями), поскольку это делает большое количество ложных срабатываний более прозрачным, и поскольку собственные частоты демонстрируют «вложенный набор» структура ".

Не каждый частотный формат позволяет использовать байесовские рассуждения. Собственные частоты относятся к информации о частоте, которая является результатом естественной выборки, которая сохраняет информацию о базовой скорости (например, количество пьяных водителей при выборке случайной выборки водителей). Это отличается от систематической выборки, в которой базовые ставки фиксируются априори (например, в научных экспериментах). В последнем случае невозможно вывести апостериорную вероятность p (пьяный | положительный тест) из сравнения количества пьяных водителей с положительным результатом теста по сравнению с общим количеством людей, получивших положительный результат алкотестера, потому что информация о базовой скорости не сохраняется и должен быть явно повторно введен с использованием теоремы Байеса.

См. Также

Байесовская вероятность
Теорема Байеса
Извлечение данных
Индуктивный аргумент
Список когнитивных предубеждений
Список парадоксов
Вводящая в заблуждение яркость
Парадокс предотвращения
Заблуждение прокурора, ошибка в рассуждениях, включающая игнорирование низкой априорной вероятности
парадокса Симпсона, еще одна ошибка в статистических рассуждениях, касающихся сравнения групп
стереотип

Ссылки

Внешние ссылки

Ошибка базовой ставки Файлы ошибок