Ошибка базовой ставки, также называемая базовой пренебрежение оценкой или отклонение базовой ставки, является ошибкой. При представлении связанной информации базовой ставки (т. Е. Общей информации о распространенности) и конкретной информации (т. Е. Информации, относящейся только к конкретному случаю) люди склонны игнорировать базовую ставку в пользу индивидуальной информации, вместо правильного объединения двух.
Пренебрежение базовой скоростью - это конкретная форма более общего пренебрежения расширением.
Примером ошибки базовой ставки является то, насколько удивлены люди парадоксом ложных срабатываний, ситуации, когда имеется больше ложноположительных результатов теста, чем истинно-положительных. Например, это может быть так, что из 1000 человек, прошедших тестирование на инфекцию, 50 из них дали положительный результат на наличие инфекции, но это связано с тем, что у 10 действительно она была и у 40 ошибочных результатов тестов, потому что только 10 человек из тех, кто прошел тестирование, действительно инфицированы. но тест иногда дает ложные результаты. Вероятность положительного результата теста определяется не только точностью теста, но и характеристиками выборки. Когда распространенность, доля тех, у кого есть данное заболевание, ниже, чем уровень ложноположительных результатов теста, даже тесты, которые имеют очень низкий шанс дать ложноположительный результат в отдельном случае, будут давать больше ложных результатов. чем истинных положительных результатов в целом. Парадокс удивляет большинство людей.
Это особенно противоречит интуиции при интерпретации положительного результата теста на низкой распространенности популяции после того, как имеешь дело с положительными результатами, полученными из высокой распространенности. численность населения. Если ложноположительный уровень теста выше, чем доля новой популяции с заболеванием, то администратор теста, чей опыт был получен в результате тестирования в популяции с высокой распространенностью, может сделать вывод из Опыт, что положительный результат теста обычно указывает на положительный результат, тогда как на самом деле ложноположительный результат гораздо более вероятен.
Количество. людей | Инфицированные | Незараженные | Всего |
---|---|---|---|
Тест. положительный | 400. (истинно положительный) | 30. (ложноположительный) | 430 |
Тест. отрицательный | 0. (ложноотрицательный) | 570. (истинно отрицательный) | 570 |
Всего | 400 | 600 | 1000 |
Представьте, что вы проводите тест на инфекционное заболевание в популяции A из 1000 человек, 40% из которых инфицированы. Уровень ложноположительных результатов теста составляет 5% (0,05), а количество ложноотрицательных результатов отсутствует. ожидаемый результат из 1000 тестов в популяции A будет:
Итак, в популяции A человек, получивший положительный результат теста, может быть уверен более чем на 93% (400/30 + 400), что он правильно указывает на инфекцию.
Количество. людей | Зараженные | Неинфицированные | Всего |
---|---|---|---|
Тест. положительный | 20. (истинно положительный) | 49. (ложноположительный) | 69 |
Тест. отрицательный | 0. (ложноотрицательный) | 931. (истинно отрицательный) | 931 |
Итого | 20 | 980 | 1000 |
Теперь рассмотрим тот же тест, примененный к популяции B, в которой инфицировано только 2%. ожидаемый результат 1000 тестов в популяции B будет:
В популяции B только 20 из 69 человек с положительным результатом теста результат действительно заражены. Таким образом, вероятность действительно заразиться после того, как кому-то сказали, что он инфицирован, составляет всего 29% (20/20 + 49) для теста, который в противном случае кажется «точным на 95%».
Тестировщик, имеющий опыт работы с группой A, может найти парадокс в том, что в группе B результат, который обычно правильно указывал на инфекцию, теперь обычно является ложноположительным. Смешение апостериорной вероятности заражения с априорной вероятностью получения ложноположительного результата является естественной ошибкой после получения угрожающего здоровью результата теста.
Многие ответят как 95%, но правильная вероятность составляет около 2%.
Объяснение этому следующее: в среднем на каждую 1000 протестированных водителей
Следовательно, вероятность того, что один из водители среди положительных результатов теста 1 + 49,95 = 50,95 действительно пьяны .
Однако достоверность этого результата зависит от достоверности Из первоначального предположения, что полицейский остановил водителя действительно случайно, а не из-за плохого вождения. Если присутствовала та или иная непроизвольная причина остановки водителя, то в расчет также включается вероятность того, что водитель в состоянии алкогольного опьянения будет управлять автомобилем грамотно, а водитель в нетрезвом виде водит (не) компетентно.
Более формально такая же вероятность примерно 0,02 может быть установлена с помощью теоремы Байеса. Цель состоит в том, чтобы найти вероятность того, что водитель пьян, учитывая, что алкотестер показал, что он пьян, что может быть представлено как
где D означает, что алкотестер показывает, что водитель пьян. Теорема Байеса говорит нам, что
В первом абзаце нам сказали следующее:
Как видно из формулы, для теоремы Байеса требуется p (D), которую можно вычислить из предыдущих значений с помощью закон полной вероятности :
, что дает
Подставляя эти числа в теорему Байеса, мы получаем, что
В городе 1 миллион жителей пусть будет 100 террористов и 999 900 нетеррористов. Для упрощения примера предполагается, что все люди, присутствующие в городе, являются его жителями. Таким образом, базовая вероятность того, что случайно выбранный житель города является террористом, равна 0,0001, а базовая вероятность того, что этот же житель не является террористом, равна 0,9999. В попытке поймать террористов город устанавливает систему сигнализации с камерой наблюдения и автоматическим программным обеспечением для распознавания лиц.
. Программное обеспечение имеет два уровня отказов по 1%:
Предположим теперь, что житель вызывает тревогу. Какова вероятность того, что это террорист? Другими словами, что такое P (T | B), вероятность того, что террорист был обнаружен при звонке в колокол? Кто-то, делающий «ошибку базовой ставки», сделает вывод о том, что с вероятностью 99% обнаруженный человек является террористом. Хотя этот вывод кажется логичным, на самом деле это неверное рассуждение, и приведенный ниже расчет покажет, что вероятность того, что они террористы, на самом деле составляет около 1%, а не около 99%.
Заблуждение возникает из-за смешения природы двух разных уровней отказов. «Количество не-колоколов на 100 террористов» и «количество нетеррористов на 100 колоколов» не связаны между собой. Один не обязательно равен другому, и они даже не обязательно должны быть почти равными. Чтобы продемонстрировать это, представьте, что произойдет, если во втором городе, где террористов вообще нет, была бы установлена идентичная система сигнализации. Как и в первом городе, тревога звучит для 1 из каждых 100 обнаруженных жителей, не являющихся террористами, но, в отличие от первого города, тревога никогда не звучит для террористов. Таким образом, 100% всех случаев срабатывания сигнализации относятся к нетеррористам, но ложноотрицательный показатель даже не может быть подсчитан. «Число нетеррористов на 100 колоколов» в этом городе равно 100, но P (T | B) = 0%. При звонке в колокол вероятность того, что террорист был обнаружен, равна нулю.
Представьте себе, что перед камерой проходит весь миллион жителей первого города. Около 99 из 100 террористов вызовут тревогу, равно как и около 9 999 из 999 900 нетеррористов. Таким образом, тревогу сработают около 10 098 человек, среди которых около 99 - террористы. Таким образом, вероятность того, что человек, вызвавший тревогу, на самом деле является террористом, составляет всего около 99 из 10 098, что меньше 1% и очень, очень сильно ниже нашего первоначального предположения в 99%.
Ошибка базовой ставки в этом примере вводит в заблуждение, потому что нетеррористов намного больше, чем террористов, а количество ложных срабатываний (нетеррористы сканируются как террористы) намного больше, чем истинных срабатываний ( реальное количество террористов).
В ходе экспериментов было обнаружено, что люди предпочитают индивидуальную информацию общей информации, когда первая доступна.
В некоторых экспериментах студентов просили оценить средний балл (GPA) гипотетических студентов. Получая соответствующую статистику о распределении среднего балла, учащиеся, как правило, игнорировали ее, если давали описательную информацию о конкретном учащемся, даже если новая описательная информация явно не имела отношения к успеваемости в школе или не имела никакого отношения к ней. Этот вывод был использован, чтобы доказать, что собеседования являются ненужной частью процесса поступления в колледж, потому что интервьюеры не могут выбрать успешных кандидатов лучше, чем базовая статистика.
Психологи Дэниел Канеман и Амос Тверски попытались объяснить это открытие с помощью простого правила или «эвристики», называемого репрезентативностью.. Они утверждали, что многие суждения, касающиеся вероятности или причины и следствия, основаны на том, насколько одно репрезентативно для другого или для категории. Канеман считает, что пренебрежение базовой ставкой является особой формой пренебрежения расширением. Ричард Нисбетт утверждал, что некоторые предубеждения при атрибуции, такие как фундаментальная ошибка атрибуции являются примерами ошибки базовой ставки: люди не используют «консенсусную информацию» («базовую оценку») о том, как другие вели себя в аналогичных ситуациях, а вместо этого предпочитают более простые диспозиционные атрибуции.
В психологии ведутся серьезные споры об условиях, при которых люди ценят или не ценят информацию о базовой ставке. Исследователи программы эвристики и систематических ошибок подчеркнули эмпирические данные, показывающие, что люди склонны игнорировать базовые ставки и делать выводы, нарушающие определенные нормы вероятностного рассуждения, такие как теорема Байеса. Вывод, сделанный на основании этого направления исследований, заключался в том, что вероятностное мышление человека в корне ошибочно и подвержено ошибкам. Другие исследователи подчеркнули связь между когнитивными процессами и форматами информации, утверждая, что такие выводы обычно не являются обоснованными.
Еще раз рассмотрим пример 2, приведенный выше. Требуемый вывод заключается в оценке (апостериорной) вероятности того, что (случайно выбранный) водитель находится в состоянии алкогольного опьянения, при условии, что тест алкотестера положительный. Формально эту вероятность можно рассчитать с помощью теоремы Байеса, как показано выше. Однако существуют разные способы представления соответствующей информации. Рассмотрим следующий формально эквивалентный вариант проблемы:
В этом случае соответствующая числовая информация - p (пьяный), p (D | пьяный), p (D | трезвый) - представлена в виде собственных частот относительно к определенному эталонному классу (см. проблема эталонного класса ). Эмпирические исследования показывают, что выводы людей в большей степени соответствуют правилу Байеса, когда информация представлена таким образом, что помогает преодолеть пренебрежение базовой оценкой со стороны непрофессионалов и экспертов. Как следствие, такие организации, как Cochrane Collaboration, рекомендуют использовать такой формат для передачи статистики здравоохранения. Учить людей переводить подобные байесовские задачи мышления в форматы собственных частот более эффективно, чем просто учить их подставлять вероятности (или проценты) в теорему Байеса. Также было показано, что графическое представление собственных частот (например, массив значков) помогает людям делать более точные выводы.
Почему полезны форматы собственных частот? Одна из важных причин заключается в том, что этот формат информации облегчает требуемый вывод, поскольку упрощает необходимые вычисления. Это можно увидеть, используя альтернативный способ вычисления требуемой вероятности p (пьяный | D):
где N (пьяный ∩ D) обозначает количество пьяных водителей, получивших положительный результат алкотестера, а N (D) обозначает общее количество случаев с положительным результатом алкотестера. Эквивалентность этого уравнения предыдущему следует из аксиом теории вероятностей, согласно которой N (drunk ∩ D) = N × p (D | drunk) × p (drunk). Важно отметить, что хотя это уравнение формально эквивалентно правилу Байеса, психологически оно не эквивалентно. Использование собственных частот упрощает вывод, поскольку требуемая математическая операция может выполняться с натуральными числами, а не с нормализованными дробями (т. Е. Вероятностями), поскольку это делает большое количество ложных срабатываний более прозрачным, и поскольку собственные частоты демонстрируют «вложенный набор» структура ".
Не каждый частотный формат позволяет использовать байесовские рассуждения. Собственные частоты относятся к информации о частоте, которая является результатом естественной выборки, которая сохраняет информацию о базовой скорости (например, количество пьяных водителей при выборке случайной выборки водителей). Это отличается от систематической выборки, в которой базовые ставки фиксируются априори (например, в научных экспериментах). В последнем случае невозможно вывести апостериорную вероятность p (пьяный | положительный тест) из сравнения количества пьяных водителей с положительным результатом теста по сравнению с общим количеством людей, получивших положительный результат алкотестера, потому что информация о базовой скорости не сохраняется и должен быть явно повторно введен с использованием теоремы Байеса.