Парадокс Линдли

редактировать

Парадокс Линдлите в этом противоречащий ситуация в статистике, в которых байесовские и частотных подходы к проверке гипотез проблем дают различные результаты для некоторых вариантов в априорном распределении. Проблема разногласий между двумя подходами обсуждалась в учебнике Гарольда Джеффриса 1939 года; он стал известен как парадокс Линдли после того, как Деннис Линдли назвал разногласие парадоксом в статье 1957 года.

Хотя это и называется парадоксом, разные результаты байесовского и частотного подходов можно объяснить их использованием для ответа на принципиально разные вопросы, а не фактического несогласия между двумя методами.

Тем не менее, для большого класса априорных подходов различия между частотным и байесовским подходами вызваны сохранением фиксированного уровня значимости: как признавал даже Линдли, «теория не оправдывает практику сохранения фиксированного уровня значимости» и даже «некоторые расчеты профессора Пирсона в обсуждении этой статьи подчеркнули, как уровень значимости должен измениться с размером выборки, если бы потери и априорные вероятности оставались фиксированными ''. Фактически, если критическое значение увеличивается с увеличением размера выборки соответствующим образом быстро, то расхождение между частотным и байесовским подходами становится незначительным по мере увеличения размера выборки.

СОДЕРЖАНИЕ
  • 1 Описание парадокса
  • 2 Числовой пример
    • 2.1 Частотный подход
    • 2.2 Байесовский подход
    • 2.3 Согласование байесовского и частотного подходов
    • 2.4 Отсутствие реального парадокса
  • 3 Недавнее обсуждение
  • 4 См. Также
  • 5 Примечания
  • 6 Дальнейшее чтение
Описание парадокса

Результат некоторого эксперимента имеет два возможных объяснения, гипотезы и некоторое предварительное распределение, представляющее неопределенность в отношении того, какая гипотеза более точна, прежде чем принимать во внимание. Икс {\ displaystyle \ textstyle x} ЧАС 0 {\ displaystyle \ textstyle H_ {0}} ЧАС 1 {\ displaystyle \ textstyle H_ {1}} π {\ displaystyle \ textstyle \ pi} Икс {\ displaystyle \ textstyle x}

Парадокс Линдли возникает, когда

  1. Результат является «значимым» с помощью частотного теста, указывающего на достаточные доказательства для отклонения, скажем, на уровне 5%, и Икс {\ displaystyle \ textstyle x} ЧАС 0 {\ displaystyle \ textstyle H_ {0}} ЧАС 0 {\ displaystyle \ textstyle H_ {0}}
  2. Апостериорная вероятность на данный высока, что указывает на убедительные доказательства того, что лучше согласуется с чем. ЧАС 0 {\ displaystyle \ textstyle H_ {0}} Икс {\ displaystyle \ textstyle x} ЧАС 0 {\ displaystyle \ textstyle H_ {0}} Икс {\ displaystyle \ textstyle x} ЧАС 1 {\ displaystyle \ textstyle H_ {1}}

Эти результаты могут быть получены в то же самое время, когда они очень специфичны, более размыты, а предварительное распределение не сильно благоприятствует тому или иному, как показано ниже. ЧАС 0 {\ displaystyle \ textstyle H_ {0}} ЧАС 1 {\ displaystyle \ textstyle H_ {1}}

Числовой пример

Следующий числовой пример иллюстрирует парадокс Линдли. В одном городе за определенный период времени родился 49 581 мальчик и 48 870 девочек. Таким образом, наблюдаемая доля рождений мужского пола составляет 49 581/98 451 ≈ 0,5036. Мы предполагаем, что доля рождений мужского пола является биномиальной переменной с параметром. Мы заинтересованы в том, чтобы проверить, равно ли 0,5 или какое-то другое значение. То есть наша нулевая гипотеза есть, а альтернатива есть. Икс {\ displaystyle \ textstyle x} θ {\ displaystyle \ textstyle \ theta} θ {\ displaystyle \ textstyle \ theta} ЧАС 0 : θ знак равно 0,5 {\ displaystyle \ textstyle H_ {0}: \ theta = 0,5} ЧАС 1 : θ 0,5 {\ displaystyle \ textstyle H_ {1}: \ theta \ neq 0,5}

Частотный подход

Частотный подход к тестированию состоит в том, чтобы вычислить p-значение, то есть вероятность наблюдения доли мальчиков, по крайней мере, столь же велика, как и предположение. Поскольку число рождений очень велико, мы можем использовать нормальное приближение доли рождений мужского пола с и, чтобы вычислить ЧАС 0 {\ displaystyle \ textstyle H_ {0}} Икс {\ displaystyle \ textstyle x} ЧАС 0 {\ displaystyle \ textstyle H_ {0}} Икс N ( μ , σ 2 ) {\ displaystyle \ textstyle X \ sim N (\ mu, \ sigma ^ {2})} μ знак равно п п знак равно п θ знак равно 98 , 451 × 0,5 знак равно 49 , 225,5 {\ displaystyle \ textstyle \ mu = np = n \ theta = 98 451 \ times 0,5 = 49 225,5} σ 2 знак равно п θ ( 1 - θ ) знак равно 98 , 451 × 0,5 × 0,5 знак равно 24 , 612,75 {\ displaystyle \ textstyle \ sigma ^ {2} = n \ theta (1- \ theta) = 98 451 \ times 0,5 \ times 0,5 = 24 612,75}

п ( Икс Икс μ знак равно 49225,5 ) знак равно Икс знак равно 49581 98451 1 2 π σ 2 е - ( ты - μ σ ) 2 / 2 d ты знак равно Икс знак равно 49581 98451 1 2 π ( 24 , 612,75 ) е - ( ты - 49225,5 ) 2 24612,75 / 2 d ты 0,0117. {\ Displaystyle {\ begin {align} P (X \ geq x \ mid \ mu = 49225.5) = \ int _ {x = 49581} ^ {98451} {\ frac {1} {\ sqrt {2 \ pi \ sigma ^ {2}}}} e ^ {- ({\ frac {u- \ mu} {\ sigma}}) ^ {2} / 2} du \\ = \ int _ {x = 49581} ^ {98451} {\ frac {1} {\ sqrt {2 \ pi (24 612,75)}}} e ^ {- {\ frac {(u-49225.5) ^ {2}} {24612.75}} / 2} du \ приблизительно 0,0117. \ конец {выровнен}}}

Мы были бы в равной степени удивлены, если бы увидели 49 581 женское рождение, т. Е. Поэтому частотный специалист обычно проводил бы двусторонний тест, для которого значение p было бы равным. В обоих случаях значение p ниже уровня значимости α, равного 5%, поэтому частотный подход отвергает, поскольку он не согласуется с наблюдаемыми данными. Икс 0,4964 {\ displaystyle \ textstyle x \ приблизительно 0,4964} п 2 × 0,0117 знак равно 0,0235 {\ displaystyle \ textstyle p \ примерно 2 \ раза 0,0117 = 0,0235} ЧАС 0 {\ displaystyle \ textstyle H_ {0}}

Байесовский подход

При отсутствии причин отдавать предпочтение одной гипотезе над другой, байесовский подход заключался бы в том, чтобы присвоить априорные вероятности и равномерное распределение меньшим, а затем вычислить апостериорную вероятность использования теоремы Байеса, π ( ЧАС 0 ) знак равно π ( ЧАС 1 ) знак равно 0,5 {\ displaystyle \ textstyle \ pi (H_ {0}) = \ pi (H_ {1}) = 0,5} θ {\ displaystyle \ textstyle \ theta} ЧАС 1 {\ displaystyle H_ {1}} ЧАС 0 {\ displaystyle \ textstyle H_ {0}}

п ( ЧАС 0 k ) знак равно п ( k ЧАС 0 ) π ( ЧАС 0 ) п ( k ЧАС 0 ) π ( ЧАС 0 ) + п ( k ЧАС 1 ) π ( ЧАС 1 ) . {\ Displaystyle P (H_ {0} \ mid k) = {\ frac {P (k \ mid H_ {0}) \ pi (H_ {0})} {P (k \ mid H_ {0}) \ pi (H_ {0}) + P (k \ mid H_ {1}) \ pi (H_ {1})}}.}.

После наблюдения за не рожденными мальчиками мы можем вычислить апостериорную вероятность каждой гипотезы, используя функцию массы вероятности для биномиальной переменной, k знак равно 49 , 581 {\ displaystyle \ textstyle k = 49 581} п знак равно 98 , 451 {\ displaystyle \ textstyle n = 98 451}

п ( k ЧАС 0 ) знак равно ( п k ) ( 0,5 ) k ( 1 - 0,5 ) п - k 1,95 × 10 - 4 п ( k ЧАС 1 ) знак равно 0 1 ( п k ) θ k ( 1 - θ ) п - k d θ знак равно ( п k ) B ( k + 1 , п - k + 1 ) знак равно 1 / ( п + 1 ) 1.02 × 10 - 5 {\ displaystyle {\ begin {align} P (k \ mid H_ {0}) amp; = {n \ choose k} (0,5) ^ {k} (1-0,5) ^ {nk} \ приблизительно 1,95 \ times 10 ^ {-4} \\ P (k \ mid H_ {1}) amp; = \ int _ {0} ^ {1} {n \ choose k} \ theta ^ {k} (1- \ theta) ^ {nk} d \ theta = {n \ choose k} \ mathrm {\ mathrm {B}} (k + 1, n-k + 1) = 1 / (n + 1) \ приблизительно 1,02 \ times 10 ^ {- 5} \ конец {выровнен}}}

где - бета-функция. B ( а , б ) {\ Displaystyle \ textstyle \ mathrm {\ mathrm {B}} (а, б)}

Из этих значений мы находим апостериорную вероятность, которая в значительной степени превышает. п ( ЧАС 0 k ) 0,95 {\ Displaystyle P (\ textstyle H_ {0} \ mid k) \ приблизительно 0,95} ЧАС 0 {\ displaystyle \ textstyle H_ {0}} ЧАС 1 {\ displaystyle \ textstyle H_ {1}}

Два подхода - байесовский и частотный - кажутся конфликтующими, и в этом заключается «парадокс».

Согласование байесовского и частотного подходов

Однако, по крайней мере, в примере Линдли, если мы возьмем последовательность уровней значимости α n, такую, что α n = n - r с r gt; 1/2, тогда апостериорная вероятность нуля сходится к 0, что согласуется с отказ от нуля. В этом числовом примере принятие r = 1/2 дает уровень значимости 0,00318, поэтому частотный специалист не отвергнет нулевую гипотезу, что примерно соответствует байесовскому подходу.

Распределение p при нулевой гипотезе и апостериорное распределение p.

Если мы воспользуемся малоинформативным априором и проверим гипотезу, более похожую на гипотезу частотного подхода, парадокс исчезнет.

Например, если мы вычисляем апостериорное распределение, используя однородное априорное распределение на (т.е.), мы находим п ( θ Икс , п ) {\ Displaystyle \ textstyle Р (\ тета \ середина х, п)} θ {\ displaystyle \ textstyle \ theta} π ( θ [ 0 , 1 ] ) знак равно 1 {\ Displaystyle \ TextStyle \ пи (\ тета \ в [0,1]) = 1}

п ( θ k , п ) знак равно B ( k + 1 , п - k + 1 ) . {\ Displaystyle P (\ theta \ mid k, n) = \ mathrm {\ mathrm {B}} (k + 1, n-k + 1).}

Если мы используем это, чтобы проверить вероятность того, что новорожденный, скорее всего, будет мальчиком, чем девочкой, т. Е. Мы найдем п ( θ gt; 0,5 k , п ) {\ Displaystyle Р (\ тетаgt; 0,5 \ середина к, п)}

       0.5  1   B ( 49582 , 48871 )  0.983. {\displaystyle \int _{0.5}^{1}\mathrm {\mathrm {B} } (49582,48871)\approx 0.983.}

Другими словами, очень вероятно, что доля рождений мужского пола выше 0,5.

Ни один из этих анализов не дает непосредственной оценки величины эффекта, но оба могут использоваться для определения, например, того, будет ли доля рождений мальчиков выше определенного порогового значения.

Отсутствие настоящего парадокса

Очевидное расхождение между двумя подходами вызвано сочетанием факторов. Во-первых, частотный подход, описанный выше, проверяет без ссылки на. Байесовский подход оценивается как альтернатива и обнаруживает, что первый лучше согласуется с наблюдениями. Это связано с тем, что последняя гипотеза гораздо более расплывчата, чем может быть где угодно, что приводит к тому, что она имеет очень низкую апостериорную вероятность. Чтобы понять, почему, полезно рассмотреть две гипотезы как генераторы наблюдений: ЧАС 0 {\ displaystyle \ textstyle H_ {0}} ЧАС 1 {\ displaystyle \ textstyle H_ {1}} ЧАС 0 {\ displaystyle \ textstyle H_ {0}} ЧАС 1 {\ displaystyle \ textstyle H_ {1}} θ {\ displaystyle \ textstyle \ theta} [ 0 , 1 ] {\ displaystyle \ textstyle [0,1]}

  • Под, мы выбираем, и спросить, насколько вероятно, чтобы увидеть 49,581 мальчиков в 98,451 родов. ЧАС 0 {\ displaystyle \ textstyle H_ {0}} θ 0,500 {\ displaystyle \ textstyle \ theta \ приблизительно 0,500}
  • Ниже мы выбираем случайным образом от 0 до 1 и задаем тот же вопрос. ЧАС 1 {\ displaystyle \ textstyle H_ {1}} θ {\ displaystyle \ textstyle \ theta}

Большинство возможных значений для under очень плохо подтверждено наблюдениями. По сути, очевидное несогласие между методами - это вовсе не разногласия, а, скорее, два разных утверждения о том, как гипотезы соотносятся с данными: θ {\ displaystyle \ textstyle \ theta} ЧАС 1 {\ displaystyle \ textstyle H_ {1}}

  • Частотный специалист считает, что это плохое объяснение наблюдения. ЧАС 0 {\ displaystyle \ textstyle H_ {0}}
  • Байесовские находки являются гораздо лучшим объяснением наблюдения, чем. ЧАС 0 {\ displaystyle \ textstyle H_ {0}} ЧАС 1 {\ displaystyle \ textstyle H_ {1}}

Согласно частотному тесту, соотношение полов новорожденных невероятно 50/50. Тем не менее, 50/50 - лучшее приближение, чем большинство, но не все другие соотношения. Гипотеза подошла бы к наблюдению намного лучше, чем почти все другие соотношения, в том числе. θ 0,504 {\ displaystyle \ textstyle \ theta \ приблизительно 0,504} θ 0,500 {\ displaystyle \ textstyle \ theta \ приблизительно 0,500}

Например, этот выбор гипотез и априорных вероятностей подразумевает утверждение: «если gt; 0,49 и lt;0,51, то априорная вероятность быть точно 0,5 составляет 0,50 / 0,51 98%». Учитывая такое сильное предпочтение, то легко понять, почему байесовский подход способствует в лице, даже если наблюдаемое значение лежит далеко от 0,5. Отклонение более чем на 2 сигмы от считается значительным в частотном подходе, но его значение отвергается предшествующим в байесовском подходе. θ {\ displaystyle \ textstyle \ theta} θ {\ displaystyle \ textstyle \ theta} θ {\ displaystyle \ theta} {\ Displaystyle \ приблизительно} θ знак равно 0,5 {\ displaystyle \ theta = 0,5} ЧАС 0 {\ displaystyle H_ {0}} Икс 0,5036 {\ displaystyle x \ приблизительно 0,5036} Икс {\ displaystyle x} 2,28 σ {\ displaystyle 2.28 \ sigma} ЧАС 0 {\ displaystyle H_ {0}}

Посмотрев на это с другой стороны, мы можем увидеть, что априорное распределение по существу является плоским с дельта-функцией на. Ясно, что это сомнительно. Фактически, если бы вы представили действительные числа как непрерывные, то было бы более логичным предположить, что никакое данное число не может быть точным значением параметра, т. Е. Мы должны предполагать. θ знак равно 0,5 {\ displaystyle \ textstyle \ theta = 0,5} п ( θ знак равно 0,5 ) знак равно 0 {\ Displaystyle P (\ theta = 0,5) = 0}

Более реалистичное распределение для в альтернативной гипотезе дает менее удивительный результат для апостериорной части. Например, если мы заменим на, т. Е. Оценку максимального правдоподобия для, апостериорная вероятность будет только 0,07 по сравнению с 0,93 для (Конечно, на самом деле нельзя использовать MLE как часть априорного распределения). θ {\ displaystyle \ textstyle \ theta} ЧАС 0 {\ displaystyle \ textstyle H_ {0}} ЧАС 1 {\ displaystyle \ textstyle H_ {1}} ЧАС 2 : θ знак равно Икс {\ displaystyle \ textstyle H_ {2}: \ theta = x} θ {\ displaystyle \ textstyle \ theta} ЧАС 0 {\ displaystyle \ textstyle H_ {0}} ЧАС 2 {\ displaystyle \ textstyle H_ {2}}

Недавнее обсуждение

Парадокс продолжает оставаться предметом активной дискуссии.

Смотрите также
Заметки
дальнейшее чтение
Последняя правка сделана 2024-01-06 07:23:23
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте