Задача Беренса – Фишера

редактировать
Question, Web Fundamentals.svg Нерешенная проблема в статистике :. Требуется ли приближение, аналогичное аргументу Фишера, для решения проблемы Беренса – Фишера? (больше нерешенных проблем в статистике)

В статистика, проблема Беренса – Фишера, названная в честь Уолтера Беренса и Рональда Фишера, является проблемой интервальной оценки и проверки гипотез относительно разницы между средними значениями двух нормально распределенных популяций, когда дисперсии две совокупности не считаются равными на основании двух независимых выборок.

Содержание
  • 1 Спецификация
    • 1.1 Контекст
    • 1.2 Требования к решениям
  • 2 Краткое описание различных подходов
    • 2.1 Подход Беренса и Фишера
    • 2.2 Приблизительное t решение Уэлча
    • 2.3 Другое подходы
    • 2.4 Точные решения общих и обобщенных задач Беренса – Фишера
  • 3 Варианты
  • 4 Обобщения
  • 5 Примечания
  • 6 Ссылки
  • 7 Внешние ссылки
Спецификация

Одна из трудностей при обсуждении проблемы Беренса – Фишера и предлагаемых решений состоит в том, что существует множество различных интерпретаций того, что имеется в виду под «проблемой Беренса – Фишера». Эти различия касаются не только того, что считается подходящим решением, но даже основного положения рассматриваемого контекста.

Контекст

Пусть X 1,..., X n и Y 1,..., Y m be iid выборки из двух популяций, которые происходят из одного и того же семейства распределений в масштабе местоположения. Предполагается, что масштабные параметры неизвестны и не обязательно равны, и проблема состоит в том, чтобы оценить, можно ли обоснованно считать параметры местоположения равными. Леманн заявляет, что «проблема Беренса – Фишера» используется как для этой общей формы модели, когда семейство распределений произвольно, так и для случая, когда делается ограничение на нормальное распределение. В то время как Леманн обсуждает ряд подходов к более общей проблеме, в основном основанных на непараметрических методах, в большинстве других источников, похоже, используется «проблема Беренса – Фишера» только для случая, когда распределение предполагается нормальным: большая часть этой статьи делает это предположение.

Требования к решениям

Были представлены решения проблемы Беренса – Фишера, использующие либо классический, либо байесовский вывод точки точка зрения, и любое решение было бы условно недействительным, если судить с другой точки зрения. Если рассмотрение ограничивается только классическим статистическим выводом, можно искать решения проблемы вывода, которые просты в практическом применении, отдавая предпочтение этой простоте любой неточности в соответствующих утверждениях вероятности. Если требуется точность уровней значимости статистических тестов, может существовать дополнительное требование, согласно которому процедура должна максимально использовать статистическую информацию в наборе данных. Хорошо известно, что точный тест может быть получен путем случайного отбрасывания данных из большего набора данных до тех пор, пока размеры выборки не станут равными, объединения данных в пары и взятия различий, а затем использования обычного t-теста для проверки для нулевой средней разности: очевидно, что это не было бы «оптимальным» ни в каком смысле.

Задача определения интервальных оценок для этой проблемы - та, где частотный подход не может обеспечить точное решение, хотя некоторые приближения доступны. Стандартные байесовские подходы также не дают ответа, который можно выразить в виде простых простых формул, но современные вычислительные методы байесовского анализа действительно позволяют находить по существу точные решения. Таким образом, исследование проблемы может быть использовано для выяснения различий между частотным и байесовским подходами к интервальной оценке.

Описание различных подходов

подход Беренса и Фишера

Рональд Фишер в 1935 году ввел фидуциальный вывод, чтобы применить его к этой проблеме. Он сослался на более раннюю статью 1929 года. Беренс и Фишер предложили найти распределение вероятностей для

T ≡ x ¯ 1 - x ¯ 2 s 1 2 / n 1 + s 2 2 / n 2 {\ displaystyle T \ Equiv {{\ bar {x}} _ {1} - {\ bar {x}} _ {2} \ over {\ sqrt {s_ {1} ^ {2} / n_ {1} + s_ {2} ^ {2} / n_ {2}}}}}Т \ эквив {\ bar x_1 - \ bar x_2 \ over \ sqrt {s_1 ^ 2 / n_1 + s_2 ^ 2 / n_2}}

где x ¯ 1 {\ displaystyle {\ bar {x}} _ {1}}\ bar x_1 и x ¯ 2 {\ displaystyle {\ bar {x}} _ {2}}\ bar x_2 - это два примерных средних, а s 1 и s 2 - их стандартные отклонения. См. Распределение Беренса – Фишера. Фишер аппроксимировал это распределение, игнорируя случайное изменение относительных размеров стандартных отклонений,

s 1 / n 1 s 1 2 / n 1 + s 2 2 / n 2. {\ Displaystyle {s_ {1} / {\ sqrt {n_ {1}}} \ over {\ sqrt {s_ {1} ^ {2} / n_ {1} + s_ {2} ^ {2} / n_ { 2}}}}.}{s_1 / \ sqrt {n_1} \ over \ sqrt {s_1 ^ 2 / n_1 + s_2 ^ 2 / n_2}}.

Решение Фишера вызвало споры, потому что оно не имело того свойства, что гипотеза о равных средних будет отвергнута с вероятностью α, если средние фактически равны. С тех пор было предложено множество других методов решения проблемы, и их влияние на полученные доверительные интервалы было исследовано.

Приближенное t-решение Велча

Широко используемым методом является метод Б. Л. Велч, который, как и Фишер, учился в Университетском колледже Лондона. Дисперсия средней разности

d ¯ = x ¯ 1 - x ¯ 2 {\ displaystyle {\ bar {d}} = {\ bar {x}} _ {1} - {\ bar {x}} _ {2}}{\ displaystyle {\ bar {d}} = {\ bar {x}} _ {1} - {\ bar {x}} _ {2}}

приводит к

sd ¯ 2 = s 1 2 n 1 + s 2 2 n 2. {\ displaystyle s _ {\ bar {d}} ^ {2} = {\ frac {s_ {1} ^ {2}} {n_ {1}}} + {\ frac {s_ {2} ^ {2}} {n_ {2}}}.}s _ {\ bar d} ^ 2 = \ frac {s_1 ^ 2} {n_1} + \ frac {s_2 ^ 2} {n_2}.

Велч (1938) аппроксимировал распределение sd ¯ 2 {\ displaystyle s _ {\ bar {d}} ^ {2}}s _ {\ bar d} ^ 2 с помощью Тип III Распределение Пирсона (масштабированное распределение хи-квадрат ), первые два момента которого совпадают с моментом sd ¯ 2 {\ displaystyle s _ {\ бар {d}} ^ {2}}s _ {\ bar d} ^ 2 . Это применимо к следующему числу степеней свободы (df), которое обычно не является целым числом:

ν ≈ (γ 1 + γ 2) 2 γ 1 2 / (n 1 - 1) + γ 2 2 / ( n 2 - 1), где γ i = σ i 2 / ni. {\ Displaystyle \ ню \ приблизительно {(\ гамма _ {1} + \ гамма _ {2}) ^ {2} \ над \ гамма _ {1} ^ {2} / (п_ {1} -1) + \ гамма _ {2} ^ {2} / (n_ {2} -1)} \ quad {\ text {где}} \ gamma _ {i} = \ sigma _ {i} ^ {2} / n_ {i}.}{\ displaystyle \ nu \ приблизительно {(\ gamma _ {1} + \ gamma _ {2}) ^ {2} \ over \ gamma _ {1} ^ {2} / (n_ {1} -1) + \ gamma _ {2} ^ {2} / (n_ {2} -1)} \ quad {\ text {where}} \ gamma _ {i} = \ sigma _ {i} ^ {2} / n_ {i}.}

При нулевой гипотезе равных ожиданий μ 1 = μ 2, распределение статистики Беренса – Фишера T, которое также зависит от коэффициента дисперсии σ 1/σ2, теперь может быть аппроксимировано распределением Стьюдента с этими ν степенями свободы. Но этот ν содержит дисперсии совокупности σ i, и они неизвестны. Следующая оценка заменяет только дисперсии генеральной совокупности дисперсиями выборки:

ν ^ ≈ (g 1 + g 2) 2 g 1 2 / (n 1 - 1) + g 2 2 / (n 2 - 1), где gi = si 2 / ni. {\ displaystyle {\ hat {\ nu}} \ приблизительно {\ frac {(g_ {1} + g_ {2}) ^ {2}} {g_ {1} ^ {2} / (n_ {1} -1) + g_ {2} ^ {2} / (n_ {2} -1)}} \ quad {\ text {where}} g_ {i} = s_ {i} ^ {2} / n_ {i}.}{\ displaystyle {\ hat {\ nu}} \ приблизительно {\ frac {(g_ {1} + g_ {2}) ^ {2}} {g_ {1} ^ {2} / ( n_ {1} -1) + g_ {2} ^ {2} / (n_ {2} -1)}} \ quad {\ text {where}} g_ {i} = s_ {i} ^ {2} / n_ {i}.}

Это ν ^ {\ displaystyle {\ hat {\ nu}}}\hat\nu- случайная величина. Распределения t со случайным числом степеней свободы не существует. Тем не менее, T Беренса – Фишера можно сравнить с соответствующим квантилем t-распределения Стьюдента с этими оценочными числами степеней свободы, ν ^ {\ displaystyle {\ hat {\ nu}}}\hat\nu, которое обычно не является целым числом. Таким образом, граница между областью приемлемости и отклонения статистического показателя Т теста вычисляется на основе эмпирических отклонений s i таким образом, который является плавной функцией от них.

Этот метод также не дает точной номинальной скорости, но, как правило, не так уж и далек. Однако, если дисперсии генеральной совокупности равны или если выборки довольно малы и дисперсии генеральной совокупности можно предположить приблизительно равными, более точным будет использовать t-критерий Стьюдента.

Другие подходы

Было предложено несколько различных подходов к общей проблеме, некоторые из которых претендуют на «решение» некоторой версии проблемы. Среди них

  • работа Чепмена в 1950 году,
  • работа Прокофьева и Шишкина в 1974 году,
  • работа Дудевича и Ахмеда в 1998 году.

В сравнении Дудевича с выбранных методов, было установлено, что для практического использования рекомендуется процедура Дудевича – Ахмеда.

Точные решения общих и обобщенных задач Беренса – Фишера

В течение нескольких десятилетий принято считать, что не было найдено точного решения общей проблемы Беренса – Фишера. Однако в 1966 году было доказано, что у него есть точное решение. В 2018 году была доказана функция плотности вероятности обобщенного распределения Беренса-Фишера m средних и m различных стандартных ошибок из m выборок разных размеров из независимых нормальных распределений с различными средними и дисперсиями, а также в статье были рассмотрены ее асимптотические приближения. В последующей работе было показано, что классический парный t-критерий является центральной проблемой Беренса – Фишера с ненулевым коэффициентом корреляции совокупности, и соответствующая функция плотности вероятности была получена путем решения связанной с ней нецентральной задачи Беренса – Фишера с ненулевой совокупностью. коэффициент корреляции. Он также решил более общую нецентральную проблему Беренса – Фишера с ненулевым коэффициентом корреляции населения в приложении.

Варианты

Был изучен второстепенный вариант проблемы Беренса – Фишера. В этом случае проблема состоит в том, чтобы, предполагая, что два средних значения совокупности фактически одинаковы, сделать выводы об общем среднем: например, можно потребовать доверительный интервал для общего среднего.

Обобщения

Одно обобщение проблемы включает многомерные нормальные распределения с неизвестными ковариационными матрицами и известно как многомерная задача Беренса – Фишера.

непараметрическая задача Беренса – Фишера не предполагает, что распределения являются нормальными. Тесты включают тест Куккони 1968 года и тест Лепажа 1971 года.

Примечания
  1. ^Lehmann (1975) стр.95
  2. ^Lehmann (1975) Раздел 7
  3. ^Фишер Р.А. (1935). «Фидуциальный аргумент в статистическом выводе». Летопись евгеники. 8 (4): 391–398. doi : 10.1111 / j.1469-1809.1935.tb02120.x. hdl : 2440/15222.
  4. ^R. Фидуциальный аргумент А. Фишера и теорема Байеса Тедди Зайденфельд
  5. ^Сезер, А. и др. Сравнение доверительных интервалов для задачи Беренса – Фишера Comm. Статистика. 2015
  6. ^Уэлч (1938, 1947)
  7. ^ Дудевич, Ма, Май и Су (2007)
  8. ^Чепмен, Д. Г. (1950). «Примерно два образца тестов». Анналы математической статистики. 21(4): 601–606. doi : 10.1214 / aoms / 1177729755.
  9. ^Прокофьев В.Н.; Шишкин, А. Д. (1974). «Последовательная классификация нормальных множеств с неизвестными дисперсиями». Radio Engng. Электрон. Phys. 19 (2): 141–143.
  10. ^Dudewicz Ahmed (1998, 1999)
  11. ^Кабе, Д. Г. (декабрь 1966). «О точном распределении статистики Фишера-Берен-Велча». Метрика. 10 (1): 13–15. DOI : 10.1007 / BF02613414. S2CID 120965543.
  12. ^Сяо, Юншунь (22 марта 2018 г.). «О решении обобщенной проблемы Беренса-Фишера». Дальневосточный журнал теоретической статистики. 54 (1): 21–140. doi : 10.17654 / TS054010021. Проверено 21 мая 2020 г.
  13. ^ Сяо, Юншунь (12 декабря 2018 г.). «О решении нецентральной задачи Беренса-Фишера с ненулевым коэффициентом корреляции населения». Дальневосточный журнал теоретической статистики. 54 (6): 527–600. doi : 10.17654 / TS054060527. Проверено 21 мая 2020 г.
  14. ^Янг, Г. А., Смит, Р. Л. (2005) Основы статистического вывода, CUP. ISBN 0-521-83971-8 (стр. 204)
  15. ^Беллони и Дидье (2008)
  16. ^Бруннер, Э. (2000). "Непараметрическая задача Беренса – Фишера: асимптотическая теория и приближение малой выборки". Биометрический журнал. 42 : 17–25. doi : 10.1002 / (SICI) 1521-4036 (200001) 42: 1 <17::AID-BIMJ17>3.0.CO; 2-U.
  17. ^Конитшке, Франк (2015). «nparcomp: программный пакет R для непараметрических множественных сравнений и одновременных доверительных интервалов». Журнал статистического программного обеспечения. 64 (9). doi : 10.18637 / jss.v064.i09. Проверено 26 сентября 2016 г.
Список литературы
Внешние ссылки
Последняя правка сделана 2021-05-12 09:54:38
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте