Задача Беренса – Фишера

редактировать

Нерешенная проблема в статистике :. Требуется ли приближение, аналогичное аргументу Фишера, для решения проблемы Беренса – Фишера? (больше нерешенных проблем в статистике)

В статистика, проблема Беренса – Фишера, названная в честь Уолтера Беренса и Рональда Фишера, является проблемой интервальной оценки и проверки гипотез относительно разницы между средними значениями двух нормально распределенных популяций, когда дисперсии две совокупности не считаются равными на основании двух независимых выборок.

Содержание

1 Спецификация
- 1.1 Контекст
- 1.2 Требования к решениям
2 Краткое описание различных подходов
- 2.1 Подход Беренса и Фишера
- 2.2 Приблизительное t решение Уэлча
- 2.3 Другое подходы
- 2.4 Точные решения общих и обобщенных задач Беренса – Фишера
3 Варианты
4 Обобщения
5 Примечания
6 Ссылки
7 Внешние ссылки

Спецификация

Одна из трудностей при обсуждении проблемы Беренса – Фишера и предлагаемых решений состоит в том, что существует множество различных интерпретаций того, что имеется в виду под «проблемой Беренса – Фишера». Эти различия касаются не только того, что считается подходящим решением, но даже основного положения рассматриваемого контекста.

Контекст

Пусть X 1,..., X n и Y 1,..., Y m be iid выборки из двух популяций, которые происходят из одного и того же семейства распределений в масштабе местоположения. Предполагается, что масштабные параметры неизвестны и не обязательно равны, и проблема состоит в том, чтобы оценить, можно ли обоснованно считать параметры местоположения равными. Леманн заявляет, что «проблема Беренса – Фишера» используется как для этой общей формы модели, когда семейство распределений произвольно, так и для случая, когда делается ограничение на нормальное распределение. В то время как Леманн обсуждает ряд подходов к более общей проблеме, в основном основанных на непараметрических методах, в большинстве других источников, похоже, используется «проблема Беренса – Фишера» только для случая, когда распределение предполагается нормальным: большая часть этой статьи делает это предположение.

Требования к решениям

Были представлены решения проблемы Беренса – Фишера, использующие либо классический, либо байесовский вывод точки точка зрения, и любое решение было бы условно недействительным, если судить с другой точки зрения. Если рассмотрение ограничивается только классическим статистическим выводом, можно искать решения проблемы вывода, которые просты в практическом применении, отдавая предпочтение этой простоте любой неточности в соответствующих утверждениях вероятности. Если требуется точность уровней значимости статистических тестов, может существовать дополнительное требование, согласно которому процедура должна максимально использовать статистическую информацию в наборе данных. Хорошо известно, что точный тест может быть получен путем случайного отбрасывания данных из большего набора данных до тех пор, пока размеры выборки не станут равными, объединения данных в пары и взятия различий, а затем использования обычного t-теста для проверки для нулевой средней разности: очевидно, что это не было бы «оптимальным» ни в каком смысле.

Задача определения интервальных оценок для этой проблемы - та, где частотный подход не может обеспечить точное решение, хотя некоторые приближения доступны. Стандартные байесовские подходы также не дают ответа, который можно выразить в виде простых простых формул, но современные вычислительные методы байесовского анализа действительно позволяют находить по существу точные решения. Таким образом, исследование проблемы может быть использовано для выяснения различий между частотным и байесовским подходами к интервальной оценке.

Описание различных подходов

подход Беренса и Фишера

Рональд Фишер в 1935 году ввел фидуциальный вывод, чтобы применить его к этой проблеме. Он сослался на более раннюю статью 1929 года. Беренс и Фишер предложили найти распределение вероятностей для

T ≡ x ¯ 1 - x ¯ 2 s 1 2 / n 1 + s 2 2 / n 2 {\ displaystyle T \ Equiv {{\ bar {x}} _ {1} - {\ bar {x}} _ {2} \ over {\ sqrt {s_ {1} ^ {2} / n_ {1} + s_ {2} ^ {2} / n_ {2}}}}}

Т \ эквив {\ bar x_1 - \ bar x_2 \ over \ sqrt {s_1 ^ 2 / n_1 + s_2 ^ 2 / n_2}}

где $x ¯ 1 {\ displaystyle {\ bar {x}} _ {1}}$ $\ bar x_1$ и $x ¯ 2 {\ displaystyle {\ bar {x}} _ {2}}$ $\ bar x_2$ - это два примерных средних, а s 1 и s 2 - их стандартные отклонения. См. Распределение Беренса – Фишера. Фишер аппроксимировал это распределение, игнорируя случайное изменение относительных размеров стандартных отклонений,

s 1 / n 1 s 1 2 / n 1 + s 2 2 / n 2. {\ Displaystyle {s_ {1} / {\ sqrt {n_ {1}}} \ over {\ sqrt {s_ {1} ^ {2} / n_ {1} + s_ {2} ^ {2} / n_ { 2}}}}.}

{s_1 / \ sqrt {n_1} \ over \ sqrt {s_1 ^ 2 / n_1 + s_2 ^ 2 / n_2}}.

Решение Фишера вызвало споры, потому что оно не имело того свойства, что гипотеза о равных средних будет отвергнута с вероятностью α, если средние фактически равны. С тех пор было предложено множество других методов решения проблемы, и их влияние на полученные доверительные интервалы было исследовано.

Приближенное t-решение Велча

Широко используемым методом является метод Б. Л. Велч, который, как и Фишер, учился в Университетском колледже Лондона. Дисперсия средней разности

d ¯ = x ¯ 1 - x ¯ 2 {\ displaystyle {\ bar {d}} = {\ bar {x}} _ {1} - {\ bar {x}} _ {2}}

{\ displaystyle {\ bar {d}} = {\ bar {x}} _ {1} - {\ bar {x}} _ {2}}

приводит к

sd ¯ 2 = s 1 2 n 1 + s 2 2 n 2. {\ displaystyle s _ {\ bar {d}} ^ {2} = {\ frac {s_ {1} ^ {2}} {n_ {1}}} + {\ frac {s_ {2} ^ {2}} {n_ {2}}}.}

s _ {\ bar d} ^ 2 = \ frac {s_1 ^ 2} {n_1} + \ frac {s_2 ^ 2} {n_2}.

Велч (1938) аппроксимировал распределение $sd ¯ 2 {\ displaystyle s _ {\ bar {d}} ^ {2}}$ $s _ {\ bar d} ^ 2$ с помощью Тип III Распределение Пирсона (масштабированное распределение хи-квадрат ), первые два момента которого совпадают с моментом $sd ¯ 2 {\ displaystyle s _ {\ бар {d}} ^ {2}}$ $s _ {\ bar d} ^ 2$ . Это применимо к следующему числу степеней свободы (df), которое обычно не является целым числом:

ν ≈ (γ 1 + γ 2) 2 γ 1 2 / (n 1 - 1) + γ 2 2 / ( n 2 - 1), где γ i = σ i 2 / ni. {\ Displaystyle \ ню \ приблизительно {(\ гамма _ {1} + \ гамма _ {2}) ^ {2} \ над \ гамма _ {1} ^ {2} / (п_ {1} -1) + \ гамма _ {2} ^ {2} / (n_ {2} -1)} \ quad {\ text {где}} \ gamma _ {i} = \ sigma _ {i} ^ {2} / n_ {i}.}

{\ displaystyle \ nu \ приблизительно {(\ gamma _ {1} + \ gamma _ {2}) ^ {2} \ over \ gamma _ {1} ^ {2} / (n_ {1} -1) + \ gamma _ {2} ^ {2} / (n_ {2} -1)} \ quad {\ text {where}} \ gamma _ {i} = \ sigma _ {i} ^ {2} / n_ {i}.}

При нулевой гипотезе равных ожиданий μ 1 = μ 2, распределение статистики Беренса – Фишера T, которое также зависит от коэффициента дисперсии σ 1/σ2, теперь может быть аппроксимировано распределением Стьюдента с этими ν степенями свободы. Но этот ν содержит дисперсии совокупности σ i, и они неизвестны. Следующая оценка заменяет только дисперсии генеральной совокупности дисперсиями выборки:

ν ^ ≈ (g 1 + g 2) 2 g 1 2 / (n 1 - 1) + g 2 2 / (n 2 - 1), где gi = si 2 / ni. {\ displaystyle {\ hat {\ nu}} \ приблизительно {\ frac {(g_ {1} + g_ {2}) ^ {2}} {g_ {1} ^ {2} / (n_ {1} -1) + g_ {2} ^ {2} / (n_ {2} -1)}} \ quad {\ text {where}} g_ {i} = s_ {i} ^ {2} / n_ {i}.}

{\ displaystyle {\ hat {\ nu}} \ приблизительно {\ frac {(g_ {1} + g_ {2}) ^ {2}} {g_ {1} ^ {2} / ( n_ {1} -1) + g_ {2} ^ {2} / (n_ {2} -1)}} \ quad {\ text {where}} g_ {i} = s_ {i} ^ {2} / n_ {i}.}

Это $ν ^ {\ displaystyle {\ hat {\ nu}}}$ $\hat\nu$ - случайная величина. Распределения t со случайным числом степеней свободы не существует. Тем не менее, T Беренса – Фишера можно сравнить с соответствующим квантилем t-распределения Стьюдента с этими оценочными числами степеней свободы, $ν ^ {\ displaystyle {\ hat {\ nu}}}$ $\hat\nu$ , которое обычно не является целым числом. Таким образом, граница между областью приемлемости и отклонения статистического показателя Т теста вычисляется на основе эмпирических отклонений s i таким образом, который является плавной функцией от них.

Этот метод также не дает точной номинальной скорости, но, как правило, не так уж и далек. Однако, если дисперсии генеральной совокупности равны или если выборки довольно малы и дисперсии генеральной совокупности можно предположить приблизительно равными, более точным будет использовать t-критерий Стьюдента.

Другие подходы

Было предложено несколько различных подходов к общей проблеме, некоторые из которых претендуют на «решение» некоторой версии проблемы. Среди них

работа Чепмена в 1950 году,
работа Прокофьева и Шишкина в 1974 году,
работа Дудевича и Ахмеда в 1998 году.

В сравнении Дудевича с выбранных методов, было установлено, что для практического использования рекомендуется процедура Дудевича – Ахмеда.

Точные решения общих и обобщенных задач Беренса – Фишера

В течение нескольких десятилетий принято считать, что не было найдено точного решения общей проблемы Беренса – Фишера. Однако в 1966 году было доказано, что у него есть точное решение. В 2018 году была доказана функция плотности вероятности обобщенного распределения Беренса-Фишера m средних и m различных стандартных ошибок из m выборок разных размеров из независимых нормальных распределений с различными средними и дисперсиями, а также в статье были рассмотрены ее асимптотические приближения. В последующей работе было показано, что классический парный t-критерий является центральной проблемой Беренса – Фишера с ненулевым коэффициентом корреляции совокупности, и соответствующая функция плотности вероятности была получена путем решения связанной с ней нецентральной задачи Беренса – Фишера с ненулевой совокупностью. коэффициент корреляции. Он также решил более общую нецентральную проблему Беренса – Фишера с ненулевым коэффициентом корреляции населения в приложении.

Варианты

Был изучен второстепенный вариант проблемы Беренса – Фишера. В этом случае проблема состоит в том, чтобы, предполагая, что два средних значения совокупности фактически одинаковы, сделать выводы об общем среднем: например, можно потребовать доверительный интервал для общего среднего.

Обобщения

Одно обобщение проблемы включает многомерные нормальные распределения с неизвестными ковариационными матрицами и известно как многомерная задача Беренса – Фишера.

непараметрическая задача Беренса – Фишера не предполагает, что распределения являются нормальными. Тесты включают тест Куккони 1968 года и тест Лепажа 1971 года.

Примечания

^Lehmann (1975) стр.95
^Lehmann (1975) Раздел 7
^Фишер Р.А. (1935). «Фидуциальный аргумент в статистическом выводе». Летопись евгеники. 8 (4): 391–398. doi : 10.1111 / j.1469-1809.1935.tb02120.x. hdl : 2440/15222.
^R. Фидуциальный аргумент А. Фишера и теорема Байеса Тедди Зайденфельд
^Сезер, А. и др. Сравнение доверительных интервалов для задачи Беренса – Фишера Comm. Статистика. 2015
^Уэлч (1938, 1947)
^ Дудевич, Ма, Май и Су (2007)
^Чепмен, Д. Г. (1950). «Примерно два образца тестов». Анналы математической статистики. 21(4): 601–606. doi : 10.1214 / aoms / 1177729755.
^Прокофьев В.Н.; Шишкин, А. Д. (1974). «Последовательная классификация нормальных множеств с неизвестными дисперсиями». Radio Engng. Электрон. Phys. 19 (2): 141–143.
^Dudewicz Ahmed (1998, 1999)
^Кабе, Д. Г. (декабрь 1966). «О точном распределении статистики Фишера-Берен-Велча». Метрика. 10 (1): 13–15. DOI : 10.1007 / BF02613414. S2CID 120965543.
^Сяо, Юншунь (22 марта 2018 г.). «О решении обобщенной проблемы Беренса-Фишера». Дальневосточный журнал теоретической статистики. 54 (1): 21–140. doi : 10.17654 / TS054010021. Проверено 21 мая 2020 г.
^ Сяо, Юншунь (12 декабря 2018 г.). «О решении нецентральной задачи Беренса-Фишера с ненулевым коэффициентом корреляции населения». Дальневосточный журнал теоретической статистики. 54 (6): 527–600. doi : 10.17654 / TS054060527. Проверено 21 мая 2020 г.
^Янг, Г. А., Смит, Р. Л. (2005) Основы статистического вывода, CUP. ISBN 0-521-83971-8 (стр. 204)
^Беллони и Дидье (2008)
^Бруннер, Э. (2000). "Непараметрическая задача Беренса – Фишера: асимптотическая теория и приближение малой выборки". Биометрический журнал. 42 : 17–25. doi : 10.1002 / (SICI) 1521-4036 (200001) 42: 1 <17::AID-BIMJ17>3.0.CO; 2-U.
^Конитшке, Франк (2015). «nparcomp: программный пакет R для непараметрических множественных сравнений и одновременных доверительных интервалов». Журнал статистического программного обеспечения. 64 (9). doi : 10.18637 / jss.v064.i09. Проверено 26 сентября 2016 г.

Список литературы

(1929). «Ein Beitrag zur Fehlerberechnung bei wenigen Beobachtungen» [Вклад в оценку ошибок с небольшими наблюдениями]. Landwirtschaftliche Jahrbücher. Берлин: Вигандт и Хемпель. 68 : 807–37.
Bellon, A.; Дидье, Г. (2008). «О проблеме Беренса – Фишера: глобально сходящийся алгоритм и исследование критериев Вальда, LR и LM с конечной выборкой». Анналы статистики. 36(5): 2377–2408. arXiv : 0811.0672. DOI : 10.1214 / 07-AOS528. S2CID 15968707.
Чанг, Швейцария; Pal, N (2008). «Возвращение к проблеме Беренса – Фишера: Сравнение пяти методов испытаний». Коммуникации в статистическом моделировании и вычислениях. 37 (6): 1064–1085. doi : 10.1080 / 03610910802049599. S2CID 32811488.
Dudewicz, E.J.; Ахмед, С. У. (1998). «Новое точное и асимптотически оптимальное решение проблемы Беренса – Фишера с таблицами». Американский журнал математических и управленческих наук. 18 (3–4): 359–426. doi : 10.1080 / 01966324.1998.10737471.
Dudewicz, E.J.; Ахмед, С. У. (1999). «Новые точные и асимптотически оптимальные гетероскедастические статистические процедуры и таблицы, II». Американский журнал математических и управленческих наук. 19 (1-2): 157-180. doi : 10.1080 / 01966324.1999.10737478.
Dudewicz, E.J.; Может.; Mai, S.E.; Су, Х. (2007). «Точные решения проблемы Беренса – Фишера: асимптотически оптимальный и конечный выборочный эффективный выбор среди». Журнал статистического планирования и вывода. 137 (5): 1584–1605. doi : 10.1016 / j.jspi.2006.09.007.
Фишер, Р. А. (1935). «Фидуциальный аргумент в статистическом выводе». Летопись евгеники. 8 (4): 391–398. doi : 10.1111 / j.1469-1809.1935.tb02120.x. hdl : 2440/15222.
Фишер, Р.А. (1941). "Асимптотический подход к интегралу Беренса с дальнейшими таблицами для d-теста значимости". Летопись евгеники. 11 : 141–172. doi : 10.1111 / j.1469-1809.1941.tb02281.x.
Fraser, D. A. S.; Руссо, Ж. (2008). «Студентизация и получение точных p-значений». Биометрика. 95(1): 1–16. doi : 10.1093 / biomet / asm093.
Lehmann, EL (1975) Непараметрические данные: статистические методы, основанные на рангах, Holden-Day ISBN 0 -8162-4996-6, McGraw-Hill ISBN 0-07-037073-7
(2002) «Простое консервативное и надежное решение проблема Беренса – Фишера », Санкхья: Индийский статистический журнал, серия A, 64 (1), 139–155.
Пардо, Дж. А.; Пардо, доктор медицины (2007). «Имитационное исследование нового семейства тестовых статистик для задачи Беренса – Фишера». Кибернетес. 36 (5–6): 806–816. doi : 10.1108 / 03684920710749866.
Савиловский, Шломо С. (2002). «Ферма, Шуберт, Эйнштейн и Беренс – Фишер: вероятная разница между двумя средними при σ 1 ≠ σ 2" (PDF). Журнал современных прикладных статистических методов. 1 (2). doi : 10.22237 / jmasm / 1036109940. Архивировано из исходного (PDF) 25 апреля 2012 г. Дата обращения: 2012- 03-08.
Уэлч, Б.Л. (1938). «Значимость разницы между двумя средними значениями, когда дисперсия популяций неравна». Биометрика. 29(3/4): 350–62. doi : 10.2307 / 2332010. JSTOR 2332010.
Велч, Б.Л. (1947), "Обобщение проблемы" Стьюдента "при нескольких различных дисперсиях совокупности участвуют ", Biometrika, 34(1-2): 28–35, doi : 10.1093 / biomet / 34.1-2.28, MR 0019277, PMID 20287819
Воинов, В.; Никулин, М. (1995). «К проблеме средних взвешенных нормальных популяций». Questiio. 19 (2): 7 –20.
Zheng, SR; Shi, NZ; Ma, WQ (2010). «Статистический вывод о различиях или крысах. ио средств из гетероскедастических нормальных популяций ". Журнал статистического планирования и вывода. 140 (5): 1236–1242. doi : 10.1016 / j.jspi.2009.11.010.

Внешние ссылки

Донг, Б.Л. (2004) Проблема Беренса – Фишера: подход эмпирического правдоподобия Рабочий документ EWP0404 по эконометрике, Университет Виктории