Нерешенная проблема в статистике :. Требуется ли приближение, аналогичное аргументу Фишера, для решения проблемы Беренса – Фишера? (больше нерешенных проблем в статистике) |
В статистика, проблема Беренса – Фишера, названная в честь Уолтера Беренса и Рональда Фишера, является проблемой интервальной оценки и проверки гипотез относительно разницы между средними значениями двух нормально распределенных популяций, когда дисперсии две совокупности не считаются равными на основании двух независимых выборок.
Одна из трудностей при обсуждении проблемы Беренса – Фишера и предлагаемых решений состоит в том, что существует множество различных интерпретаций того, что имеется в виду под «проблемой Беренса – Фишера». Эти различия касаются не только того, что считается подходящим решением, но даже основного положения рассматриваемого контекста.
Пусть X 1,..., X n и Y 1,..., Y m be iid выборки из двух популяций, которые происходят из одного и того же семейства распределений в масштабе местоположения. Предполагается, что масштабные параметры неизвестны и не обязательно равны, и проблема состоит в том, чтобы оценить, можно ли обоснованно считать параметры местоположения равными. Леманн заявляет, что «проблема Беренса – Фишера» используется как для этой общей формы модели, когда семейство распределений произвольно, так и для случая, когда делается ограничение на нормальное распределение. В то время как Леманн обсуждает ряд подходов к более общей проблеме, в основном основанных на непараметрических методах, в большинстве других источников, похоже, используется «проблема Беренса – Фишера» только для случая, когда распределение предполагается нормальным: большая часть этой статьи делает это предположение.
Были представлены решения проблемы Беренса – Фишера, использующие либо классический, либо байесовский вывод точки точка зрения, и любое решение было бы условно недействительным, если судить с другой точки зрения. Если рассмотрение ограничивается только классическим статистическим выводом, можно искать решения проблемы вывода, которые просты в практическом применении, отдавая предпочтение этой простоте любой неточности в соответствующих утверждениях вероятности. Если требуется точность уровней значимости статистических тестов, может существовать дополнительное требование, согласно которому процедура должна максимально использовать статистическую информацию в наборе данных. Хорошо известно, что точный тест может быть получен путем случайного отбрасывания данных из большего набора данных до тех пор, пока размеры выборки не станут равными, объединения данных в пары и взятия различий, а затем использования обычного t-теста для проверки для нулевой средней разности: очевидно, что это не было бы «оптимальным» ни в каком смысле.
Задача определения интервальных оценок для этой проблемы - та, где частотный подход не может обеспечить точное решение, хотя некоторые приближения доступны. Стандартные байесовские подходы также не дают ответа, который можно выразить в виде простых простых формул, но современные вычислительные методы байесовского анализа действительно позволяют находить по существу точные решения. Таким образом, исследование проблемы может быть использовано для выяснения различий между частотным и байесовским подходами к интервальной оценке.
Рональд Фишер в 1935 году ввел фидуциальный вывод, чтобы применить его к этой проблеме. Он сослался на более раннюю статью 1929 года. Беренс и Фишер предложили найти распределение вероятностей для
где и - это два примерных средних, а s 1 и s 2 - их стандартные отклонения. См. Распределение Беренса – Фишера. Фишер аппроксимировал это распределение, игнорируя случайное изменение относительных размеров стандартных отклонений,
Решение Фишера вызвало споры, потому что оно не имело того свойства, что гипотеза о равных средних будет отвергнута с вероятностью α, если средние фактически равны. С тех пор было предложено множество других методов решения проблемы, и их влияние на полученные доверительные интервалы было исследовано.
Широко используемым методом является метод Б. Л. Велч, который, как и Фишер, учился в Университетском колледже Лондона. Дисперсия средней разности
приводит к
Велч (1938) аппроксимировал распределение с помощью Тип III Распределение Пирсона (масштабированное распределение хи-квадрат ), первые два момента которого совпадают с моментом . Это применимо к следующему числу степеней свободы (df), которое обычно не является целым числом:
При нулевой гипотезе равных ожиданий μ 1 = μ 2, распределение статистики Беренса – Фишера T, которое также зависит от коэффициента дисперсии σ 1/σ2, теперь может быть аппроксимировано распределением Стьюдента с этими ν степенями свободы. Но этот ν содержит дисперсии совокупности σ i, и они неизвестны. Следующая оценка заменяет только дисперсии генеральной совокупности дисперсиями выборки:
Это - случайная величина. Распределения t со случайным числом степеней свободы не существует. Тем не менее, T Беренса – Фишера можно сравнить с соответствующим квантилем t-распределения Стьюдента с этими оценочными числами степеней свободы, , которое обычно не является целым числом. Таким образом, граница между областью приемлемости и отклонения статистического показателя Т теста вычисляется на основе эмпирических отклонений s i таким образом, который является плавной функцией от них.
Этот метод также не дает точной номинальной скорости, но, как правило, не так уж и далек. Однако, если дисперсии генеральной совокупности равны или если выборки довольно малы и дисперсии генеральной совокупности можно предположить приблизительно равными, более точным будет использовать t-критерий Стьюдента.
Было предложено несколько различных подходов к общей проблеме, некоторые из которых претендуют на «решение» некоторой версии проблемы. Среди них
В сравнении Дудевича с выбранных методов, было установлено, что для практического использования рекомендуется процедура Дудевича – Ахмеда.
В течение нескольких десятилетий принято считать, что не было найдено точного решения общей проблемы Беренса – Фишера. Однако в 1966 году было доказано, что у него есть точное решение. В 2018 году была доказана функция плотности вероятности обобщенного распределения Беренса-Фишера m средних и m различных стандартных ошибок из m выборок разных размеров из независимых нормальных распределений с различными средними и дисперсиями, а также в статье были рассмотрены ее асимптотические приближения. В последующей работе было показано, что классический парный t-критерий является центральной проблемой Беренса – Фишера с ненулевым коэффициентом корреляции совокупности, и соответствующая функция плотности вероятности была получена путем решения связанной с ней нецентральной задачи Беренса – Фишера с ненулевой совокупностью. коэффициент корреляции. Он также решил более общую нецентральную проблему Беренса – Фишера с ненулевым коэффициентом корреляции населения в приложении.
Был изучен второстепенный вариант проблемы Беренса – Фишера. В этом случае проблема состоит в том, чтобы, предполагая, что два средних значения совокупности фактически одинаковы, сделать выводы об общем среднем: например, можно потребовать доверительный интервал для общего среднего.
Одно обобщение проблемы включает многомерные нормальные распределения с неизвестными ковариационными матрицами и известно как многомерная задача Беренса – Фишера.
непараметрическая задача Беренса – Фишера не предполагает, что распределения являются нормальными. Тесты включают тест Куккони 1968 года и тест Лепажа 1971 года.