Дисперсионный анализ

редактировать
Сборник статистических моделей

Дисперсионный анализ (ANOVA ) представляет собой набор статистические модели и связанные с ними процедуры оценки (такие как «вариации» между группами), используемые для анализа различий между средними значениями групп в выборке. ANOVA был разработан статистиком Рональдом Фишером. ANOVA основан на законе общей дисперсии, где наблюдаемая дисперсия в конкретной переменной делится на компоненты, относящиеся к различным источникам вариации. В своей простейшей форме ANOVA обеспечивает статистический тест того, равны ли два или более совокупных средних, и, следовательно, обобщает t-тест за пределы двух средних.

Содержание
  • 1 История
  • 2 Пример
  • 3 Предпосылки и терминология
    • 3.1 Условия разработки экспериментов
  • 4 Классы моделей
    • 4.1 Модели с фиксированными эффектами
    • 4.2 Модели со случайными эффектами
    • 4.3 Модели со смешанными эффектами
  • 5 Допущения
    • 5.1 Анализ учебников с использованием нормального распределения
    • 5.2 Анализ на основе рандомизации
      • 5.2.1 Аддитивность единичной терапии
      • 5.2. 2 Производная линейная модель
      • 5.2.3 Статистические модели для данных наблюдений
    • 5.3 Резюме предположений
  • 6 Характеристики
  • 7 Логика
    • 7.1 Разделение суммы квадратов
    • 7.2 F-тест
    • 7.3 Расширенная логика
  • 8 Для одного фактора
  • 9 Для нескольких факторов
  • 10 Рабочие числовые примеры
  • 11 Сопутствующий анализ
    • 11.1 Подготовительный анализ
      • 11.1.1 Количество экспериментальных ед.
      • 11.1.2 Анализ мощности
      • 11.1.3 Величина эффекта
    • 11.2 Последующий анализ
      • 11.2.1 Подтверждение модели
      • 11.2.2 Последующие тесты
  • 12 Дизайн исследования
  • 13 Предостережения
  • 14 Обобщения
    • 14.1 Подключение к линейной регрессии
      • 14.1.1 Пример
  • 15 См. также
  • 16 Сноски
  • 17 Примечания
  • 18 Ссылки
  • 19 Дополнительная литература
  • 20 Внешние ссылки
История

В то время как дисперсионный анализ осуществился в 20 веке, предшественники уходят в прошлое, согласно Стиглеру. К ним относятся проверка гипотез, разделение сумм квадратов, экспериментальные методы и аддитивная модель. Лаплас проводил проверку гипотез в 1770-х годах. Около 1800 г. Лаплас и Гаусс разработали метод наименьших квадратов для объединения наблюдений, который улучшил методы, которые затем использовались в астрономии и геодезии. Он также инициировал большое исследование вкладов в суммы квадратов. Лаплас знал, как оценить дисперсию по остаточной (а не по общей) сумме квадратов. К 1827 году Лаплас использовал методы наименьших квадратов для решения задач ANOVA, касающихся измерений атмосферных приливов. До 1800 года астрономы имели отдельные ошибки наблюдений, возникающие из-за времени реакции («личное уравнение »), и разработали методы уменьшения ошибок. Экспериментальные методы, использованные при изучении личного уравнения, позже были приняты развивающейся областью психологии, которая разработала сильные (полные факторные) экспериментальные методы, к которым вскоре были добавлены рандомизация и ослепление. Красноречивое нематематическое объяснение модели аддитивных эффектов было доступно в 1885 году.

Рональд Фишер ввел термин дисперсия и предложил его формальный анализ в статье 1918 года Корреляция между родственниками по предположению менделевского наследования. Его первое применение дисперсионного анализа было опубликовано в 1921 году. Дисперсионный анализ стал широко известен после включения в книгу Фишера 1925 года Статистические методы для научных работников.

Модели рандомизации были разработаны несколькими исследователями. Первый был опубликован на польском языке Ежи Нейманом в 1923 году.

Одним из атрибутов ANOVA, который обеспечил его раннюю популярность, была вычислительная элегантность. Структура аддитивной модели позволяет решать аддитивные коэффициенты с помощью простой алгебры, а не с помощью матричных вычислений. В эпоху механических вычислителей эта простота имела решающее значение. Для определения статистической значимости также требовался доступ к таблицам функции F, которые были предоставлены в ранних статистических текстах.

Пример
Не подходит: молодые против старых и короткошерстные против длинношерстных Подходит: домашние животные против рабочих пород и менее спортивные против более атлетичных Очень хорошо подходят: вес по порода

Дисперсионный анализ может использоваться как исследовательский инструмент для объяснения наблюдений. Примером может служить выставка собак. Выставка собак - это не случайная выборка представителей породы: она обычно ограничивается взрослыми, чистокровными и образцовыми собаками. Гистограмма веса собак на выставке может быть довольно сложной, как желто-оранжевое распределение, показанное на иллюстрациях. Предположим, мы хотим предсказать вес собаки на основе определенного набора характеристик каждой собаки. Один из способов сделать это - объяснить распределение весов путем разделения популяции собак на группы на основе этих характеристик. Успешное группирование разделит собак таким образом, чтобы (а) каждая группа имела низкую дисперсию веса собак (что означает, что группа относительно однородна) и (б) среднее значение каждой группы различно (если две группы имеют одинаковое среднее значение, тогда оно неразумно делать вывод о том, что группы фактически разделены каким-либо значимым образом).

На иллюстрациях справа группы обозначены как X 1, X 2 и т. Д. На первой иллюстрации собаки разделены в соответствии с продуктом. (взаимодействие) двух бинарных групп: молодые против старых и короткошерстные против длинношерстных (например, группа 1 - молодые, короткошерстные собаки, группа 2 - молодые, длинношерстные собаки и т. д.). Поскольку распределение веса собак в каждой из групп (показано синим цветом) имеет относительно большую дисперсию, и поскольку средние значения очень похожи для разных групп, группирование собак по этим характеристикам не дает эффективного способа объяснить различия в весе собак. : знание того, в какой группе находится собака, не позволяет нам предсказать ее вес намного лучше, чем просто знать, что собака находится на выставке. Таким образом, эта группировка не может объяснить различия в общем распределении (желто-оранжевый).

Попытка объяснить распределение веса с помощью группировки собак как домашних и рабочих пород и менее атлетичных против более атлетичных, вероятно, будет несколько более успешной (справедливое соответствие). Самыми тяжелыми выставочными собаками, вероятно, будут большие, сильные, рабочие породы, в то время как породы, содержащиеся в качестве домашних животных, обычно меньше и, следовательно, легче. Как показано на втором рисунке, распределения имеют значительно меньшие отклонения, чем в первом случае, а средние значения более различимы. Однако значительное перекрытие распределений, например, означает, что мы не можем надежно различить X 1 и X 2. Группирование собак по методу подбрасывания монеты может привести к похожему распределению.

Попытка объяснить вес породой, вероятно, даст очень хорошее соответствие. Все чихуахуа легкие, а все сенбернары тяжелые. Разница в весе между сеттерами и пойнтерами не оправдывает отдельных пород. Дисперсионный анализ предоставляет формальные инструменты для обоснования этих интуитивных суждений. Обычно этот метод используется для анализа экспериментальных данных или разработки моделей. Этот метод имеет некоторые преимущества перед корреляцией: не все данные должны быть числовыми, и одним из результатов метода является оценка достоверности пояснительной взаимосвязи.

Предпосылки и терминология

ANOVA - это форма проверки статистических гипотез, широко используемая при анализе экспериментальных данных. Результат теста (рассчитанный на основе нулевой гипотезы и выборки) называется статистически значимым, если считается, что он вряд ли произошел случайно, при условии истинности нулевой гипотезы. Статистически значимый результат, когда вероятность (p-значение ) меньше заранее заданного порога (уровня значимости), оправдывает отклонение нулевой гипотезы, но только если априорная вероятность нулевой гипотезы невысока.

В типичном применении ANOVA нулевая гипотеза состоит в том, что все группы являются случайными выборками из одной и той же совокупности. Например, при изучении влияния различных видов лечения на аналогичные выборки пациентов нулевая гипотеза будет заключаться в том, что все виды лечения имеют одинаковый эффект (возможно, ни один). Отказ от нулевой гипотезы означает, что различия в наблюдаемых эффектах между группами лечения вряд ли могут быть вызваны случайностью.

По построению, проверка гипотез ограничивает частоту ошибок типа I (ложные срабатывания) до уровня значимости. Экспериментаторы также хотят ограничить ошибки типа II (ложноотрицательные результаты). Частота ошибок типа II в значительной степени зависит от размера выборки (частота больше для небольших выборок), уровня значимости (когда стандарт доказательства высок, вероятность пропустить открытие также высока) и размера эффекта (меньший размер эффекта более подвержен ошибкам типа II).

Терминология ANOVA в значительной степени основана на статистическом дизайне экспериментов. Экспериментатор корректирует факторы и измеряет ответы, пытаясь определить эффект. Факторы присваиваются экспериментальным единицам путем сочетания рандомизации и блокировки для обеспечения достоверности результатов. Ослепление сохраняет беспристрастность взвешивания. Ответы показывают изменчивость, которая частично является результатом эффекта и частично случайной ошибкой.

ANOVA - это синтез нескольких идей, который используется для нескольких целей. Как следствие, трудно дать краткое или точное определение.

«Классический» ANOVA для сбалансированных данных выполняет сразу три задачи:

  1. Как и исследовательский анализ данных, ANOVA использует аддитивное разложение данных, и его суммы квадратов указывают на дисперсию каждый компонент разложения (или, что то же самое, каждый набор членов линейной модели).
  2. Сравнение средних квадратов вместе с F-тестом... позволяют тестировать вложенная последовательность моделей.
  3. С ANOVA тесно связана линейная модель с оценками коэффициентов и стандартными ошибками.

Короче говоря, ANOVA - это статистический инструмент, используемый несколькими способами для разработки и подтверждения объяснения наблюдаемые данные.

Дополнительно:

  1. Он вычислительно элегантен и относительно устойчив к нарушениям его предположений.
  2. ANOVA обеспечивает надежный статистический анализ (сравнение нескольких выборок).
  3. Это было адаптирован для анализа различных экспериментальных проектов.

В результате: ANOVA «давно пользуется статусом наиболее используемого (некоторые сказали бы, злоупотребления) статистического метода в психологических исследованиях». ANOVA «вероятно, самый полезный метод в области статистического вывода».

ANOVA трудно обучить, особенно для сложных экспериментов, с схемами с разделением графиков, которые известны. В некоторых случаях правильное применение метода лучше всего определяется путем распознавания образов проблемы с последующей консультацией по классическому авторитетному тесту.

Условия планирования экспериментов

(сокращено из "NIST" Справочник по технической статистике »: Раздел 5.7. Глоссарий терминологии Министерства энергетики.)

Сбалансированный план
План эксперимента, в котором все ячейки (то есть комбинации обработок) имеют одинаковое количество наблюдений.
Блокировка
График проведения комбинаций обработки в экспериментальном исследовании, при котором любое влияние на результаты эксперимента из-за известного изменения сырья, операторов, машин и т. Д. Концентрируется на уровнях переменной блокировки.. Причина блокировки заключается в том, чтобы изолировать систематический эффект и не дать ему скрыть основные эффекты. Блокировка достигается ограничением рандомизации.
Дизайн
Набор экспериментальных прогонов, позволяющий подобрать конкретную модель и оценить эффекты.
DOE
Дизайн экспериментов. Подход к решению проблем, включающий сбор данных, которые поддержат верные, обоснованные и подтверждаемые выводы.
Эффект
Как изменение настроек фактора меняет ответ. Эффект одного фактора также называется основным эффектом.
Ошибка
Необъяснимая вариация в наборе наблюдений. DOE обычно требуют понимания как случайной ошибки, так и ошибки отсутствия соответствия.
Экспериментальная единица
Объект, к которому применяется определенная комбинация методов лечения.
Факторы
Обработка входных данных, которыми манипулирует исследователь, чтобы вызвать изменение выходных данных.
Ошибка несоответствия
Ошибка, возникающая, когда анализ пропускает один или несколько важных терминов или факторов из модель процесса. Включение репликации в DOE позволяет разделить экспериментальную ошибку на ее компоненты: отсутствие соответствия и случайная (чистая) ошибка.
Модель
Математическая взаимосвязь, которая связывает изменения в данной реакции с изменениями в одной или несколько факторов.
Случайная ошибка
Ошибка, возникающая из-за естественного отклонения в процессе. Обычно предполагается, что случайная ошибка имеет нормальное распределение с нулевым средним и постоянной дисперсией. Случайная ошибка также называется экспериментальной ошибкой.
Рандомизация
График распределения лечебного материала и проведения комбинаций обработок в DOE таким образом, чтобы условия в одном прогоне не зависели от условий предыдущего
Репликация
Выполнение одной и той же комбинации обработки более одного раза. Включение репликации позволяет оценить случайную ошибку независимо от какой-либо ошибки отсутствия соответствия.
Ответы
Выходные данные процесса. Иногда называется зависимой (ыми) переменной (ами).
Лечение
Лечение представляет собой определенную комбинацию уровней факторов, эффект которой следует сравнивать с другими видами лечения.
Классы моделей

Существует три класса моделей, используемых в дисперсионном анализе, и они описаны здесь.

Модели с фиксированными эффектами

Модель дисперсионного анализа с фиксированными эффектами (класс I) применяется к ситуациям, в которых экспериментатор применяет одно или несколько методов лечения к испытуемым в эксперименте, чтобы проверить, действительно ли значения переменной ответа изменяются. Это позволяет экспериментатору оценить диапазоны значений переменных ответа, которые лечение может вызвать в популяции в целом.

Модели случайных эффектов

Модель случайных эффектов (класс II) используется, когда обработки не фиксированы. Это происходит, когда различные уровни факторов выбираются из более широкой совокупности. Поскольку сами уровни являются случайными величинами, некоторые допущения и метод противопоставления обработок (многомерное обобщение простых различий) отличаются от модели с фиксированными эффектами.

Смешанные эффекты модели

Модель со смешанными эффектами (класс III) содержит экспериментальные факторы как с фиксированными, так и со случайными эффектами, с соответственно разными интерпретациями и анализом для двух типов.

Пример: Обучающие эксперименты могут проводиться колледжем или отделом университета, чтобы найти хороший вводный учебник, где каждый текст считается лечением. Модель с фиксированными эффектами будет сравнивать список текстов-кандидатов. Модель случайных эффектов будет определять, существуют ли важные различия между списком случайно выбранных текстов. Модель со смешанными эффектами будет сравнивать (фиксированные) существующие тексты со случайно выбранными альтернативами.

Определение фиксированных и случайных эффектов оказалось труднодостижимым, с конкурирующими определениями, возможно, ведущими к лингвистическому болоту.

Допущения

Анализ дисперсии был изучен с использованием нескольких подходов: наиболее распространенная из которых использует линейную модель, которая связывает реакцию с обработками и блоками. Обратите внимание, что модель линейна по параметрам, но может быть нелинейной по уровням факторов. Интерпретация проста, когда данные сбалансированы по факторам, но для несбалансированных данных требуется гораздо более глубокое понимание.

Анализ учебника с использованием нормального распределения

Дисперсионный анализ может быть представлен в терминах линейной модели, которая делает следующие допущения относительно распределения вероятностей ответов:

Отдельные допущения модели учебника подразумевают, что ошибки независимо, одинаково и нормально распределены для моделей с фиксированными эффектами, то есть ошибки (ε {\ displaystyle \ varepsilon}\varepsilon ) независимы и

ε ∼ N (0, σ 2). {\ displaystyle \ varepsilon \ Thicksim N (0, \ sigma ^ {2}). \,}\varepsilon \thicksim N(0, \sigma^2).\,

Анализ на основе рандомизации

В рандомизированном контролируемом эксперименте методы лечения случайным образом распределяется по экспериментальным единицам в соответствии с протоколом экспериментов. Эта рандомизация является объективной и объявляется до проведения эксперимента. Объективное случайное присвоение используется для проверки значимости нулевой гипотезы, следуя идеям C. С. Пирс и Рональд Фишер. Этот основанный на конструкции анализ был обсужден и разработан Фрэнсисом Дж. Энскомб на экспериментальной станции Ротамстед и Оскаром Кемпторном в Государственном университете Айовы. Кемпторн и его ученики делают предположение об аддитивности единичного лечения, которое обсуждается в книгах Кемпторна и Дэвида Р. Кокса.

Аддитивность единичного лечения

В простейшей форме предположение об аддитивности единичного лечения аддитивность лечения утверждает, что наблюдаемый ответ yi, j {\ displaystyle y_ {i, j}}y_{i,j}от экспериментальной единицы i {\ displaystyle i}iпри получении обработка j {\ displaystyle j}jможет быть записана как сумма реакции объекта yi {\ displaystyle y_ {i}}y_{i}и эффекта лечения tj {\ displaystyle t_ {j}} t_j, то есть

yi, j = yi + tj. {\ displaystyle y_ {i, j} = y_ {i} + t_ {j}.}y_{i,j}=y_i+t_j.

Предположение об аддитивности единичной обработки подразумевает, что для каждой обработки j {\ displaystyle j}j, j {\ displaystyle j}j-я обработка имеет точно такой же эффект tj {\ displaystyle t_ {j}}t_{j}на каждой экспериментальной единице.

По словам Кокса и Кемпторна, предположение об аддитивности единичного лечения обычно не может быть напрямую опровергнуто. Однако многие последствия аддитивности лечебного блока можно фальсифицировать. Для рандомизированного эксперимента предположение об аддитивности единичного лечения подразумевает, что дисперсияпостоянна для всех видов лечения. Следовательно, согласно противопоставлению, условием аддитивности единичной обработки является постоянство дисперсии.

Использование аддитивности единичного лечения и рандомизации аналогично выводу на основе дизайна, который является стандартным для конечной совокупности выборки обследования.

Производная линейная модель

Кемпторн использует рандомизацию -распределение и допущение об аддитивности единичной обработки для получения производной линейной модели, очень похожей на модель из учебника, обсуждавшуюся ранее. Тестовая статистика этой производной линейной модели близко аппроксимируется реальной политической линейной модели в соответствии с теоремами аппроксимации и исследованиями моделирования. Однако есть отличия. Например, анализ на основе рандомизации дает небольшую, но (строго) отрицательную корреляцию между наблюдениями. В анализе на основе рандомизации нет предположений о нормальном распределении и, конечно, о независимости. Напротив, наблюдения зависимые!

Анализ на основе рандомизации имеет тот недостаток, что его описание требует утомительной алгебры и больших времени затрат. Анализ на основе рандомизации сложный и близко аппроксимирующий подход, использующий нормальную линейную модель. Немногие статистики возражают против основанного на моделях анализа сбалансированных рандомизированных экспериментов.

Статистические модели для данных наблюдений

Однако, применительно к данным нерандомизированных экспериментов или наблюдательных исследований, анализ на основе моделей не требует рандомизации. Для наблюдений при выводе доверительных интервалов необходимо использовать субъективные модели, как подчеркивали Рональд Фишер и его последователи. На основе практики оценки методов на основе обсервационных исследований, как правило, часто противоречивы. На практике «статистические модели» и данные наблюдений полезны для выдвижения гипотез, к которой общественность должна относиться очень осторожно.

Резюме предположений

ANOVA-анализ на основе нормальной модели предполагает независимость, нормальность и однородность дисперсий остатков. Анализ на основе рандомизации предполагает только однородность дисперсий остатков (как следствие аддитивности единицы лечения) и использует рандомизации эксперимента. Оба эти анализа требуют гомоскедастичности в качестве допущения для нормального анализа модели и как следствие рандомизации и аддитивности для анализа на основе рандомизации.

Международные исследования процессов, которые происходят с помощью дисперсии, а не средние значения. Не требуется необходимых предположений для ANOVA в его полной общности, но F-тест, используется для проверки предположения ANOVA, существует предположения и практические ограничения, которые обеспечивают постоянный интерес.

, которые не удовлетворяют требованиям ANOVA. Свойство аддитивности единичной обработки не является инвариантным при «изменении масштаба», поэтому статистику часто используют преобразования для достижения аддитивности единичной обработки. Если ожидается, что переменная отклика будет следовать параметрам распределения вероятностей, то статистик может указать (в протоколе эксперимента или наблюдательного исследования), что отклики будут преобразованы для стабилизации дисперсии. Кроме того, статистик может указать, что к ответам применяются логарифмические преобразования, которые, как считается, соответствуют мультипликативной модели. Согласно теореме Коши о функциональном уравнении, логарифм является единственным непрерывным преобразованием, которое преобразует действительное умножение в сложение.

Характеристики

ANOVA используется в сравнительных экспериментах, в которых интересна только разница в результатах. Статистическая значимость эксперимента определяется использованием двух дисперсий. Это соотношение не зависит от нескольких изменений экспериментальных наблюдений: добавление константы всем наблюдениям не меняет значимости. Умножение всех наблюдений на константу не меняет значения. Таким образом, результат статистической значимости ANOVA не зависит от постоянного состояния и масштабирования, а также от единиц, используемых при выражении наблюдений. В эпоху механических вычислений было принято вычитать константу из всех наблюдений (что эквивалентно отбрасыванию ведущих цифр) для упрощения ввода данных. Это пример данных кодирования.

логики

Вычисления ANOVA можно охарактеризовать как вычисление средних и дисперсий, деление двух дисперсий и сравнение со значением из справочника для определения статистических данных. значение. В таком расчетном эффекте является тривиальным: «эффект любого лечения оценивается как разность между средним средним числом, в котором проводилось лечение, и общим средним средним».

Разделение суммы квадратов

ANOVA использует традиционную стандартизированную терминологию. Определяющее уравнение выборочной дисперсии: s 2 = 1 n - 1 ∑ (yi - y ¯) 2 {\ displaystyle s ^ {2} = \ textstyle {\ frac {1} {n-1}} \ sum (y_ {i} - {\ bar {y}}) ^ {2}}s^2=\textstyle\frac{1}{n-1}\sum(y_i-\bar{y})^2, где делитель называется степенями свободы (DF), суммирование называется суммой квадратов (SS), результат называется средним квадратом (MS), а квадраты члены представляют собой отклонение от выборочного среднего. ANOVA оценивает 3 дисперсии выборки: общую дисперсию, основанную на всех отклонениях наблюдений от общего среднего, дисперсию ошибок, основанную на всех отклонениях наблюдений от соответствующих обработки, и дисперсию лечения. Дисперсия на основе отклонений средних значений лечения от среднего, результат умножается на разницу между наблюдениями и дисперсией средних значений.

Основным методом является разделение общей суммы квадратов SS на компоненты, связанные с эффектами, используемыми в моделях. Например, модель для упрощенного дисперсионного анализа с одним типом обработки на разных уровнях.

Всего SS = Ошибка SS + Обработка SS {\ displaystyle SS _ {\ text {Total}} = SS _ {\ text {Error}} + SS _ {\ text {Обработки}}}SS_\text{Total} = SS_\text{Error} + SS_\text{Treatments}

Количество степеней свободы DF можно разделить аналогичным образом: один из этих компонентов (компонент ошибки) задает хи-квадрат, которое связано с этим размером квадратов, в то время как то же самое верно для «лечения», если нет лечебного эффекта.

DF Total = DF Error + DF Treatments {\ displaystyle DF _ {\ text {Total}} = DF _ {\ text {Error}} + DF _ {\ text {Treatments}}}DF_\text{Total} = DF_\text{Error} + DF_\text{Treatments}

См. Также Отсутствие Подгоночная сумма квадратов.

F-тест

F-тест используется для сравнения факторов общего отклонения. Например, в однофакторном или однофакторном дисперсионном анализе статистическая значимость проверяется путем сравнения статистики F-теста

F = дисперсия между вариантами лечения в рамках процедур {\ displaystyle F = {\ frac {\ text {дисперсия между обработок}} {\ text { В пределах обработок}}}}F = \frac{\text{variance between treatments}}{\text{variance within treatments}}
F = Обработка MS Ошибка MS = Обработка SS / (I - 1) Ошибка SS / (n T - I) {\ displaystyle F = {\ frac {MS _ {\ text { Лечение}}} {MS _ {\ text {Error}}}} = {{SS _ {\ text {Treatments}} / (I-1)} \ over {SS _ {\ text {Error}} / (n_ {T} -I)}}}F = \frac{MS_\text{Treatments}}{MS_\text{Error}} = {{SS_\text{Treatments} / (I-1)} \over {SS_\text{Error} / (n_T-I)}}

где MS - среднеквадратическое значение, I {\ displaystyle I}I= количество обработок и n T {\ displaystyle n_ {T}}n_T= общее количество наблюдений

для F-распределения с I - 1 {\ displaystyle I-1}I - 1, n T - I {\ displaystyle n_ {T} -I}n_T - Iстепени свободы. Использование F-распределения является естественным кандидатом, поскольку тестовая статистика представляет собой отношение двух масштабированных сумм квадратов, из которых соответствует масштабированному каждый распределению хи-квадрат.

Ожидаемое значение F равно 1 + n σ Обработка 2 / σ Ошибка 2 {\ displaystyle 1+ {n \ sigma _ {\ text {Treatment}} ^ {2}} / {\ sigma _ {\ text {Error}} ^ {2}}}1 + {n \sigma^2_\text{Treatment}} / {\sigma^2_\text{Error}}(где n {\ displaystyle n}n- размер выборки для лечения), равный 1, если эффект лечения отсутствует. По мере увеличения значения F выше 1 свидетельства становятся все более несовместимыми с нулевой гипотезой. Два очевидных экспериментальных метода увеличения - это увеличение размера выборки и уменьшение дисперсии ошибок за счет жесткого экспериментального эксперимента.

Существует два метода проверки проверки гипотезы ANOVA, оба из которых дают одинаковый результат:

  • Метод из учебника заключается в сравнении наблюдаемого значения F с критическим значением F, определенным из таблиц. Критическое значение F является функцией степеней свободы числителя и знаменателя, а также уровня значимости (α). Если F ≥ F Критический, нулевая гипотеза отвергается.
  • Компьютерный метод вычисляет вероятность (p-значение) значения F, большего или равного наблюдаемому значению. Нулевая гипотеза отклоняется, если эта вероятность меньше или равна значимости (α).

Известно, что F-тест ANOVA является почти оптимальным в смысле минимизации ложноотрицательных ошибок для фиксированного количества ложноположительных результатов. ошибки (т.е. максимизация мощности для фиксированного уровня значимости). Например, для проверки гипотезы о том, что различные виды лечения имеют точно такой же эффект, p-значения F-теста очень близки к p-значениям теста перестановки. значения : приближение особенно близко, когда конструкция сбалансирована. Такие тесты на перестановку характеризуют тесты с максимальной мощностью против всех альтернативных гипотез, как заметил Розенбаум. F-тест ANOVA (нулевой гипотезы о том, что все методы лечения имеют такой же эффект) рекомендуется в качестве практического теста из-за его устойчивости ко многим альтернативным точно распределениям.

Расширенная логика

ANOVA состоит из отдельных частей; разделение ошибок дисперсии и проверка гипотез "индиционально". ANOVA используется для поддержки других статистических инструментов. Сначала регрессия используется для подгонки более сложных моделей к данным, затем ANOVA используется для сравнения моделей с целью выбора простых (r) моделей, которые адекватно описывают данные. «Такие модели можно было бы подогнать без какой-либо ссылки на ANOVA, но затем можно было бы использовать инструменты ANOVA, чтобы разобраться в подогнанных моделях и проверить гипотезы о пакетах коэффициентов». «[Мы] думаем об анализе дисперсии как метода анализа и структурирования многоуровневых моделей - не как об альтернативе регрессии, как инструмент обобщения сложных многомерных выводов...»

Для фактора

Простей эксперимента, подходящим для анализа ANOVA, является полностью рандомизированным эксперимент с одним фактором. Более сложные эксперименты с одним фактором ограничения на рандомизацию включают полностью рандомизированные блоки и латинские квадраты (и варианты: греко-латинские квадраты и т. Д.). Более сложные эксперименты имеют много общего с множеством факторов. Относительно полное обсуждение анализа (модели, сводные данные, таблица дисперсионного анализа) полностью рандомизированного эксперимента доступно.

Для нескольких факторов

ANOVA обобщает для изучения эффектов нескольких факторов. Когда эксперимент включает наблюдения на всех комбинационных уровнях каждого фактора, он факториалом. Фактор экспериментов более эффективны, чем серия однофакторных экспериментов, и эффективность роста с использованием фактора роста. Следовательно, широко используются факторные планы.

Использование ANOVA для изучения эффектов нескольких факторов имеет сложность. В 3-стороннем ANOVA с факторами x, y и z модель ANOVA включает члены для основных эффектов (x, y, z) и члены для взаимодействий (xy, xz, yz, xyz). Все термины требуют проверки гипотез. Распространение терминов взаимодействия увеличивает риск того, что какая-то проверка гипотез случайно даст ложноположительный результат. К счастью, опыт показывает, что взаимодействия высокого порядка редки. Возможность обнаруживать взаимодействия - главное преимущество многофакторного дисперсионного анализа. Тестирование одного фактора за раз скрывает взаимодействия, но дает явно противоречивые экспериментальные результаты.

При обнаружении взаимодействий рекомендуется соблюдать осторожность; Сначала проверьте условия взаимодействия и расширьте анализ за пределы ANOVA, если взаимодействия обнаружены. Тексты различаются по своим рекомендациям относительно продолжения процедуры ANOVA после столкновения с взаимодействием. Взаимодействия затрудняют интерпретацию экспериментальных данных. Ни расчеты значимости, ни предполагаемые эффекты лечения нельзя принимать за чистую монету. «Существенное взаимодействие часто маскирует значимость основных эффектов». Для лучшего понимания рекомендуется использовать графические методы. Часто бывает полезна регрессия. Подробное обсуждение взаимодействий доступно в Cox (1958). Некоторые взаимодействия можно удалить (преобразованием), а другие нельзя.

В многофакторном дисперсионном анализе используются различные методы для снижения затрат. Одним из методов, используемых в факторных планах, является минимизация репликации (возможно, отсутствие репликации с поддержкой аналитического обмана ) и объединение групп, когда обнаруживается, что эффекты статистически (или практически) незначимы. Эксперимент с множеством несущественных факторов может свернуться в эксперимент с несколькими факторами, поддерживаемыми множеством повторений.

Рабочие числовые примеры

Многочисленные полностью проработанные числовые примеры доступны в стандартных учебниках и в Интернете. В простом случае используется односторонний (однофакторный) анализ.

Сопутствующий анализ

Некоторый анализ требуется в поддержку плана эксперимента, в то время как другой анализ выполняется после того, как изменения в факторах формально оказываются вызывающими статистически значимые изменения в ответах. Поскольку экспериментирование является повторяющимся, результаты одного эксперимента меняют планы последующих экспериментов.

Подготовительный анализ

Количество экспериментальных единиц

При планировании эксперимента количество экспериментальных единиц планируется для удовлетворения целей эксперимента. Эксперименты часто бывают последовательными.

Ранние эксперименты часто предназначены для получения объективных оценок эффектов лечения и экспериментальной ошибки. Более поздние эксперименты часто предназначены для проверки гипотезы о том, что лечебный эффект имеет важную величину; в этом случае количество экспериментальных единиц выбирается таким образом, чтобы эксперимент был в рамках бюджета и имел достаточную мощность, среди других целей.

Отчетный анализ размера выборки обычно требуется в психологии. «Предоставьте информацию о размере выборки и процессе, который привел к принятию решения о размере выборки». Анализ, который записывается в протоколе эксперимента до его проведения, изучается в заявках на гранты и в административных комиссиях.

Помимо анализа мощности, существуют менее формальные методы выбора количества экспериментальных единиц. К ним относятся графические методы, основанные на ограничении вероятности ложноотрицательных ошибок, графические методы, основанные на ожидаемом увеличении вариации (выше остатков), и методы, основанные на достижении желаемого доверительного интервала.

Анализ мощности

Анализ мощности часто применяется в контексте ANOVA для оценки вероятности успешного отклонения нулевой гипотезы, если мы предполагаем определенный дизайн ANOVA, размер эффекта в генеральной совокупности, размер выборки и уровень значимости. Анализ мощности может помочь в дизайне исследования, определяя, какой размер выборки потребуется, чтобы иметь разумный шанс отклонить нулевую гипотезу, когда альтернативная гипотеза верна.

Последняя правка сделана 2021-06-10 22:10:45
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте