Анализ ковариации

редактировать

Анализ ковариации (ANCOVA ) - это общая линейная модель, который сочетает в себе ANOVA и регрессию. ANCOVA оценивает, равны ли средние значения зависимой переменной (DV) на разных уровнях категориальной независимой переменной (IV), часто называемой обработкой, при статистическом контроле эффектов других непрерывных переменные, не представляющие особого интереса, известные как ковариаты (CV) или мешающие переменные. Математически ANCOVA разлагает дисперсию DV на дисперсию, объясняемую CV, дисперсию, объясняемую категориальным IV, и остаточную дисперсию. Интуитивно ANCOVA можно рассматривать как «настройку» DV с помощью групповых средств CV.

Модель ANCOVA предполагает линейную связь между ответом (DV) и коварией (CV):

$yij = μ + τ i + B (xij - x ¯) + ϵ ij. {\ displaystyle y_ {ij} = \ mu + \ tau _ {i} + \ mathrm {B} (x_ {ij} - {\ overline {x}}) + \ epsilon _ {ij}.}$ ${\ displaystyle y_ {ij} = \ mu + \ tau _ {i} + \ mathrm {B} (x_ {ij} - {\ overline {x}}) + \ эпсилон _ {ij}.}$

В это уравнение, DV, $yij {\ displaystyle y_ {ij}}$ $y_ {{ij}}$ является j-м наблюдением в i-й категориальной группе; CV, $x i j {\ displaystyle x_ {ij}}$ $x_ {ij}$ - это j-е наблюдение ковариаты в i-й группе. Переменные в модели, полученные из наблюдаемых данных: $μ {\ displaystyle \ mu}$ $\ mu$ (большое среднее) и $x ¯ {\ displaystyle {\ overline {x}}}$ ${\ overline {x}}$ (глобальное среднее для ковариаты $x {\ displaystyle x}$ $x$ ). Подбираемые переменные: $τ i {\ displaystyle \ tau _ {i}}$ $\ tau _ {i}$ (эффект i-го уровня IV), $B {\ displaystyle B}$ $B$ (наклон линии) и $ϵ ij {\ displaystyle \ epsilon _ {ij}}$ $\ epsilon _ {{ij}}$ (связанный член ненаблюдаемой ошибки для j-го наблюдения в i-й группе).

Согласно этой спецификации, сумма эффектов категориального лечения равна нулю $(∑ i a τ i = 0). {\ displaystyle \ left (\ sum _ {i} ^ {a} \ tau _ {i} = 0 \ right).}$ $\ left (\ sum_i ^ a \ tau_i = 0 \ right).$ Стандартные допущения модели линейной регрессии также считаются верными, так как обсуждается ниже.

Содержание

1 Использование
- 1.1 Увеличение мощности
- 1.2 Корректировка ранее существовавших различий
2 Допущения
- 2.1 Допущение 1: линейность регрессии
- 2.2 Допущение 2: однородность ошибки отклонения
- 2.3 Допущение 3: независимость членов ошибки
- 2.4 Предположение 4: нормальность членов ошибки
- 2.5 Предположение 5: однородность наклонов регрессии
3 Проведение ANCOVA
- 3.1 Тест мультиколлинеарности
- 3.2 Проверка предположения об однородности дисперсии
- 3.3 Проверка однородности предположения о наклонах регрессии
- 3.4 Выполнение анализа ANCOVA
- 3.5 Последующий анализ
4 Соображения по мощности
5 См. Также
6 Ссылки
7 Внешние ссылки

Использование

Увеличение мощности

ANCOVA может использоваться для увеличения статистической мощности (вероятность значительного различия находится между группой s, если он существует) за счет уменьшения ошибки внутри группы дисперсии. Чтобы понять это, необходимо понять тест, используемый для оценки различий между группами, F-тест. F-тест вычисляется путем деления объясненной дисперсии между группами (например, различий в состоянии выздоровления) на необъяснимую дисперсию внутри групп. Таким образом,

F = MS между MS в пределах {\ displaystyle F = {\ frac {MS_ {between}} {MS_ {within}}}}

{\ displaystyle F = {\ frac {MS_ {между}} {MS_ {в пределах}}}}

Если это значение больше критического значения, мы заключаем, что существует существенная разница между группами. Необъяснимая дисперсия включает дисперсию ошибок (например, индивидуальные различия), а также влияние других факторов. Поэтому влияние CV сгруппировано в знаменателе. Когда мы контролируем влияние CV на DV, мы удаляем его из знаменателя, увеличивая F, тем самым увеличивая вашу способность обнаружить значительный эффект, если он вообще существует.

Корректировка ранее существовавших различий

Другое использование ANCOVA - корректировка уже существующих различий в неэквивалентных (интактных) группах. Это спорная цель применения при коррекции начальных различий группы (до присвоения группы), которая существует на DV среди нескольких интактных групп. В этой ситуации участников нельзя уравнять путем случайного распределения, поэтому резюме используются для корректировки оценок и делают участников более похожими, чем без резюме. Однако даже с использованием ковариат не существует статистических методов, позволяющих приравнять неравные группы. Кроме того, CV может быть настолько тесно связан с IV, что удаление дисперсии DV, связанной с CV, устранит значительную дисперсию DV, сделав результаты бессмысленными.

Допущения

Там несколько ключевых предположений, которые лежат в основе использования ANCOVA и влияют на интерпретацию результатов. Стандартные допущения линейной регрессии остаются в силе; далее мы предполагаем, что наклон ковариаты одинаков для всех групп лечения (однородность наклонов регрессии).

Допущение 1: линейность регрессии

Отношение регрессии между зависимой переменной и сопутствующими переменными должно быть линейным.

Допущение 2: однородность дисперсий ошибок

Ошибка - это случайная величина с условным нулевым средним и равными дисперсиями для разных классов лечения и наблюдений.

Допущение 3: независимость членов ошибки

Ошибки не коррелированы. То есть матрица ковариации ошибок диагональна.

Допущение 4: нормальность условий ошибки

остатки (условия ошибки) должны быть нормально распределены $ϵ ij {\ displaystyle \ epsilon _ {ij}}$ $\ epsilon _ {{ij}}$ ~ $N (0, σ 2) {\ displaystyle N (0, \ sigma ^ {2})}$ $N (0, \ sigma ^ {2})$ .

Предположение 5: однородность наклонов регрессии

Наклоны различных линий регрессии должны быть эквивалентны, т. е. линии регрессии должны быть параллельны между группами.

Пятый вопрос, касающийся однородности различных наклонов регрессии лечения, особенно важен для оценки пригодности модели ANCOVA. Также обратите внимание, что нам нужно только, чтобы термины ошибки были нормально распределены. Фактически, и независимая переменная, и сопутствующие переменные в большинстве случаев не будут иметь нормального распределения.

Проведение ANCOVA

Тест мультиколлинеарность
Если CV сильно связано с другим CV (при корреляции 0,5 или более), то оно не будет корректироваться DV сверх другого резюме. То или другое следует удалить, поскольку они статистически избыточны.

Проверка однородности допущения о дисперсии

Проверено тестом Левена равенства дисперсий ошибок. Это наиболее важно после того, как были сделаны настройки, но если они у вас были до настройки, они, скорее всего, будут у вас после.

Проверка предположения об однородности наклонов регрессии

Чтобы увидеть, взаимодействует ли CV в значительной степени с IV, запустите модель ANCOVA, включающую член взаимодействия как IV, так и CVxIV. Если взаимодействие CVxIV является значительным, ANCOVA не следует выполнять. Вместо этого Грин и Салкинд предлагают оценивать групповые различия по DV на определенных уровнях CV. Также рассмотрите возможность использования модерированного регрессионного анализа, рассматривая CV и его взаимодействие как еще одну IV. В качестве альтернативы можно использовать анализ посредничества, чтобы определить, учитывает ли CV влияние IV на DV.

Выполнить анализ ANCOVA.

Если взаимодействие CV × IV не является значимым, повторно запустите ANCOVA без члена взаимодействия CV × IV. В этом анализе нужно использовать настроенные средства и настроенный MSerror. Скорректированные средние (также называемые средними наименьшими квадратами, средними значениями LS, оцененными предельными средними значениями или EMM) относятся к средним группам после учета влияния CV на DV.

Последующий анализ

Если был значительный основной эффект, это означает, что существует значительная разница между уровнями одной IV, игнорируя все другие факторы. Чтобы точно определить, какие уровни значительно отличаются друг от друга, можно использовать те же контрольные тесты, что и для ANOVA. Если имеется две или более IV, может иметь место значительное взаимодействие, что означает, что влияние одной IV на DV изменяется в зависимости от уровня другого фактора. Можно исследовать простые основные эффекты, используя те же методы, что и в факторном ANOVA.

Соображения мощности

В то время как включение ковариаты в ANOVA обычно увеличивает статистическую мощность на учитывая некоторую дисперсию в зависимой переменной и, таким образом, увеличивая коэффициент дисперсии, объясняемый независимыми переменными, добавление ковариаты в ANOVA также снижает степени свободы. Соответственно, добавление ковариаты, которая учитывает очень небольшую дисперсию зависимой переменной, может фактически снизить мощность.

См. Также

MANCOVA (многомерный анализ ковариации)

Ссылки

Внешние ссылки

Викиверситет имеет обучающие ресурсы по ANCOVA