Общая линейная модель или Общая многомерная модель регрессии - это просто компактный способ одновременного написания нескольких моделей множественной линейной регрессии. В этом смысле это не отдельная статистическая линейная модель. Различные модели множественной линейной регрессии можно компактно записать как
где Y - матрица с серией многомерных измерений (каждый столбец представляет собой набор измерений одной из зависимых переменных ), X - это матрица наблюдений по независимым переменным, которая может быть матрицей плана (каждый столбец представляет собой набор наблюдений по одной из независимых переменных), B - матрица, содержащая параметры, которые обычно подлежат оценке, а U - матрица, содержащая ошибок (шум). Ошибки обычно считаются некоррелированными между измерениями и подчиняются многомерному нормальному распределению . Если ошибки не соответствуют многомерному нормальному распределению, обобщенные линейные модели могут использоваться для ослабления предположений относительно Y и U.
Общая линейная модель включает в себя ряд различных статистических моделей: ANOVA, ANCOVA, MANOVA, MANCOVA, обычная линейная регрессия, t-тест и F-тест. Общая линейная модель - это обобщение множественной линейной регрессии на случай более чем одной зависимой переменной. Если бы Y, Bи U были векторами-столбцами, матричное уравнение выше представило бы множественную линейную регрессию.
Проверка гипотез с помощью общей линейной модели может быть выполнена двумя способами: многомерным или несколькими независимыми одномерными тестами. В многомерных тестах столбцы Y тестируются вместе, тогда как в одномерных тестах столбцы Y тестируются независимо, то есть как несколько одномерных тестов с одной и той же матрицей дизайна.
Множественная линейная регрессия - это обобщение простой линейной регрессии на случай более чем одной независимой переменной и особый случай общих линейных моделей, ограниченный одна зависимая переменная. Базовая модель множественной линейной регрессии:
для каждое наблюдение i = 1,..., n.
В приведенной выше формуле мы рассматриваем n наблюдений одной зависимой переменной и p независимых переменных. Таким образом, Y i является i-м наблюдением зависимой переменной, X ij является i-м наблюдением j-й независимой переменной, j = 1, 2,..., p. Значения β j представляют параметры, подлежащие оценке, а ε i представляет собой i независимую одинаково распределенную нормальную ошибку.
В более общей многомерной линейной регрессии существует одно уравнение вышеуказанной формы для каждой из m>1 зависимых переменных, которые имеют один и тот же набор независимых переменных и, следовательно, оцениваются одновременно друг с другом:
для всех наблюдений, индексированных как i = 1,..., n и для всех зависимых переменных, индексированных как j = 1,..., m.
Обратите внимание, что, поскольку каждая зависимая переменная имеет свой собственный набор параметров регрессии, которые необходимо подобрать, с вычислительной точки зрения общая многомерная регрессия представляет собой просто последовательность стандартных множественных линейных регрессий с использованием одних и тех же независимых переменных.
Общая линейная модель (GLM) и обобщенная линейная модель (GLiM) - это два часто используемых семейства статистических методов, чтобы связать некоторое количество непрерывных и / или категориальных предикторов с единственной выходной переменной.
. Основное различие между двумя подходами состоит в том, что GLM строго предполагает, что остатки будет следовать условно нормальному распределению, в то время как GLiM ослабляет это предположение и допускает множество других распределений из экспоненциального семейства по остаткам. Следует отметить, что GLM является частным случаем GLiM, в котором распределение остатков следует условно нормальному распределению.
Распределение остатков во многом зависит от типа и распределения переменной результата; различные типы переменных результата приводят к разнообразию моделей в семействе GLiM. Обычно используемые модели в семействе GLiM включают бинарную логистическую регрессию для бинарных или дихотомических результатов, регрессию Пуассона для подсчета результатов и линейную регрессию для непрерывных, нормально распределенных результатов.. Это означает, что о GLiM можно говорить как об общем семействе статистических моделей или как о конкретных моделях для конкретных типов результатов.
Общая линейная модель | Обобщенная линейная модель | |
---|---|---|
Типичный метод оценки | Наименьшие квадраты, наилучшее линейное несмещенное предсказание | Максимальное правдоподобие или Байесовский |
Примеры | ANOVA, ANCOVA, линейная регрессия | линейная регрессия, логистическая регрессия, регрессия Пуассона, гамма регрессия, общая линейная модель |
Расширения и связанные методы | MANOVA, MANCOVA, линейная смешанная модель | обобщенная линейная смешанная модель (GLMM), обобщенные уравнения оценки (GEE) |
R пакет и функция | lm () в пакете статистики (базовый R) | glm () в пакете статистики (базовый R) |
Matlab function | mvregress () | glmfit () |
SAS процедуры | PROC GLM, PROC REG | PROC GENMOD, PROC LOGISTIC (для двоичных и упорядоченных или неупорядоченных категориальных результатов) |
Stata команда | regress | glm |
SPSS команда | регрессия, glm | genlin, logistic |
Wolfram Language Mathematica function | LinearModelFit | GeneralizedLinearModelFit |
EViews команда | ls | glm |
Применение общей линейной модели появляется при анализе нескольких сканирований мозга в научных экспериментах, где Yсодержит данные из мозга сканеры, Xсодержит переменные экспериментального плана и препятствия. Обычно он тестируется одномерным способом (в этой настройке обычно называется массово-одномерный) и часто называется статистическим параметрическим отображением.
|journal=
()