Обобщенная линейная смешанная модель

редактировать

В статистика, обобщенная линейная смешанная модель (GLMM) является расширением обобщенной линейной модели (GLM), в которой линейный предиктор содержит случайные эффекты в дополнение к обычным фиксированные эффекты. Они также унаследовали от GLM идею расширения линейных смешанных моделей на данные, отличные от нормальных.

GLM-модели предоставляют широкий спектр моделей для анализа сгруппированных данных, поскольку различия между группами можно моделировать как случайный эффект. Эти модели полезны при анализе многих видов данных, включая продольные данные.

Содержание
  • 1 Модель
  • 2 Подбор модели
  • 3 Программное обеспечение
  • 4 См. Также
  • 5 Ссылки
Модель

GLMM обычно определяются как такие, которые обусловлены случайными эффектами, u {\ displaystyle u}u , зависимой переменной, y {\ displaystyle y}y , распределяется согласно экспоненциальному семейству.

ln ⁡ p (y | u) = ∑ yi θ i - b (θ i) ϕ + c (yi, ϕ) {\ displaystyle \ ln {p} (y \ vert u) = \ sum {\ frac {y_ {i} \ theta _ {i} -b (\ theta _ {i})} {\ phi}} + c ( y_ {i}, \ phi)}{\ displaystyle \ ln {p} (y \ vert u) = \ sum {\ frac {y_ {i} \ theta _ {i} -b (\ theta _ {i})} {\ phi}} + c (y_ {i}, \ phi)}
E [y | u] = μ {\ displaystyle E [y \ vert u] = \ mu}{\ displaystyle E [y \ vert u] = \ mu}
v a r [y | u] знак равно ϕ V (μ) {\ displaystyle var [y \ vert u] = \ phi V (\ mu)}{\ displaystyle var [y \ vert u] = \ phi V (\ mu)}
g (μ) = X β + Z u {\ displaystyle g (\ mu) = X \ beta + Zu}{\ displaystyle g (\ mu) = X \ beta + Zu}

Где X {\ displaystyle X}X и β {\ displaystyle \ beta}\ beta - матрица проектирования с фиксированными эффектами, а фиксированные последствия; Z {\ displaystyle Z}Zи u {\ displaystyle u}u - это матрица плана случайных эффектов и случайные эффекты.

Полная вероятность,

ln ⁡ p (y, u) = ln ⁡ ∫ p (y | u) p (u) du {\ displaystyle \ ln {p} (y, u) = \ ln \ int p (y \ vert u) p (u) du}{\ displaystyle \ ln {p} (y, u) = \ ln \ int p (y \ vert u) p (u) du}

не имеет общей замкнутой формы, и интегрирование по случайным эффектам обычно требует чрезвычайно больших вычислительных ресурсов. В дополнение к численной аппроксимации этого интеграла (например, с помощью квадратур Гаусса – Эрмита ) были предложены методы, основанные на приближении Лапласа. Например, метод квази-правдоподобия со штрафными санкциями, который, по сути, включает многократную подгонку (т.е. дважды итерацию) взвешенной нормальной смешанной модели с рабочей переменной, реализуется различными коммерческими статистическими программами и программами с открытым исходным кодом.

Подбор модели

Подбор GLMM через максимальное правдоподобие (например, через AIC ) включает интегрирование по случайным эффектам. Как правило, эти интегралы не могут быть выражены в аналитической форме. Были разработаны различные приближенные методы, но ни один из них не имеет хороших свойств для всех возможных моделей и наборов данных (например, разгруппированные двоичные данные особенно проблематичны). По этой причине методы, использующие числовую квадратуру или цепь Маркова Монте-Карло, получили все большее распространение, поскольку увеличение вычислительной мощности и развитие методов сделали их более практичными.

Информационный критерий Акаике (AIC) является общим критерием для выбора модели. Недавно были получены оценки AIC для GLMM на основе некоторых распределений экспоненциального семейства.

Программное обеспечение
  • Несколько дополнительных пакетов в R обеспечивают функциональность GLMM
  • GLMM можно настроить с помощью SAS и SPSS
  • Matlab также предоставляет функцию под названием «fitglme» для соответствия моделям GLMM.
См. Также
Ссылки
Последняя правка сделана 2021-05-21 14:49:15
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте