Гомоскедастичность

редактировать

График со случайными данными, показывающими гомоскедастичность: при каждом значении x значение y точек имеет примерно одинаковую дисперсию.

В статистике, А последовательность (или вектор) от случайных величин является гомоскедастичной / ˌ ч oʊ м oʊ с к ə д æ ы т ɪ к /, если всей ее случайные величины имеют одинаковую конечную дисперсию. Это также известно как однородность дисперсии. Дополнительное понятие называется гетероскедастичностью. Написание хомос к edasticity и heteros к edasticity также часто используется.

Предполагая, что переменный являешься гомоскедастичным, когда на самом деле это гетероскедастическое ( / ˌ ч ɛ т ər oʊ ы к ə д æ ы т ɪ к / ) приводит к несмещенным но неэффективным точечным оценкам и в смещенных оценках стандартных ошибок, а также может привести к переоценка качества соответствия, измеренного с помощью коэффициента Пирсона.

СОДЕРЖАНИЕ

1 Предположения регрессионной модели
2 Примеры
3 Тестирование
4 Гомоскедастические распределения
5 См. Также
6 Ссылки

Предположения регрессионной модели

Стандартное допущение в линейной регрессии, является то, что дисперсия термина возмущения одинакова для наблюдения, и, в частности, не зависит от значений объясняющих переменных Это одно из предположений, при которых Гаусса-Маркова теорема относится и Метод наименьших квадратов (МНК) дает наилучшую линейную несмещенную оценку («СИНИЙ»). Гомоскедастичность не требуется для того, чтобы оценки коэффициентов были несмещенными, непротиворечивыми и асимптотически нормальными, но она необходима для эффективности МНК. Также требуется, чтобы стандартные ошибки оценок были несмещенными и непротиворечивыми, поэтому это требуется для точной проверки гипотез, например, для t-критерия, существенно ли отличается от нуля коэффициент. ${\ displaystyle y_ {i} = X_ {i} \ beta + \ epsilon _ {i}, i = 1, \ ldots, N,}$ ${\ displaystyle y_ {i} = X_ {i} \ beta + \ epsilon _ {i}, i = 1, \ ldots, N,}$ ${\ displaystyle \ epsilon _ {я}}$ ${\ displaystyle \ epsilon _ {я}}$ ${\ displaystyle X_ {i}.}$ ${\ displaystyle X_ {i}.}$

Более формальный способ сформулировать предположение о гомоскедастичности состоит в том, что диагонали матрицы дисперсии-ковариации должны иметь одно и то же число:, где одинаково для всех i. Обратите внимание, что это по-прежнему позволяет недиагоналям, ковариациям, быть отличными от нуля, что является отдельным нарушением предположений Гаусса-Маркова, известных как серийная корреляция. ${\ displaystyle \ epsilon}$ ${\ displaystyle \ epsilon}$ ${\ Displaystyle Е \ эпсилон _ {я} \ эпсилон _ {я} = \ сигма ^ {2}}$ ${\ Displaystyle Е \ эпсилон _ {я} \ эпсилон _ {я} = \ сигма ^ {2}}$ ${\ displaystyle \ sigma ^ {2}}$ ${\ displaystyle \ sigma ^ {2}}$ ${\ displaystyle E \ epsilon _ {i} \ epsilon _ {j}}$ ${\ displaystyle E \ epsilon _ {i} \ epsilon _ {j}}$

Примеры

Приведенные ниже матрицы представляют собой ковариации возмущения с записями, когда есть только три наблюдения во времени. Возмущение в матрице A гомоскедастично; это простой случай, когда OLS - лучшая линейная несмещенная оценка. Возмущения в матрицах B и C гетероскедастичны. В матрице B дисперсия изменяется во времени, неуклонно увеличиваясь во времени; в матрице C дисперсия зависит от значения x. Нарушение в матрице D гомоскедастично, потому что диагональные дисперсии постоянны, даже если недиагональные ковариации не равны нулю, а обычный метод наименьших квадратов неэффективен по другой причине: последовательная корреляция. ${\ displaystyle E \ epsilon _ {i} \ epsilon _ {j}}$ ${\ displaystyle E \ epsilon _ {i} \ epsilon _ {j}}$

{\ Displaystyle A = \ sigma ^ {2} {\ begin {bmatrix} 1 amp; 0 amp; 0 \\ 0 amp; 1 amp; 0 \\ 0 amp; 0 amp; 1 \\\ end {bmatrix}} \; \; \; \; \; \; \; B = \ sigma ^ {2} {\ begin {bmatrix} 1 amp; 0 amp; 0 \\ 0 amp; 2 amp; 0 \\ 0 amp; 0 amp; 3 \\\ end {bmatrix}} \; \; \; \; \; \; \; C = \ sigma ^ {2} {\ begin {bmatrix} x_ {1} amp; 0 amp; 0 \\ 0 amp; x_ {2} amp; 0 \\ 0 amp; 0 amp; x_ {3} \\\ end {bmatrix}} \; \; \; \; \; \; \; D = \ sigma ^ {2 } {\ begin {bmatrix} 1 amp; \ rho amp; \ rho ^ {2} \\\ rho amp; 1 amp; \ rho \\\ rho ^ {2} amp; \ rho amp; 1 \\\ end {bmatrix}}}

{\ Displaystyle A = \ sigma ^ {2} {\ begin {bmatrix} 1 amp; 0 amp; 0 \\ 0 amp; 1 amp; 0 \\ 0 amp; 0 amp; 1 \\\ end {bmatrix}} \; \; \; \; \; \; \; B = \ sigma ^ {2} {\ begin {bmatrix} 1 amp; 0 amp; 0 \\ 0 amp; 2 amp; 0 \\ 0 amp; 0 amp; 3 \\\ end {bmatrix}} \; \; \; \; \; \; \; C = \ sigma ^ {2} {\ begin {bmatrix} x_ {1} amp; 0 amp; 0 \\ 0 amp; x_ {2} amp; 0 \\ 0 amp; 0 amp; x_ {3} \\\ end {bmatrix}} \; \; \; \; \; \; \; D = \ sigma ^ {2 } {\ begin {bmatrix} 1 amp; \ rho amp; \ rho ^ {2} \\\ rho amp; 1 amp; \ rho \\\ rho ^ {2} amp; \ rho amp; 1 \\\ end {bmatrix}}}

Если y - потребление, x - доход, и это прихоти потребителя, и мы оцениваем, тогда, если прихоти более богатых потребителей влияют на их расходы больше в абсолютных долларах, мы могли бы расти вместе с доходом, как в матрице C выше. ${\ displaystyle \ epsilon}$ $\ epsilon$ ${\ displaystyle y_ {i} = \ beta x_ {i} + \ epsilon _ {i},}$ ${\ displaystyle y_ {i} = \ beta x_ {i} + \ epsilon _ {i},}$ ${\ displaystyle Var (\ epsilon _ {i}) = x_ {i} \ sigma ^ {2},}$ ${\ displaystyle Var (\ epsilon _ {i}) = x_ {i} \ sigma ^ {2},}$

Тестирование

Остатки можно проверить на гомоскедастичность с помощью теста Бреуша – Пагана, который выполняет вспомогательную регрессию квадратов остатков для независимых переменных. Из этой вспомогательной регрессии сохраняется объясненная сумма квадратов, деленная на два, а затем становится тестовой статистикой для распределения хи-квадрат со степенями свободы, равными количеству независимых переменных. Нулевая гипотеза этого теста хи-квадрат - гомоскедастичность, а альтернативная гипотеза укажет на гетероскедастичность. Поскольку тест Бреуша – Пагана чувствителен к отклонениям от нормальности или к малым размерам выборки, вместо него обычно используется тест Кенкера – Бассетта или «обобщенный тест Бреуша – Пагана». Из вспомогательной регрессии он сохраняет значение R-квадрата, которое затем умножается на размер выборки, а затем становится тестовой статистикой для распределения хи-квадрат (и использует те же степени свободы). Хотя это не обязательно для теста Кенкера-Бассетта, тест Бреуша-Пагана требует, чтобы квадраты остатков также были разделены на остаточную сумму квадратов, деленную на размер выборки. Для проверки групповой гетероскедастичности требуется тест Гольдфельда – Квандта.

Гомоскедастические распределения

Два или более нормальные распределения, являются гомоскедастичными, если они имеют общую ковариацию (или корреляционные матрицы),. Гомоскедастические распределения особенно полезны для получения алгоритмов статистического распознавания образов и машинного обучения. Одним из популярных примеров алгоритма, предполагающего гомоскедастичность, является линейный дискриминантный анализ Фишера. ${\ Displaystyle N (\ му _ {я}, \ Sigma _ {я})}$ $N (\ mu_i, \ Sigma_i)$ ${\ Displaystyle \ Sigma _ {я} = \ Sigma _ {j}, \ \ forall i, j}$ $\ Sigma_i = \ Sigma_j, \ \ forall i, j$

Понятие гомоскедастичности применимо к распределениям по сферам.

Смотрите также

использованная литература