Гомоскедастичность

редактировать
График со случайными данными, показывающими гомоскедастичность: при каждом значении x значение y точек имеет примерно одинаковую дисперсию.

В статистике, А последовательность (или вектор) от случайных величин является гомоскедастичной / ˌ ч oʊ м oʊ с к ə д æ ы т ɪ к /, если всей ее случайные величины имеют одинаковую конечную дисперсию. Это также известно как однородность дисперсии. Дополнительное понятие называется гетероскедастичностью. Написание хомос к edasticity и heteros к edasticity также часто используется.

Предполагая, что переменный являешься гомоскедастичным, когда на самом деле это гетероскедастическое ( / ˌ ч ɛ т ər oʊ ы к ə д æ ы т ɪ к / ) приводит к несмещенным но неэффективным точечным оценкам и в смещенных оценках стандартных ошибок, а также может привести к переоценка качества соответствия, измеренного с помощью коэффициента Пирсона.

СОДЕРЖАНИЕ
  • 1 Предположения регрессионной модели
  • 2 Примеры
  • 3 Тестирование
  • 4 Гомоскедастические распределения
  • 5 См. Также
  • 6 Ссылки
Предположения регрессионной модели

Стандартное допущение в линейной регрессии, является то, что дисперсия термина возмущения одинакова для наблюдения, и, в частности, не зависит от значений объясняющих переменных Это одно из предположений, при которых Гаусса-Маркова теорема относится и Метод наименьших квадратов (МНК) дает наилучшую линейную несмещенную оценку («СИНИЙ»). Гомоскедастичность не требуется для того, чтобы оценки коэффициентов были несмещенными, непротиворечивыми и асимптотически нормальными, но она необходима для эффективности МНК. Также требуется, чтобы стандартные ошибки оценок были несмещенными и непротиворечивыми, поэтому это требуется для точной проверки гипотез, например, для t-критерия, существенно ли отличается от нуля коэффициент. у я знак равно Икс я β + ϵ я , я знак равно 1 , , N , {\ displaystyle y_ {i} = X_ {i} \ beta + \ epsilon _ {i}, i = 1, \ ldots, N,} ϵ я {\ displaystyle \ epsilon _ {я}} Икс я . {\ displaystyle X_ {i}.}

Более формальный способ сформулировать предположение о гомоскедастичности состоит в том, что диагонали матрицы дисперсии-ковариации должны иметь одно и то же число:, где одинаково для всех i. Обратите внимание, что это по-прежнему позволяет недиагоналям, ковариациям, быть отличными от нуля, что является отдельным нарушением предположений Гаусса-Маркова, известных как серийная корреляция. ϵ {\ displaystyle \ epsilon} E ϵ я ϵ я знак равно σ 2 {\ Displaystyle Е \ эпсилон _ {я} \ эпсилон _ {я} = \ сигма ^ {2}} σ 2 {\ displaystyle \ sigma ^ {2}} E ϵ я ϵ j {\ displaystyle E \ epsilon _ {i} \ epsilon _ {j}}

Примеры

Приведенные ниже матрицы представляют собой ковариации возмущения с записями, когда есть только три наблюдения во времени. Возмущение в матрице A гомоскедастично; это простой случай, когда OLS - лучшая линейная несмещенная оценка. Возмущения в матрицах B и C гетероскедастичны. В матрице B дисперсия изменяется во времени, неуклонно увеличиваясь во времени; в матрице C дисперсия зависит от значения x. Нарушение в матрице D гомоскедастично, потому что диагональные дисперсии постоянны, даже если недиагональные ковариации не равны нулю, а обычный метод наименьших квадратов неэффективен по другой причине: последовательная корреляция. E ϵ я ϵ j {\ displaystyle E \ epsilon _ {i} \ epsilon _ {j}}

А знак равно σ 2 [ 1 0 0 0 1 0 0 0 1 ] B знак равно σ 2 [ 1 0 0 0 2 0 0 0 3 ] C знак равно σ 2 [ Икс 1 0 0 0 Икс 2 0 0 0 Икс 3 ] D знак равно σ 2 [ 1 ρ ρ 2 ρ 1 ρ ρ 2 ρ 1 ] {\ Displaystyle A = \ sigma ^ {2} {\ begin {bmatrix} 1 amp; 0 amp; 0 \\ 0 amp; 1 amp; 0 \\ 0 amp; 0 amp; 1 \\\ end {bmatrix}} \; \; \; \; \; \; \; B = \ sigma ^ {2} {\ begin {bmatrix} 1 amp; 0 amp; 0 \\ 0 amp; 2 amp; 0 \\ 0 amp; 0 amp; 3 \\\ end {bmatrix}} \; \; \; \; \; \; \; C = \ sigma ^ {2} {\ begin {bmatrix} x_ {1} amp; 0 amp; 0 \\ 0 amp; x_ {2} amp; 0 \\ 0 amp; 0 amp; x_ {3} \\\ end {bmatrix}} \; \; \; \; \; \; \; D = \ sigma ^ {2 } {\ begin {bmatrix} 1 amp; \ rho amp; \ rho ^ {2} \\\ rho amp; 1 amp; \ rho \\\ rho ^ {2} amp; \ rho amp; 1 \\\ end {bmatrix}}}

Если y - потребление, x - доход, и это прихоти потребителя, и мы оцениваем, тогда, если прихоти более богатых потребителей влияют на их расходы больше в абсолютных долларах, мы могли бы расти вместе с доходом, как в матрице C выше. ϵ {\ displaystyle \ epsilon} у я знак равно β Икс я + ϵ я , {\ displaystyle y_ {i} = \ beta x_ {i} + \ epsilon _ {i},} V а р ( ϵ я ) знак равно Икс я σ 2 , {\ displaystyle Var (\ epsilon _ {i}) = x_ {i} \ sigma ^ {2},}

Тестирование

Остатки можно проверить на гомоскедастичность с помощью теста Бреуша – Пагана, который выполняет вспомогательную регрессию квадратов остатков для независимых переменных. Из этой вспомогательной регрессии сохраняется объясненная сумма квадратов, деленная на два, а затем становится тестовой статистикой для распределения хи-квадрат со степенями свободы, равными количеству независимых переменных. Нулевая гипотеза этого теста хи-квадрат - гомоскедастичность, а альтернативная гипотеза укажет на гетероскедастичность. Поскольку тест Бреуша – Пагана чувствителен к отклонениям от нормальности или к малым размерам выборки, вместо него обычно используется тест Кенкера – Бассетта или «обобщенный тест Бреуша – Пагана». Из вспомогательной регрессии он сохраняет значение R-квадрата, которое затем умножается на размер выборки, а затем становится тестовой статистикой для распределения хи-квадрат (и использует те же степени свободы). Хотя это не обязательно для теста Кенкера-Бассетта, тест Бреуша-Пагана требует, чтобы квадраты остатков также были разделены на остаточную сумму квадратов, деленную на размер выборки. Для проверки групповой гетероскедастичности требуется тест Гольдфельда – Квандта.

Гомоскедастические распределения

Два или более нормальные распределения, являются гомоскедастичными, если они имеют общую ковариацию (или корреляционные матрицы),. Гомоскедастические распределения особенно полезны для получения алгоритмов статистического распознавания образов и машинного обучения. Одним из популярных примеров алгоритма, предполагающего гомоскедастичность, является линейный дискриминантный анализ Фишера. N ( μ я , Σ я ) {\ Displaystyle N (\ му _ {я}, \ Sigma _ {я})} Σ я знак равно Σ j ,   я , j {\ Displaystyle \ Sigma _ {я} = \ Sigma _ {j}, \ \ forall i, j}

Понятие гомоскедастичности применимо к распределениям по сферам.

Смотрите также
использованная литература
Последняя правка сделана 2023-03-31 12:49:04
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте