В статистике, А последовательность (или вектор) от случайных величин является гомоскедастичной / ˌ ч oʊ м oʊ с к ə д æ ы т ɪ к /, если всей ее случайные величины имеют одинаковую конечную дисперсию. Это также известно как однородность дисперсии. Дополнительное понятие называется гетероскедастичностью. Написание хомос к edasticity и heteros к edasticity также часто используется.
Предполагая, что переменный являешься гомоскедастичным, когда на самом деле это гетероскедастическое ( / ˌ ч ɛ т ər oʊ ы к ə д æ ы т ɪ к / ) приводит к несмещенным но неэффективным точечным оценкам и в смещенных оценках стандартных ошибок, а также может привести к переоценка качества соответствия, измеренного с помощью коэффициента Пирсона.
Стандартное допущение в линейной регрессии, является то, что дисперсия термина возмущения одинакова для наблюдения, и, в частности, не зависит от значений объясняющих переменных Это одно из предположений, при которых Гаусса-Маркова теорема относится и Метод наименьших квадратов (МНК) дает наилучшую линейную несмещенную оценку («СИНИЙ»). Гомоскедастичность не требуется для того, чтобы оценки коэффициентов были несмещенными, непротиворечивыми и асимптотически нормальными, но она необходима для эффективности МНК. Также требуется, чтобы стандартные ошибки оценок были несмещенными и непротиворечивыми, поэтому это требуется для точной проверки гипотез, например, для t-критерия, существенно ли отличается от нуля коэффициент.
Более формальный способ сформулировать предположение о гомоскедастичности состоит в том, что диагонали матрицы дисперсии-ковариации должны иметь одно и то же число:, где одинаково для всех i. Обратите внимание, что это по-прежнему позволяет недиагоналям, ковариациям, быть отличными от нуля, что является отдельным нарушением предположений Гаусса-Маркова, известных как серийная корреляция.
Приведенные ниже матрицы представляют собой ковариации возмущения с записями, когда есть только три наблюдения во времени. Возмущение в матрице A гомоскедастично; это простой случай, когда OLS - лучшая линейная несмещенная оценка. Возмущения в матрицах B и C гетероскедастичны. В матрице B дисперсия изменяется во времени, неуклонно увеличиваясь во времени; в матрице C дисперсия зависит от значения x. Нарушение в матрице D гомоскедастично, потому что диагональные дисперсии постоянны, даже если недиагональные ковариации не равны нулю, а обычный метод наименьших квадратов неэффективен по другой причине: последовательная корреляция.
Если y - потребление, x - доход, и это прихоти потребителя, и мы оцениваем, тогда, если прихоти более богатых потребителей влияют на их расходы больше в абсолютных долларах, мы могли бы расти вместе с доходом, как в матрице C выше.
Остатки можно проверить на гомоскедастичность с помощью теста Бреуша – Пагана, который выполняет вспомогательную регрессию квадратов остатков для независимых переменных. Из этой вспомогательной регрессии сохраняется объясненная сумма квадратов, деленная на два, а затем становится тестовой статистикой для распределения хи-квадрат со степенями свободы, равными количеству независимых переменных. Нулевая гипотеза этого теста хи-квадрат - гомоскедастичность, а альтернативная гипотеза укажет на гетероскедастичность. Поскольку тест Бреуша – Пагана чувствителен к отклонениям от нормальности или к малым размерам выборки, вместо него обычно используется тест Кенкера – Бассетта или «обобщенный тест Бреуша – Пагана». Из вспомогательной регрессии он сохраняет значение R-квадрата, которое затем умножается на размер выборки, а затем становится тестовой статистикой для распределения хи-квадрат (и использует те же степени свободы). Хотя это не обязательно для теста Кенкера-Бассетта, тест Бреуша-Пагана требует, чтобы квадраты остатков также были разделены на остаточную сумму квадратов, деленную на размер выборки. Для проверки групповой гетероскедастичности требуется тест Гольдфельда – Квандта.
Два или более нормальные распределения, являются гомоскедастичными, если они имеют общую ковариацию (или корреляционные матрицы),. Гомоскедастические распределения особенно полезны для получения алгоритмов статистического распознавания образов и машинного обучения. Одним из популярных примеров алгоритма, предполагающего гомоскедастичность, является линейный дискриминантный анализ Фишера.
Понятие гомоскедастичности применимо к распределениям по сферам.