В вероятности и статистике, расстояние Хеллингера (тесно связано, хотя и отличается от Расстояние Бхаттачарьи ) используется для количественной оценки сходства между двумя распределениями вероятностей. Это разновидность f-дивергенции. Расстояние Хеллингера определяется в терминах интеграла Хеллингера, который был введен Эрнстом Хеллингером в 1909 году.
Содержание
- 1 Определение
- 1.1 Теория меры
- 1.2 Теория вероятностей с использованием меры Лебега
- 1.3 Дискретные распределения
- 2 Свойства
- 3 Связь с полным изменением расстояния
- 4 См. Также
- 5 Примечания
- 6 Ссылки
Определение
Теория меры
Чтобы определить расстояние Хеллингера в терминах теории меры, пусть P и Q обозначают две вероятностные меры, которые абсолютно непрерывны относительно третьей вероятностной меры λ. Квадрат расстояния Хеллингера между P и Q определяется как величина
Здесь dP / dλ и dQ / dλ - производные Радона – Никодима из P и Q соответственно. Это определение не зависит от λ, поэтому расстояние Хеллингера между P и Q не изменится, если λ заменить другой вероятностной мерой, относительно которой P и Q абсолютно непрерывны. Для компактности приведенная выше формула часто записывается как
Теория вероятностей с использованием меры Лебега
Чтобы определить расстояние Хеллингера в терминах элементарной теории вероятностей, мы берем λ как меру Лебега, так что dP / dλ и dQ / dλ - это просто функции плотности вероятности. Если обозначить плотности как f и g, соответственно, квадрат расстояния Хеллингера можно выразить в виде стандартного интеграла исчисления
, где вторая форма может быть получена путем расширения квадрата и использования того факта, что интеграл плотности вероятности по его области равен 1.
Расстояние Хеллингера H (P, Q) удовлетворяет свойству (выводимое из неравенства Коши – Шварца )
Дискретные распределения
Для двух дискретных распределений вероятностей и , их расстояние Хеллингера определяется как
который напрямую связан с евклидовой нормой разности векторов квадратного корня, т.е.
Кроме того,
Свойства
Расстояние Хеллингера образует ограниченную метрику на пространстве вероятностных распределений в заданном вероятностном пространстве.
Максимальное расстояние 1 достигается, когда P присваивает нулевую вероятность каждому набору, которому Q присваивает положительную вероятность, и наоборот.
Иногда множитель перед интегралом опускается, и в этом случае расстояние Хеллингера варьируется от от нуля до квадратного корня из двух.
Расстояние Хеллингера связано с коэффициентом Бхаттачарьи как это может быть определяется как
расстояния Хеллингера используются в теории последовательной и асимптотической статистики..
Квадрат расстояния Хеллингера между двумя нормальными распределениями и is:
Квадрат расстояния Хеллингера между двумя многомерными нормальными распределениями и равно:
Квадрат расстояния Хеллингера между двумя экспоненциальным распределением ns и это:
Квадрат расстояния Хеллингера между два распределения Вейбулла и (где - общий параметр формы, а - параметры масштаба соответственно):
Квадрат расстояния Хеллингера между двумя распределениями Пуассона с параметрами скорости и , так что и , это:
Квадрат расстояния Хеллингера между двумя бета-распределениями и равно:
где - это бета-функция.
Соединение с общим расстояние вариации
расстояние Хеллингера и общее расстояние вариации (или статистическое расстояние) связаны следующим образом:
Эти неравенства непосредственно следуют из неравенства между 1-нормой и 2-нормой.
См. также
Примечания
Ссылки
- Ян, Грейс Ло ; Ле Кам, Люсьен М. (2000). Асимптотика в статистике: некоторые основные понятия. Берлин: Springer. ISBN 0-387-95036-2.
- Vaart, A. W. van der. Асимптотическая статистика (Кембриджские серии по статистической и вероятностной математике). Кембридж, Великобритания: Издательство Кембриджского университета. ISBN 0-521-78450-6.
- Поллард, Дэвид Э. (2002). Руководство пользователя для измерения теоретической вероятности. Кембридж, Великобритания: Издательство Кембриджского университета. ISBN 0-521-00289-3.