Нормализация (статистика)

редактировать
Статистическая процедура

В статистике и приложениях статистики, нормализация может иметь ряд значений. В простейших случаях нормализация оценок означает приведение значений, измеренных в различных шкалах, к условно общей шкале, часто до усреднения. В более сложных случаях нормализация может относиться к более сложным корректировкам, когда цель состоит в том, чтобы привести все распределения скорректированных значений в соответствие. В случае нормализации баллов в образовательной оценке может иметься намерение привести распределения в соответствие с нормальным распределением. Другой подход к нормализации вероятностных распределений - это нормализация квантилей, где квантили различных показателей приводятся в соответствие.

В другом использовании в статистике нормализация относится к созданию смещенных и масштабированных версий статистики, где цель состоит в том, чтобы эти нормализованные значения позволяли сравнивать соответствующие нормализованные значения для разных наборов данных в способ, который устраняет эффекты некоторых грубых влияний, как в временном ряду аномалии. Некоторые типы нормализации включают только изменение масштаба, чтобы получить значения относительно некоторой переменной размера. С точки зрения уровней измерения, такие отношения имеют смысл только для измерений отношения (где значимы отношения измерений), а не интервальных измерений (где значимы только расстояния, но не отношения).

В теоретической статистике параметрическая нормализация часто может приводить к ключевым величинам - функциям, распределение выборки не зависит от параметров - и к вспомогательной статистике - основные величины, которые можно вычислить из наблюдений, не зная параметров.

Содержание

  • 1 Примеры
  • 2 Другие типы
  • 3 См. Также
  • 4 Ссылки

Примеры

В статистике существуют различные типы нормализации - безразмерные отношения ошибок, остатки, средние значения и стандартные отклонения, которые, следовательно, инвариантны к масштабу, некоторые из которых можно резюмировать следующим образом. Обратите внимание, что с точки зрения уровней измерения, эти отношения имеют смысл только для измерений отношения (где значимы отношения измерений), а не интервальных измерений (где значимы только расстояния, но не отношения). См. Также Категория: Статистические коэффициенты.

НазваниеФормулаИспользуйте
Стандартный счет X - μ σ {\ displaystyle {\ frac {X- \ mu } {\ sigma}}}{\ frac {X- \ mu} {\ sigma}} Нормализация ошибок, когда известны параметры совокупности. Хорошо работает для популяций, которые нормально распределены
t-статистика Стьюдента β ^ - β 0 s. е. ⁡ (β ^) {\ displaystyle {\ frac {{\ widehat {\ beta}} - \ beta _ {0}} {\ operatorname {se} ({\ widehat {\ beta}})}}}{\ displaystyle {\ frac {{\ widehat {\ beta}} - \ бета _ {0}} {\ operatorname {se} ({\ widehat {\ beta}})}}} отклонение оценочного значения параметра от его предполагаемого значения, нормированного на его стандартную ошибку.
Студентизированный остаток ε ^ i σ ^ i = X i - μ ^ i σ ^ i {\ displaystyle {\ frac {{\ hat {\ varepsilon}} _ {i}} {{\ hat {\ sigma}} _ {i}}} = {\ frac {X_ {i} - {\ hat {\ mu}} _ {i}} {{\ hat {\ sigma}} _ {i}}}}{\ displaystyle { \ frac {{\ hat {\ varepsilon}} _ {i}} {{\ hat {\ sigma}} _ {i}}} = {\ frac {X_ {i} - {\ hat {\ mu}} _ {i}} {{\ hat {\ sigma}} _ {i}}}} Нормализация остатков при оценке параметров, особенно по разным точкам данных в регрессионном анализе.
Стандартизованный момент μ k σ k {\ displaystyle {\ frac {\ mu _ {k}} {\ sigma ^ { k}}}}{\ frac {\ mu _ {k}} {\ sigma ^ {k}} } Нормализация моментов с использованием стандартного отклонения σ {\ displaystyle \ sigma}\ sigma в качестве меры масштаба.
Коэффициент вариации. σ μ {\ displaystyle {\ frac {\ sigma} {\ mu}}}{\ frac {\ sigma} {\ mu}} Нормализация дисперсии с использованием среднего μ {\ displaystyle \ mu}\ mu в качестве меры масштаба, особенно для положительного распределения, такого как экспоненциальное распределение и распределение Пуассона.
Мин-макс масштабирование объекта X ′ = X - X min X max - X min {\ displaystyle X '= {\ frac {X-X _ {\ min}} {X _ {\ max} -X _ {\ min}}}}{\displaystyle X'={\frac {X-X_{\min }}{X_{\max }-X_{\min }}}}Масштабирование объекта используется для все значения в диапазоне [0,1]. Это также называется нормализацией на основе единицы. Это можно обобщить, чтобы ограничить диапазон значений в наборе данных между любыми произвольными точками a {\ displaystyle a}a и b {\ displaystyle b}b , используя например X ′ = a + (X - X min) (b - a) X max - X min {\ displaystyle X '= a + {\ frac {\ left (X-X _ {\ min} \ right) \ left (ba \ right)} {X _ {\ max} -X _ {\ min}}}}{\displaystyle X'=a+{\frac {\left(X-X_{\min }\right)\left(b-a\right)}{X_{\max }-X_{\min }}}}.

Обратите внимание, что некоторые другие отношения, такие как отношение дисперсии к среднему (σ 2 μ) {\ textstyle \ left ({\ frac {\ sigma ^ {2}} {\ mu}} \ right)}{\ textstyle \ left ({\ frac {\ sigma ^ {2}} {\ mu}} \ right)} , также выполняются для нормализации, но не безразмерны: единицы не отменяются, и поэтому соотношение имеет единицы и не является масштабно-инвариантным.

Другие типы

Другие безразмерные нормализации, которые можно использовать без предположений о распределении, включают:

  • Назначение процентилей. Это обычное дело для стандартных тестов. См. Также квантильная нормализация.
  • Нормализация путем добавления и / или умножения на константы, чтобы значения попадали в интервал от 0 до 1. Это используется для функций плотности вероятности с приложениями в таких областях, как физическая химия в присвоение вероятностей | ψ |.

См. также

Литература

Последняя правка сделана 2021-05-31 12:39:56
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте