В статистике стандартный балл - это количество стандартных отклонения, при которых значение необработанной оценки (т. е. наблюдаемого значения или точки данных) выше или ниже среднего значения того, что наблюдается или измеряется. Исходные баллы выше среднего имеют положительные стандартные баллы, тогда как баллы ниже среднего имеют отрицательные стандартные баллы.
Он рассчитывается путем вычитания среднего значения для индивидуальной исходной оценки и последующего деления разницы на генеральное стандартное отклонение. Этот процесс преобразования исходной оценки в стандартную оценку называется стандартизацией или нормализацией (однако «нормализация» может относиться ко многим типам соотношений; см. нормализация для большего).
Стандартные оценки чаще всего называются z-оценками ; эти два термина могут использоваться как синонимы, как и в этой статье. Другие термины включают z-значения, нормальные оценки, и стандартизованные переменные. .
Для вычисления z-оценки необходимо знать среднее значение и стандартное отклонение для всей совокупности, к которой принадлежит точка данных; если имеется только образец наблюдений от совокупности, то аналогичное вычисление с выборочным средним и выборочным стандартным отклонением дает t-статистику.
Если известны среднее значение генеральной совокупности и стандартное отклонение генеральной совокупности, исходная оценка x преобразуется в стандартную оценку на
, где:
Абсолютное значение z представляет собой расстояние между исходной оценкой x и средним генеральным значением в единицы стандартного отклонения. z отрицательно, если исходная оценка ниже среднего, и положительна, когда выше.
Для вычисления z с использованием этой формулы требуется среднее значение генеральной совокупности и стандартное отклонение генеральной совокупности, а не выборочное среднее или отклонение выборки. Но знать истинное среднее значение и стандартное отклонение генеральной совокупности часто нереально, за исключением таких случаев, как стандартизованное тестирование, когда измеряется вся совокупность.
Если среднее значение генеральной совокупности и стандартное отклонение генеральной совокупности неизвестны, стандартный балл может быть рассчитан с использованием выборочного среднего и выборочного стандартного отклонения в качестве оценок значений генеральной совокупности.
В этих случаях z -счет:
где:
В любом случае, поскольку числитель и знаменатель уравнения должны быть выражены в одних и тех же единицах измерения, и поскольку единицы компенсируются посредством деления, z остается как безразмерная величина.
Z-оценка часто используется в z-тесте стандартизованного тестирования - аналог t-теста Стьюдента для населения, параметры которого известны, а не оцениваются. Поскольку знать всю совокупность очень необычно, гораздо более широко используется t-критерий.
Стандартная оценка может использоваться при вычислении интервалов прогнозирования. Интервал прогнозирования [L, U], состоящий из нижней конечной точки, обозначенной L, и верхней конечной точки, обозначенной U, представляет собой интервал, такой, что будущее наблюдение X будет лежать в интервале с высокой вероятностью , т.е.
Для стандартной оценки Z для X это дает:
Путем определения квантиля z таким образом, что
следует:
В приложениях управления процессами значение Z дает оценку того, насколько нецелевой процесс работает.
Когда баллы измеряются по разным шкалам, они могут быть преобразованы в z-баллы для облегчения сравнения. Дитц и др. Приводят следующий пример сравнения баллов учащихся по (старым) тестам SAT и ACT в средней школе. В таблице показано среднее и стандартное отклонение для общего балла по SAT и ACT. Предположим, что t студент A набрал 1800 баллов по SAT, а студент B получил 24 балла по ACT. Какой ученик показал лучшие результаты по сравнению с другими тестируемыми?
SAT | ACT | |
---|---|---|
Среднее | 1500 | 21 |
Стандартное отклонение | 300 | 5 |
Z-балл для студента A равно
z -Оценка студента B составляет
Поскольку студент A имеет более высокий z-балл, чем студент B, студент A показал лучшие результаты по сравнению с другими тестируемыми, чем студент B.
Продолжая пример баллов ACT и SAT, если можно дополнительно предположить, что баллы ACT и SAT распределены нормально (что приблизительно верно), то z-баллы могут использоваться для расчета процента испытуемых, получивших более низкие оценки. баллов, чем у студентов A и B.
«Для некоторых многомерных методов, таких как многомерное масштабирование и кластерный анализ, th Концепция расстояния между единицами данных часто представляет значительный интерес и важность... Когда переменные в многомерном наборе данных имеют разные масштабы, имеет смысл рассчитывать расстояния после некоторой формы стандартизации. "
В анализе главных компонентов «Переменные, измеряемые по разным шкалам или по общей шкале с сильно различающимися диапазонами, часто стандартизируются».
Стандартизация переменных до множественного регрессионного анализа иногда используется в качестве вспомогательного средства для интерпретации. (стр. 95) заявляют следующее.
«Стандартный наклон регрессии - это наклон в уравнении регрессии, если X и Y стандартизированы… Стандартизация X и Y выполняется путем вычитания соответствующих средних значений из каждого набора наблюдений и деления на соответствующие стандартные отклонения… При множественной регрессии, где используются несколько переменных X, стандартизованные коэффициенты регрессии количественно определяют относительный вклад каждой переменной X ».
Однако Kutner et al. (стр. 278) дают следующее предостережение: «… следует проявлять осторожность при интерпретации любых коэффициентов регрессии, стандартизованных или нет. Причина в том, что, когда переменные-предикторы коррелированы между собой,… на коэффициенты регрессии влияют другие переменные-предикторы. в модели... На величину стандартизованных коэффициентов регрессии влияет не только наличие корреляций между переменными-предикторами, но и интервалы между наблюдениями по каждой из этих переменных. Иногда эти интервалы могут быть совершенно произвольными. Следовательно, это обычно неразумно интерпретировать величины стандартизованных коэффициентов регрессии как отражающие сравнительную важность переменных-предикторов ».
В математической статистике случайная величина X стандартизируется путем вычитания ее ожидаемое значение и деление разницы на его стандартное отклонение
Если рассматриваемая случайная величина является средним значением случайной выборки из X:
, тогда стандартизированная версия
В образовательной оценке Т-балл представляет собой стандартный балл Z, сдвинутый и масштабированный так, чтобы получить среднее значение 50 и стандартное отклонение 10.
При измерениях плотности костной ткани T-балл является стандартным баллом измерения по сравнению с популяцией здоровых 30-летних взрослых.