Уровень измерения

редактировать
различие между номинальными, порядковыми, интервальными и относительными числами

Уровень измерения или шкала мера - это классификация, описывающая характер информации в пределах значений, присвоенных переменным. Психолог Стэнли Смит Стивенс разработал наиболее известную классификацию с четырьмя уровнями или шкалами измерения: номинальный, порядковый, интервал, и соотношение. Эта система различения уровней измерения возникла в психологии и широко критикуется учеными других дисциплин. Другие классификации включают классификации Мостеллера и Тьюки, а также Крисмана.

Содержание
  • 1 Типология Стивенса
    • 1.1 Обзор
      • 1.1.1 Сравнение
    • 1.2 Номинальный уровень
      • 1.2.1 Математические операции
      • 1.2.2 Центральная тенденция
    • 1.3 Порядковая шкала
    • 1.4 Интервальная шкала
      • 1.4.1 Центральная тенденция и статистическая дисперсия
    • 1,5 Шкала соотношений
  • 2 Дебаты по типологии Стивенса
    • 2.1 Другие предлагаемые типологии
      • 2.1.1 Типология Мостеллера и Тьюки (1977)
      • 2.1.2 Типология Крисмана (1998)
    • 2.2 Типы шкал и «операциональная теория измерения» Стивенса
      • 2.2.1 Одна и та же переменная может отличаться тип шкалы в зависимости от контекста
  • 3 См. также
  • 4 Ссылки
  • 5 Дополнительная литература
Типология Стивенса

Обзор

Стивенс предложил свою типологию в 1946 году Наука статья «К теории шкал измерения». В этой статье Стивенс утверждал, что все измерения в науке проводились с использованием четырех различных типов шкал, которые он назвал «номинальной», «порядковой», «интервальной» и «пропорцией», объединяя обе «качественный »(описываемый его« номинальным »типом) и« количественный »(в разной степени все остальные его шкалы). Концепция типов шкалы позже получила математическую строгость, которой не хватало вначале благодаря работам математических психологов Теодора Альпера (1985, 1987), Луи Наренса (1981a, b) и R. Дункан Люс (1986, 1987, 2001). Как пишет Люс (1997, с. 395):

С. С. Стивенс (1946, 1951, 1975) утверждал, что то, что считается, имеет интервал или шкалу отношений. Последующие исследования придали смысл этому утверждению, но, учитывая его попытки ссылаться на идеи типа шкалы, сомнительно, понимал ли он это сам... ни один из известных мне теоретиков измерения не принимает широкое определение измерения Стивенса... на наш взгляд, единственное разумное значение для «правила» - это эмпирически проверяемые законы об атрибуте.

Сравнение

Для лучшего обзора значения в «Математических операторах», «Расширенные операции» и «Центральная тенденция» являются единственными этот уровень измерения вводит. Полный список включает значения предыдущих уровней. Это инвертируется для «Свойство измерения».

Инкрементальный

прогресс

Свойство измеренияМатематические

операторы

Расширенные

операции

Центральная

тенденция

НоминальнаяКлассификация, принадлежность=, ≠Группировка Режим
ПорядковыйСравнение, уровень>, <Сортировка Медиана
ИнтервалРазница, родство+, -Метка Среднее,

Отклонение

ОтношениеВеличина, количество×, /Соотношение Среднее геометрическое,

Коэффициент вариации

Номинальный уровень

Номинальный тип различает предметы или предметы только на основе их названий или (мета-) категории и другие качественные классификации, к которым они принадлежат; таким образом, дихотомические данные включают построение классификаций, а также классификацию предметов. Обнаружение исключения в классификации можно рассматривать как прогресс. Числа могут использоваться для представления переменных, но числа не имеют числового значения или отношения: например, глобальный уникальный идентификатор.

Примеры этих классификаций включают пол, национальность, этническую принадлежность, язык, жанр, стиль, биологический виды и формы. В университете также можно использовать в качестве примера зал филиалов. Другие конкретные примеры:

Номинальные шкалы часто назывались качественными шкалами, а измерения, выполненные на качественных шкалах, назывались качественными данными. Однако рост количества качественных исследований сделал это использование запутанным. Если числа назначены в качестве меток при номинальном измерении, они не имеют конкретного числового значения или значения. Никакие арифметические вычисления (+, -, × и т. Д.) Не могут выполняться для номинальных показателей. Номинальный уровень - это самый низкий уровень измерения, используемый со статистической точки зрения.

Математические операции

Равенство и другие операции, которые могут быть определены в терминах равенства, такие как неравенство и установить членство, являются единственными нетривиальные операции, которые обычно применяются к объектам номинального типа.

Центральная тенденция

Режим , то есть наиболее распространенный элемент, допускается в качестве меры центральной тенденции для номинального типа. С другой стороны, медиана, то есть элемент со средним рейтингом, не имеет смысла для номинального типа данных, поскольку ранжирование не имеет смысла для номинального типа.

Порядковая шкала

Порядковый тип допускает порядок ранжирования (1-й, 2-й, 3-й и т. Д.), По которому данные могут быть отсортированы, но все же не учитывает относительную степень различия между ними. Примеры включают, с одной стороны, дихотомические данные с дихотомическими (или дихотомическими) значениями, такими как «больной» или «здоровый» при оценке состояния здоровья, «виновен» или «невиновен» при вынесении суждений в суды, «неверно / неверно» или «верно / верно» при измерении истинности, и, с другой стороны, недихотомических данных, состоящих из спектра значений, таких как как «полностью согласен», «в основном согласен», «в основном не согласен», «полностью не согласен» при измерении мнение.

Порядковая шкала расставляет события по порядку, но нет попытки уравнять интервалы шкалы с точки зрения какого-то правила. Порядки рангов представляют собой порядковые шкалы и часто используются в исследованиях, касающихся качественных явлений. Звание студента в его выпускном классе определяется по порядковой шкале. Нужно быть очень осторожным при утверждении оценок, основанных на порядковых шкалах. Например, если положение Деви в его классе равно 10, а положение Ганги - 40, нельзя сказать, что положение Деви в четыре раза лучше, чем положение Ганги. Это утверждение не имело бы никакого смысла. Порядковые шкалы позволяют ранжировать элементы только от самого высокого до самого низкого. Порядковые меры не имеют абсолютных значений, и реальные различия между соседними рангами могут не совпадать. Все, что можно сказать, - это то, что один человек выше или ниже по шкале, чем другой, но более точных сравнений сделать нельзя. Таким образом, использование порядковой шкалы подразумевает утверждение «больше чем» или «меньше чем» (утверждение равенства также допустимо) без нашей возможности указать, насколько больше или меньше. Реальная разница между рангами 1 и 2 может быть больше или меньше разницы между рангами 5 и 6. Поскольку числа этой шкалы имеют только ранговое значение, подходящей мерой центральной тенденции является медиана. Для измерения дисперсии используется процентиль или квартиль. Корреляции ограничиваются различными методами ранжирования. Меры статистической значимости ограничиваются непараметрическими методами (Р. М. Котари, 2004).

Центральная тенденция

Медианная, т. Е. Среднеранговая позиция допускается в качестве меры центральной тенденции ; однако среднее (или среднее) значение в качестве меры центральной тенденции не допускается. Разрешен режим .

В 1946 году Стивенс заметил, что психологическое измерение, такое как измерение мнений, обычно оперирует порядковыми шкалами; таким образом, средние значения и стандартные отклонения не имеют достоверности, но их можно использовать для получения идей о том, как улучшить операционализацию переменных, используемых в вопросниках. Большинство психологических данных, собранных с помощью психометрических инструментов и тестов, измеряющих когнитивные и другие способности, являются порядковыми, хотя некоторые теоретики утверждали, что их можно рассматривать как интервал или соотношение Весы. Однако имеется мало prima facie свидетельств того, что такие атрибуты являются чем-то большим, чем порядковые номера (Cliff, 1996; Cliff Keats, 2003; Michell, 2008). В частности, оценки IQ отражают порядковую шкалу, в которой все оценки имеют значение только для сравнения. Абсолютного нуля не существует, и разница в 10 пунктов может иметь разное значение в разных точках шкалы.

Шкала интервалов

Тип интервала учитывает степень различия между элементами, но не соотношение между ними. Примеры включают температуру с шкалой Цельсия, которая имеет две определенные точки (точка замерзания и кипения воды при определенных условиях), а затем разделена на 100 интервалов, дату при измерении от произвольной эпохи (например, нашей эры)., местоположение в декартовых координатах и ​​направление, измеренное в градусах от истинного или магнитного севера. Соотношения не имеют смысла, поскольку нельзя сказать, что 20 ° C «вдвое горячее», чем 10 ° C (в отличие от температуры в Кельвина ), а также нельзя выполнять умножение / деление между любыми двумя датами напрямую. Однако отношения различий могут быть выражены; например, одно различие может быть дважды другим. Переменные интервального типа иногда также называют «масштабируемыми переменными», но формальным математическим термином является аффинное пространство (в данном случае аффинная линия ).

Центральная тенденция и статистическая дисперсия

Режим , медиана и среднее арифметическое позволяют измерять центральную тенденцию интервальные переменные, тогда как меры статистической дисперсии включают диапазон и стандартное отклонение. Поскольку делить можно только по разностям, нельзя определить меры, требующие некоторых соотношений, таких как коэффициент вариации. Более тонко, хотя можно определить моменты относительно начала координат, только центральные моменты имеют значение, поскольку выбор происхождения произвольный. Можно определить стандартизованные моменты, поскольку отношения разностей значимы, но нельзя определить коэффициент вариации, поскольку среднее значение - это момент относительно начала координат, в отличие от стандартного отклонения, которое составляет (квадратный корень из) центральный момент.

Шкала отношения

Тип отношения получил свое название от того факта, что измерение - это оценка отношения между величиной непрерывной величины и единицей величины того же вида (Michell, 1997, 1999). Шкала отношения имеет значимое (уникальное и непроизвольное) нулевое значение. Большинство измерений в физических и технических науках выполняется на шкалах соотношений. Примеры включают массу, длину, продолжительность, угол плоскости, энергию и электрический заряд <179.>. В отличие от интервальных шкал, отношения теперь имеют смысл, потому что наличие непроизвольной нулевой точки делает значимым утверждение, например, что один объект имеет «вдвое большую длину». Очень неформально, многие шкалы отношений могут быть описаны как определяющие «сколько» чего-либо (то есть количество или величина) или «сколько» (количество). Температурная шкала Кельвина является шкалой отношений, потому что она имеет уникальную, не произвольную нулевую точку, называемую абсолютный ноль.

Центральная тенденция и статистическая дисперсия

Среднее геометрическое и среднее гармоническое позволяют измерять центральную тенденцию в дополнение к моде, медиане и среднему арифметическому. стьюдентизированный диапазон и коэффициент вариации позволяют измерять статистическую дисперсию. Разрешены все статистические измерения, поскольку для шкалы отношений определены все необходимые математические операции.

Споры о типологии Стивенса

Хотя типология Стивенса широко принята, другие теоретики все еще оспаривают ее, особенно в случаях номинального и порядкового типов (Michell, 1986). Некоторые, однако, утверждали, что степень разногласий можно переоценить. Хэнд говорит: «Тексты по базовой психологии часто начинаются с концепции Стивенса, и эти идеи распространены повсеместно. Действительно, существенная надежность его иерархии была установлена ​​математиками для репрезентативных измерений, определяющих свойства инвариантности отображений от эмпирических систем к континуумам реальных чисел. Безусловно. идеи были пересмотрены, расширены и доработаны, но примечательна его проницательность, учитывая относительно ограниченный формальный аппарат, доступный ему, и то, сколько десятилетий прошло с тех пор, как он их придумал ».

Дункан (1986) возразил к использованию слова «измерение» по отношению к номинальному типу, но Стивенс (1975) сказал о своем собственном определении измерения, что «присвоение может быть любым непротиворечивым правилом. Единственным недопустимым правилом было бы случайное присвоение, поскольку количество случайностей в эффект на нарушение правил ".

Использование среднего в качестве меры центральной тенденции для порядкового типа все еще является предметом споров среди тех, кто принимает типологию Стивенса. В любом случае многие бихевиористы используют среднее значение для порядковых данных. Это часто оправдывается тем, что порядковый тип в поведенческой науке фактически находится где-то между истинным порядковым и интервальным типами; хотя разница в интервале между двумя порядковыми рангами не постоянна, она часто бывает одного и того же порядка.

Например, применение моделей измерения в образовательной среде часто указывает на то, что общие баллы имеют довольно линейную взаимосвязь с измерениями во всем диапазоне оценки. Таким образом, некоторые утверждают, что до тех пор, пока неизвестная разность интервалов между рангами порядковой шкалы не слишком изменчива, статистические данные интервальной шкалы, такие как средние, могут быть значимо использованы для переменных порядковой шкалы. Программное обеспечение для статистического анализа, такое как SPSS, требует от пользователя выбора соответствующего класса измерения для каждой переменной. Это гарантирует, что последующие ошибки пользователя не могут случайно выполнить бессмысленный анализ (например, корреляционный анализ с переменной на номинальном уровне).

Л. Л. Терстон добился прогресса в разработке обоснования для получения интервального типа, основанного на законе сравнительного суждения. Распространенным применением закона является процесс аналитической иерархии. Дальнейший прогресс был достигнут Георгом Рашем (1960), который разработал вероятностную модель Раша, которая обеспечивает теоретическую основу и обоснование для получения измерений на интервальном уровне на основе подсчетов наблюдений, таких как общие баллы. по оценкам.

Были предложены другие предложенные типологии

Типологии помимо типологии Стивенса. Например, Мостеллер и Тьюки (1977), Нелдер (1990) описали непрерывный подсчет, непрерывные отношения, отношения подсчета и категориальные режимы данных. См. Также Chrisman (1998), van den Berg (1991).

Типология Мостеллера и Тьюки (1977)

Мостеллер и Тьюки отметили, что эти четыре уровня не являются исчерпывающими, и предложили:

  1. Имена
  2. Оценки (упорядоченные ярлыки, такие как начальный, средний, продвинутый)
  3. Ранги (порядки, где 1 - наименьший или наибольший, 2 - следующий наименьший или наибольший и т. Д.)
  4. Подсчитанные дроби (связанные 0 и 1)
  5. Подсчеты (неотрицательные целые числа)
  6. Суммы (неотрицательные действительные числа)
  7. Остатки (любое действительное число)

Например, проценты (вариация дробей в системе Мостеллера-Тьюки) плохо вписываются в структуру Стивенса: никакое преобразование полностью недопустимо.

Типология Крисмана (1998)

Николас Р. Крисман представил расширенный список уровней измерения для учета различных измерений, которые не обязательно соответствуют традиционным представлениям об уровнях измерения. Измерения, привязанные к диапазону и повторяющиеся (например, градусы по кругу, время на часах и т. Д.), Ранжированные категории членства и другие типы измерений не соответствуют оригинальной работе Стивенса, что привело к введению шести новых уровней измерения для всего десять:

  1. Номинальное
  2. Градация членства
  3. Порядковый
  4. Интервал
  5. Интервал журнала
  6. Расширенное соотношение
  7. Циклическое отношение
  8. Производное отношение
  9. Количество
  10. Абсолютное

Хотя некоторые утверждают, что расширенные уровни измерения редко используются за пределами академической географии, членство является центральным в теории нечетких множеств, в то время как абсолютные измерения включают вероятности, а также правдоподобие и незнание теории Демпстера-Шафера. Циклические измерения отношения включают углы и время. Подсчеты кажутся измерениями отношения, но шкала не является произвольной, а дробные подсчеты обычно бессмысленны. Измерения интервалов регистрации обычно отображаются в графиках фондового рынка. Все эти типы измерений обычно используются за пределами академической географии и не подходят для оригинальной работы Стивенса.

Типы шкал и «операциональная теория измерения» Стивенса

Теория типов шкал является интеллектуальной служанкой «операционной теории измерения» Стивенса, которая стала определяющей в психологии и поведенческие науки, несмотря на то, что Мичелл характеризует их как совершенно противоречащие измерениям в естественных науках (Michell, 1999). По сути, операционная теория измерения была реакцией на выводы комитета, учрежденного в 1932 году Британской ассоциацией развития науки для исследования возможности подлинного научного измерения в психологических и поведенческих науках. Этот комитет, который стал известен как комитет Фергюсона, опубликовал Заключительный отчет (Ferguson, et al., 1940, стр. 245), в котором шкала Стивенса сон (Stevens Davis, 1938) была предметом изучения. критика:

… любой закон, имеющий целью выразить количественную связь между интенсивностью ощущений и интенсивностью стимула, не просто ложен, но фактически бессмыслен до тех пор, пока не будет придан смысл понятию сложения в применении к ощущению.

То есть, если шкала Стивенса sone действительно измеряет интенсивность слуховых ощущений, то необходимо получить доказательства того, что такие ощущения являются количественными атрибутами. Необходимым доказательством было наличие аддитивной структуры - концепции, всесторонне рассматриваемой немецким математиком Отто Гёльдером (Hölder, 1901). Учитывая, что физик и теоретик измерений Норман Роберт Кэмпбелл доминировал в обсуждениях комитета Фергюсона, комитет пришел к выводу, что измерение в социальных науках невозможно из-за отсутствия операций конкатенации. Позднее этот вывод был опровергнут открытием теории совместных измерений Дебре (1960) и независимо Люс и Тьюки (1964). Однако реакция Стивенса заключалась не в проведении экспериментов для проверки наличия аддитивной структуры в ощущениях, а в том, чтобы сделать выводы комитета Фергюсона недействительными, предложив новую теорию измерения:

Перефразируя Н.Р. Кэмпбелла (Заключительный отчет, p.340), мы можем сказать, что измерение в самом широком смысле определяется как присвоение числовых значений объектам и событиям в соответствии с правилами (Stevens, 1946, p.677).

Стивенс находился под сильным влиянием идеи другого гарвардского академика, лауреата Нобелевской премии физика Перси Бриджмена (1927), чье учение об операционизме Стивенс использовал для определения измерения. В определении Стивенса, например, это использование рулетки, которая определяет длину (объект измерения) как измеримую (и, следовательно, косвенно количественную). Критики операционизма возражают, что он смешивает отношения между двумя объектами или событиями со свойствами одного из объектов или событий (Hardcastle, 1995; Michell, 1999; Moyer, 1981a, b; Rogers, 1989).

Канадский теоретик измерений (1966) был одним из первых и резких критиков теории Стивенса о типах шкалы.

Одна и та же переменная может иметь разный тип шкалы в зависимости от контекста

Другая проблема заключается в том, что одна и та же переменная может быть разным типом шкалы в зависимости от того, как она измеряется, и от целей анализа. Например, цвет волос обычно рассматривается как номинальная переменная, поскольку в нем нет явной упорядоченности. Однако заказать цвета (в том числе краски для волос) можно разными способами, в том числе по оттенку; это известно как колориметрия. Оттенок - это переменная уровня интервала.

См. Также
Ссылки
Дополнительная литература
В Викиверситете есть учебные ресурсы по Уровню измерения
Последняя правка сделана 2021-05-27 07:14:10
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте