Психометрия

редактировать
теория и методика психологического измерения

Психометрия - область исследований, посвященная теории и технике психологическое измерение. Согласно определению Национального совета по измерениям в образовании (NCME) США, психометрия относится к психологическим измерениям. Как правило, это относится к области психологии и образования, которая посвящена тестированию, измерению, оценке и другим видам деятельности.

Эта область связана с объективным измерением навыков и знаний, способности, отношения, личностные качества и образовательные достижения. Некоторые исследователи психометрии сосредотачиваются на создании и проверке инструментов оценки, таких как анкеты, тесты, суждения оценщиков, шкалы психологических симптомов и личностные тесты. Другие сосредотачиваются на исследованиях, относящихся к теории измерений (например, теория ответов на вопросы ; внутриклассовая корреляция ).

Практикующих называют психометристами. Психометры обычно обладают определенной квалификацией, и большинство из них - психологи, получившие высшее образование. Помимо традиционных академических институтов, многие психометристы работают на правительство или в отделах кадров. Другие специализируются на обучении и развитии профессионалов.

Содержание

  • 1 Историческое основание
    • 1.1 Викторианское течение
    • 1.2 Немецкое течение
    • 1.3 XX век
  • 2 Определение измерения в социальных науках
  • 3 Инструменты и процедуры
  • 4 Теоретические подходы
    • 4.1 Ключевые концепции
  • 5 Стандарты качества
    • 5.1 Стандарты тестирования
    • 5.2 Стандарты оценки
  • 6 Нечеловеческие факторы: животные и машины
  • 7 См. Также
  • 8 Ссылки
    • 8.1 Библиография
    • 8.2 Примечания
  • 9 Дополнительная литература
  • 10 Внешние ссылки

Историческое обоснование

Психологическое тестирование было основано на двух направлениях мысли: первое - от Дарвина., Гальтон и Кеттелл по измерению индивидуальных различий, а второй - из Гербарта, Вебера, Фехнер и Вундт и их психофизические измерения аналогичной конструкции. Вторая группа людей и их исследования - это то, что привело к развитию экспериментальной психологии и стандартизированного тестирования.

Викторианское течение

Чарльз Дарвин был вдохновителем сэра Фрэнсис Гальтон, который привел к созданию психометрии. В 1859 году Дарвин опубликовал свою книгу О происхождении видов, которая была посвящена роли естественного отбора в возникновении с течением времени различных популяций видов растений и животных. В книге обсуждалось, чем отличаются отдельные члены вида и как они обладают характеристиками, более или менее адаптивными к окружающей среде. Те, кто обладает более адаптивными характеристиками, с большей вероятностью произведут потомство и дадут начало следующему поколению. Те, у кого менее адаптивные характеристики, менее склонны к деторождению. Эта идея стимулировала интерес Гальтона к изучению людей и того, чем они отличаются друг от друга, и, что более важно, как измерить эти различия.

Гальтон написал книгу под названием «Наследственный гений» о различных характеристиках, которыми обладают люди, и о том, как эти характеристики делают их более «подходящими», чем другие. Сегодня эти различия, такие как сенсорное и двигательное функционирование (время реакции, острота зрения и физическая сила), являются важными областями научной психологии. Большая часть ранних теоретических и прикладных работ в области психометрии была предпринята в попытке измерить интеллект. Гальтон, которого часто называют «отцом психометрии», разработал и включил ментальные тесты в свои антропометрические меры. Джеймс Маккин Кеттелл, который считается пионером психометрии, продолжил работу Гальтона. Кеттелл также ввел термин «ментальный тест» и отвечает за исследования и знания, которые в конечном итоге привели к разработке современных тестов.

Немецкий поток

Происхождение психометрии также связано с область психофизика. Примерно в то же время, когда Дарвин, Гальтон и Кеттелл делали свои открытия, Гербарт также был заинтересован в «раскрытии тайн человеческого сознания» с помощью научного метода. Гербарт отвечал за создание математических моделей сознания, которые в последующие годы сыграли важную роль в образовательной практике.

Э. Вебер опирался на работу Гербарта и пытался доказать существование психологического порога, говоря, что для активации сенсорной системы необходим минимальный стимул. После Вебера Г. Фехнер расширил знания, которые он почерпнул у Гербарта и Вебера, чтобы разработать закон, согласно которому сила ощущения растет как логарифм интенсивности раздражителя. Последователь Вебера и Фехнера, Вильгельм Вундт считается основоположником психологии. Именно влияние Вундта проложило путь другим к разработке психологического тестирования.

20 век

В 1936 году психометрист Л. Л. Терстон, основатель и первый президент Психометрического общества, разработал и применил теоретический подход к измерению, известный как закон сравнительного суждения, подход, который имеет тесную связь с психофизической теорией Эрнст Генрих Вебер и Густав Фехнер. Кроме того, Спирмен и Терстон внесли важный вклад в теорию и применение факторного анализа, статистического метода, разработанного и широко используемого в психометрии. В конце 1950-х годов Леопольд Сонди сделал историческую и эпистемологическую оценку воздействия статистического мышления на психологию в течение нескольких предыдущих десятилетий: «в последние десятилетия специфически психологическое мышление было почти полностью подавлено и удалено, и заменено статистическим мышлением. Именно здесь мы видим злокачественную опухоль тестологии и тестомании сегодняшнего дня ».

Совсем недавно психометрическая теория была применена для измерения личности, отношения, и убеждения, и академическая успеваемость. Измерение этих ненаблюдаемых явлений затруднено, и большая часть исследований и накопленных научных знаний в этой дисциплине была разработана в попытке правильно определить и количественно оценить такие явления. Критики, в том числе практики в области физических наук и общественных активистов, утверждали, что такое определение и количественная оценка невероятно трудны и что такие измерения часто используются неправильно, например, с использованием психометрических тестов личности. в процедурах приема на работу:

«Например, работодатель, который хочет кого-то на должность, требующую постоянного внимания к повторяющимся деталям, вероятно, не захочет отдавать эту работу тому, кто очень креативен и быстро устает».

Цифры, которые заработали значительный вклад в психометрию включают Карл Пирсон, Карл Бригам, Л. Л. Терстон, Э. Л. Торндайк, Георг Раш, Юджин Галантер, Джонсон О'Коннор, Фредерик М. Лорд, Ледьярд Р. Такер и Джейн Ловингер.

Определение измерения в социальных науках

Определение измерения в социальных науках имеет долгую историю. В настоящее время широко распространенное определение, предложенное Стэнли Смитом Стивенсом (1946), состоит в том, что измерение - это «присвоение числовых значений объектам или событиям в соответствии с некоторым правилом». Это определение было введено в статье, в которой Стивенс предложил четыре уровня измерения. Несмотря на широкое распространение, это определение во многом отличается от более классического определения измерения, принятого в физических науках, а именно, что научное измерение влечет за собой «оценку или открытие отношения некоторой величины количественного атрибута к единице того же атрибута. "(стр. 358)

Действительно, определение измерения Стивенса было выдвинуто в ответ британскому комитету Фергюсона, председатель которого, А. Фергюсон, был физиком. Комитет был назначен в 1932 году Британской ассоциацией развития науки для исследования возможности количественной оценки сенсорных событий. Хотя его председатель и другие члены были физиками, в комитет также входили несколько психологов. В отчете комитета подчеркивается важность определения измерения. Хотя ответ Стивенса заключался в предложении нового определения, оказавшего значительное влияние в этой области, это ни в коем случае не был единственным ответом на отчет. Другой, заметно отличающийся, ответ заключался в том, чтобы принять классическое определение, которое отражено в следующем утверждении:

Измерение в психологии и физике ничем не отличается. Физики могут измерить, когда они могут найти операции, с помощью которых они могут соответствовать необходимым критериям; психологи должны делать то же самое. Им не нужно беспокоиться о таинственных различиях между значением измерения в двух науках (Reese, 1943, p. 49).

Эти расходящиеся ответы отражаются в альтернативных подходах к измерению. Например, методы, основанные на ковариационных матрицах, обычно используются при условии, что числа, такие как исходные оценки, полученные на основе оценок, являются измерениями. Такие подходы неявно влекут за собой определение измерения Стивенсом, которое требует только присвоения чисел в соответствии с некоторым правилом. Таким образом, основной задачей исследования обычно считается обнаружение ассоциаций между оценками и факторов, лежащих в основе таких ассоциаций.

С другой стороны, когда модели измерения, такие как модель Раша используются, номера не присваиваются на основании правила. Вместо этого, в соответствии с заявлением Риза, приведенным выше, устанавливаются конкретные критерии для измерения, а цель состоит в том, чтобы создать процедуры или операции, которые предоставляют данные, соответствующие соответствующим критериям. Измерения оцениваются на основе моделей, и проводятся тесты, чтобы убедиться, что соответствующие критерии соблюдены.

Инструменты и процедуры

Первые психометрические инструменты были разработаны для измерения концепции интеллект. Один исторический подход включал IQ-тест Стэнфорда-Бине, первоначально разработанный французским психологом Альфредом Бине. Тесты интеллекта - полезные инструменты для различных целей. Альтернативная концепция интеллекта состоит в том, что когнитивные способности людей являются проявлением общего компонента или общего фактора интеллекта, а также когнитивных способностей, специфичных для данной области.

Еще одно важное направление. в психометрии прошел тестирование личности. Существует ряд теоретических подходов к концептуализации и измерению личности. Некоторые из наиболее известных инструментов включают Миннесотский многофазный опросник личности, Пятифакторная модель (или «Большая пятерка») и такие инструменты, как Реестр личности и предпочтений и индикатор типа Майерс-Бриггс. Отношения также широко изучались с использованием психометрических подходов. Распространенным методом измерения отношения является использование шкалы Лайкерта. Альтернативный метод включает применение развернутых моделей измерения, наиболее общей из которых является модель гиперболического косинуса (Andrich Luo, 1993).

Теоретические подходы

Психометристы разработали ряд различных теорий измерения. К ним относятся классическая теория тестирования (CTT) и теория ответов на вопросы (IRT). Подход, который кажется математически похожим на IRT, но также весьма отличительным с точки зрения его происхождения и особенностей, представлен моделью Раша для измерения. Развитие модели Раша и более широкого класса моделей, к которому она принадлежит, было явно основано на требованиях измерения в физических науках.

Психометрики также разработали методы для работы с большими матрицами корреляций и ковариаций.. Методы в этой общей традиции включают: факторный анализ, метод определения основных параметров данных. Одной из основных проблем, с которыми сталкиваются пользователи факторного анализа, является отсутствие консенсуса в отношении соответствующих процедур определения количества скрытых факторов. Обычная процедура - прекратить разложение, когда собственные значения падают ниже единицы из-за сжатия исходной сферы. Отсутствие точек отсечения касается и других многомерных методов.

Многомерное масштабирование - это метод поиска простого представления для данных с большим количеством скрытых измерений. Кластерный анализ - это подход к поиску объектов, похожих друг на друга. Факторный анализ, многомерное масштабирование и кластерный анализ - все это многомерные описательные методы, используемые для выделения из больших объемов данных более простых структур.

В последнее время моделирование структурными уравнениями и анализ пути представляют более сложные подходы к работе с большими ковариационными матрицами. Эти методы позволяют подобрать статистически сложные модели к данным и протестировать их, чтобы определить, являются ли они адекватными. Поскольку на детальном уровне психометрические исследования касаются степени и природы многомерности каждого интересующего элемента, может оказаться полезной относительно новая процедура, известная как двухфакторный анализ. Двухфакторный анализ может разложить «систематическую дисперсию элемента в идеале с точки зрения двух источников, общего фактора и одного источника дополнительной систематической дисперсии».

Ключевые концепции

Ключевые концепции в классической теории тестирования - это надежность и достоверность. Надежный показатель - это показатель, который последовательно измеряет конструкт в зависимости от времени, отдельных лиц и ситуаций. Действительный показатель - это показатель, который измеряет то, что он предназначен для измерения. Надежность необходима, но недостаточна для действительности.

И надежность, и валидность можно оценить статистически. Последовательность повторных измерений одного и того же теста можно оценить с помощью коэффициента корреляции Пирсона, который часто называют надежностью повторного тестирования. Точно так же эквивалентность разных версий одного и того же показателя может быть проиндексирована с помощью корреляции Пирсона и называется надежностью эквивалентных форм или аналогичным термином.

Внутренняя согласованность, которая касается однородности единая форма теста может быть оценена путем корреляции характеристик на двух половинах теста, что называется надежностью разделения половин; значение этого коэффициента корреляции «произведение-момент» Пирсона для двух полутестов корректируется с помощью формулы прогнозирования Спирмена – Брауна, чтобы соответствовать корреляции между двумя полными тестами. Возможно, наиболее часто используемый показатель надежности - это α Кронбаха, который эквивалентен среднему всех возможных коэффициентов разделения половин. Другие подходы включают в себя внутриклассовую корреляцию, которая представляет собой отношение дисперсии измерений данной цели к дисперсии всех целей.

Есть несколько различных форм действительности. Связанная с критерием валидность относится к степени, в которой тест или шкала предсказывают образец поведения, то есть критерий, который является «внешним по отношению к самому измерительному прибору». Этот внешний образец поведения может быть множеством вещей, включая еще один тест; средний балл в колледже, как если бы SAT старшей школы использовался для прогнозирования успеваемости в колледже; и даже поведение, которое имело место в прошлом, например, когда тест на текущие психологические симптомы используется для прогнозирования возникновения прошлой виктимизации (что точно отражает постдикт). Когда критерий измерения собирается одновременно с проверяемым показателем, цель состоит в том, чтобы установить одновременную достоверность ; когда критерий собирается позже, цель состоит в том, чтобы установить прогностическую достоверность. Мера имеет конструктивную валидность, если она связана с мерами других конструкций, как того требует теория. Достоверность содержимого - это демонстрация того, что элементы теста адекватно покрывают измеряемую область. В примере отбора персонала содержание теста основано на определенном утверждении или наборе утверждений о знаниях, навыках, способностях или других характеристиках, полученных в результате анализа должности.

Теория ответа элемента моделирует взаимосвязь между скрытые черты и ответы на тестовые задания. Среди других преимуществ IRT обеспечивает основу для получения оценки местоположения испытуемого по заданному скрытому признаку, а также стандартной ошибки измерения этого местоположения. Например, знания студента университета по истории можно вывести из его или ее баллов за университетский тест, а затем надежно сравнить со знаниями старшеклассника, полученными в результате менее трудного теста. Баллы, полученные с помощью классической теории тестирования, не имеют этой характеристики, и оценка фактических способностей (а не способностей по сравнению с другими тестируемыми) должна оцениваться путем сравнения баллов с баллами «нормальной группы», случайно выбранной из совокупности. Фактически, все показатели, полученные из классической теории тестирования, зависят от тестируемой выборки, в то время как, в принципе, меры, полученные из теории ответов на вопросы, не зависят.

Многие психометристы также озабочены поиском и устранением тестовых систематических ошибок из своих психологических тестов. Ошибка теста - это форма систематической (т. Е. Неслучайной) ошибки, которая приводит к тому, что испытуемые из одной демографической группы имеют неоправданное преимущество перед испытуемыми из другой демографической группы. По мнению ведущих экспертов, смещение теста может вызывать различия в средних баллах по демографическим группам, но различия в баллах по группам не являются достаточным доказательством того, что смещение теста действительно присутствует, поскольку тест может измерять реальные различия между группами. Психометры используют сложные научные методы для поиска и устранения предвзятости теста. Исследования показывают, что люди, читающие элемент теста, обычно не могут точно определить, является ли он предвзятым или нет.

Стандарты качества

Соображения достоверности и надежность обычно рассматриваются как важные элементы для определения качества любого теста. Однако профессиональные ассоциации и ассоциации практикующих часто помещают эти проблемы в более широкий контекст при разработке стандартов и вынесении общих суждений о качестве любого теста в целом в рамках данного контекста. Во многих условиях прикладных исследований вызывает озабоченность вопрос о том, является ли показатель данного психологического инвентаря значимым или произвольным.

Стандарты тестирования

В 2014 году Американская ассоциация исследований в области образования (AERA), Американская психологическая ассоциация (APA) и Национальный совет по измерениям в образовании (NCME) опубликовали пересмотренный вариант Стандартов педагогического и психологического тестирования, в котором описаны стандарты разработки, оценки и использования тестов. Стандарты охватывают важные темы тестирования, включая валидность, надежность / ошибки измерения и справедливость в тестировании. Книга также устанавливает стандарты, относящиеся к операциям тестирования, включая дизайн и разработку тестов, оценки, шкалы, нормы, привязку оценок, сокращение оценок, администрирование теста, выставление оценок, отчетность, интерпретацию оценок, документацию по тестированию, а также права и обязанности участников тестирования и пользователей теста.. Наконец, Стандарты охватывают темы, связанные с тестированием приложений, включая психологическое тестирование и оценку, тестирование на рабочем месте и аттестацию, образовательное тестирование и оценку, а также тестирование в оценка программ и государственной политики.

Стандарты оценки

В области оценки, и в частности оценки образования, Объединенный комитет по стандартам оценки образования опубликовал три набора стандартов оценки. Стандарты оценки персонала были опубликованы в 1988 году, Стандарты оценки программ (2-е издание) были опубликованы в 1994 году, а Стандарты оценки студентов были опубликованы в 2003 году.

Каждая публикация представляет и разрабатывает набор стандартов для использования в разнообразные образовательные учреждения. Стандарты содержат руководящие указания по разработке, внедрению, оценке и совершенствованию определенной формы оценки. Каждый из стандартов был помещен в одну из четырех основных категорий, чтобы способствовать правильности, полезности, выполнимости и точности образовательных оценок. В этих наборах стандартов вопросы достоверности и надежности рассматриваются в разделе «Точность». Например, стандарты точности учащихся помогают гарантировать, что оценки учащихся будут предоставлять надежную, точную и достоверную информацию об обучении и успеваемости учащихся.

Нечеловеческие существа: животные и машины

Психометрия касается человеческих способностей, взглядов, черт характера и эволюции образования. Примечательно, что изучение поведения, умственных процессов и способностей нечеловеческих животных обычно рассматривается в сравнительной психологии, а континуум между нечеловеческими животными и остальными животными - эволюционной психологией. Тем не менее, есть некоторые сторонники более постепенного перехода от подхода, принятого для людей, к подходу, принятому для (нечеловеческих) животных.

Оценка способностей, черт и эволюция обучения машин в основном не связана с случай людей и животных, не относящихся к человеку, с особыми подходами в области искусственного интеллекта. Также был предложен более интегрированный подход под названием универсальная психометрия.

См. Также

Список литературы

Библиография

Примечания

Дополнительная литература

Внешние ссылки

Викиверситет содержит обучающие ресурсы по Психометрии
Искать психометрия в Викисловаре, бесплатном словаре.

.

Последняя правка сделана 2021-06-02 09:46:34
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте