Моделирование выбора пытается смоделировать процесс принятия решения отдельным лицом или сегментом с помощью выявленных предпочтений или заявленных предпочтения, сделанные в конкретном контексте или контекстах. Как правило, он пытается использовать дискретные варианты выбора (A вместо B; B вместо A, B и C), чтобы вывести положения элементов (A, B и C) на некоторой релевантной скрытой шкале (обычно «полезность "в экономике и различных смежных областях). Действительно, существует множество альтернативных моделей в эконометрике, маркетинге, социометрии и других областях, включая максимизацию полезности, оптимизацию применяется к теории потребителей и множеству других стратегий идентификации, которые могут быть более или менее точными в зависимости от данных, выборки, гипотезы И конкретное решение моделируется. Кроме того, моделирование выбора считается наиболее подходящим методом для оценки готовности потребителей платить за повышение качества по нескольким параметрам.
Есть ряд терминов, которые рассматриваются быть синонимами термина «моделирование выбора». Некоторые из них точны (хотя, как правило, для конкретной дисциплины или континента), а некоторые используются в отраслевых приложениях, хотя в академических кругах считаются неточными (например, совместный анализ).
К ним относятся следующие:
Хотя разногласия в терминологии сохраняются, следует отметить, что академический журнал призван предоставить междисциплинарный источник новых и эмпирических исследований в этой области называется Журнал моделирования выбора.
Теория моделирования выбора была независимо разработана экономистами и математическими психологами. Истоки моделирования выбора можно проследить до исследования Терстона пищевых предпочтений в 1920-х годах и до настоящего времени. В экономике теория случайной полезности была развита Дэниелом Макфадденом, а в математической психологии - главным образом Дунканом Люсом и Энтони Марли. По сути, моделирование выбора предполагает, что полезность (выгода или ценность), которую человек получает от элемента A по сравнению с элементом B, является функцией частоты, с которой он (-а) выбирает элемент A вместо элемента B при повторных выборах. Из-за использования им нормального распределения Терстон не смог обобщить этот двоичный выбор в рамках полиномиального выбора (который требовал полиномиальной логистической регрессии, а не функции пробит-связи), поэтому метод томился более 30 лет. Однако в 1960–1980-х годах этот метод был аксиоматизирован и применен в самых разных исследованиях.
Моделирование выбора используется в исследованиях выявленных предпочтений (RP) и (SP). Исследования RP используют выбор, уже сделанный отдельными людьми, для оценки ценности, которую они приписывают предметам - они «раскрывают свои предпочтения - и, следовательно, ценности (полезности) - своим выбором». Исследования SP используют выбор, сделанный людьми, сделанными в экспериментальных условиях, для оценки этих значений - они «заявляют о своих предпочтениях через свой выбор». Макфадден успешно использовал выявленные предпочтения (сделанные в предыдущих транспортных исследованиях) для прогнозирования спроса на Bay Area Rapid Transit (BART) до его постройки. Люс и Марли ранее аксиоматизировали теорию случайной полезности, но не использовали ее в реальных приложениях; кроме того, они потратили много лет на тестирование метода в исследованиях SP с участием студентов-психологов.
Работа Макфаддена принесла ему Нобелевскую премию по экономическим наукам в 2000 году. Однако большая часть работы по моделированию выбора в течение почти 20 лет продолжалась в поле заявленных предпочтений. Такая работа возникла в различных дисциплинах, первоначально в сфере транспорта и маркетинга, из-за необходимости прогнозировать спрос на новые продукты, производство которых было потенциально дорогостоящим. Эта работа в значительной степени опиралась на области совместного анализа и планирования экспериментов, чтобы:
В частности, цель состояла в том, чтобы представить минимальное количество пар / троек и т. Д. (Например) мобильных / сотовых телефонов, чтобы аналитик мог оценить ценность, полученную потребителем (в денежных единицах) от каждой возможной характеристики телефона. В отличие от большей части работы по совместному анализу, нужно было делать дискретные выборы (A против B; B против A, B и C), а не рейтинги по шкалам оценок категорий (шкалы Лайкерта ). Дэвид Хеншер и Джордан Лувьер широко известны как первые заявленные модели выбора предпочтений. Они оставались ключевыми фигурами вместе с другими, в том числе Жоффре Свайтом и Моше Бен-Акива, и в течение следующих трех десятилетий в области транспорта и маркетинга помогли разработать и распространить методы. Однако многие другие деятели, в основном занимающиеся транспортной экономикой и маркетингом, внесли свой вклад в теорию и практику и помогли широко распространить эту работу.
Моделирование выбора с самого начала страдало из-за отсутствия стандартизации терминологии, и для его описания использовались все приведенные выше термины. Однако наибольшее разногласие оказалось географическим: в Северной и Южной Америке, в соответствии с отраслевой практикой, стал преобладать термин «объединенный анализ на основе выбора». Это отражало желание, чтобы моделирование выбора (1) отражало структуру атрибутов и уровней, унаследованную от совместного анализа, но (2) показывало, что дискретный выбор, а не числовые рейтинги, использовался в качестве показателя результата, полученного от потребителей. В других странах мира термин эксперимент с дискретным выбором стал доминировать практически во всех дисциплинах. Лувьер (маркетинг и транспорт) и его коллеги в области экономики окружающей среды и здравоохранения отказались от американской терминологии, заявив, что она вводит в заблуждение и скрывает фундаментальное отличие экспериментов с дискретным выбором от традиционных совместных методов: эксперименты с дискретным выбором имеют проверяемую теорию принятия решений человеком. создание их основы (теория случайной полезности), в то время как совместные методы - это просто способ разложения ценности товара с использованием статистических схем из числовых оценок, которые не имеют психологической теории, объясняющей, что означают числа шкалы оценок.
Разработка модели выбора или эксперимента с дискретным выбором (DCE) обычно состоит из следующих шагов:
Это часто самая простая задача, обычно определяемая:
Товар или услуга, например мобильный (сотовый) телефон, обычно описывается рядом атрибутов (функций). Телефоны часто описываются по форме, размеру, памяти, марке и т. Д. В DCE должны быть изменены все атрибуты, которые интересны респондентам. Отсутствие ключевых атрибутов обычно заставляет респондентов делать выводы (предположения) о тех, которые отсутствуют в АКД, что приводит к проблемам с пропущенными переменными. Уровни, как правило, должны включать все доступные в настоящее время, и часто расширяются, чтобы включить те, которые возможны в будущем - это особенно полезно при разработке продукта.
Сильной стороной DCE и совместного анализа является то, что они обычно представляют собой подмножество полного факториала. Например, телефон двух марок, трех форм, трех размеров и четырех объемов памяти имеет 2x3x3x4 = 72 возможных конфигурации. Это полный факториал, и в большинстве случаев он слишком велик для использования респондентами. Подмножества полного факториала могут быть получены различными способами, но в целом они имеют следующую цель: дать возможность оценить определенное ограниченное количество параметров, описывающих товар: основные эффекты (например, ценность, связанная с брендом, удерживая все остальное. равно), двусторонние взаимодействия (например, ценность, связанная с этой торговой маркой и наименьшим размером, этой торговой маркой и наименьшим размером) и т. д. Это обычно достигается путем намеренного смешивания взаимодействий более высокого порядка с взаимодействиями более низкого порядка. Например, двухстороннее и трехстороннее взаимодействие можно спутать с основными эффектами. Это имеет следующие последствия:
Таким образом, исследователей неоднократно предупреждали, что дизайн включает в себя критические решения, которые необходимо принять относительно того, будут ли двусторонние взаимодействия и взаимодействия более высокого порядка отличаться от нуля; допущенная на этапе проектирования ошибка фактически делает недействительными результаты, поскольку гипотеза о том, что взаимодействия более высокого порядка не равны нулю, не подлежит проверке.
Планы доступны в каталогах и статистических программах. Традиционно они обладали свойством Ортогональность, при котором все уровни атрибутов могут оцениваться независимо друг от друга. Это обеспечивает нулевую коллинеарность и может быть объяснено на следующем примере.
Представьте себе автосалон, который продает как роскошные автомобили, так и подержанные недорогие автомобили. Используя принцип максимизации полезности и допуская модель MNL, мы выдвигаем гипотезу о том, что решение купить автомобиль в этом представительстве является суммой индивидуального вклада каждого из следующих факторов в общую полезность.
Однако использование полиномиальной регрессии для данных о продажах не дает расскажите нам, что мы хотим знать. Причина в том, что большая часть данных коллинеарна, так как автомобили в этом представительстве либо:
Информации недостаточно, и когда-либо будет достаточно того, чтобы сказать нам, покупают ли люди автомобили потому, что они европейские, потому что они BMW или потому что они высокопроизводительные. Это основная причина того, почему данные RP часто не подходят и почему требуются данные SP. В данных RP эти три атрибута всегда встречаются одновременно и в этом случае полностью коррелированы. То есть: все BMW сделаны в Германии и обладают высокими характеристиками. Эти три атрибута: происхождение, марка и характеристики считаются коллинеарными или неортогональными. Только в экспериментальных условиях, с помощью данных SP, производительность и цена могут изменяться независимо - их эффекты разлагаются.
Схема эксперимента (ниже) в эксперименте по выбору - это строгая схема для контроля и представления гипотетических сценариев или наборов вариантов респондентам. Для одного и того же эксперимента можно использовать разные конструкции, каждый с разными свойствами. Наилучший дизайн зависит от целей упражнения.
Именно экспериментальный план определяет эксперимент и максимальные возможности модели. В открытом доступе существует множество очень эффективных проектов, которые позволяют проводить эксперименты, близкие к оптимальным.
Например, конструкция латинского квадрата 16 позволяет оценить все основные эффекты продукта, который может иметь до 16 конфигураций (примерно 295 с восемнадцатью нулями). Более того, этого можно было достичь в рамках выборки, состоящей всего из 256 респондентов.
Ниже приведен пример гораздо меньшего размера. Это 3 основных эффекта дизайна.
0 | 0 | 0 | 0 |
0 | 1 | 1 | 2 |
0 | 2 | 2 | 1 |
1 | 0 | 1 | 1 |
1 | 1 | 2 | 0 |
1 | 2 | 0 | 2 |
2 | 0 | 2 | 2 |
2 | 1 | 0 | 1 |
2 | 2 | 1 | 0 |
Этот план позволит оценить полезность основных эффектов из 81 (3) возможных конфигураций продукта, предполагая, что все взаимодействия более высокого порядка равны нулю. Выборка из примерно 20 респондентов могла смоделировать основные эффекты всех 81 возможных конфигураций продукта со статистически значимыми результатами.
Некоторые примеры других часто используемых экспериментальных планов:
Совсем недавно были созданы эффективные конструкции. Они обычно минимизируют функции дисперсии (неизвестных, но оцененных) параметров. Общая функция - это параметры. Цель этих планов - уменьшить размер выборки, необходимый для достижения статистической значимости оцененных параметров полезности. Такие планы часто включают байесовские априорные значения для параметров для дальнейшего повышения статистической точности. Высокоэффективные конструкции стали чрезвычайно популярными, учитывая затраты на набор большего числа респондентов. Однако ключевые фигуры в разработке этих конструкций предупредили о возможных ограничениях, в первую очередь о следующих. Эффективность дизайна обычно максимальна, когда товар A и товар B настолько различаются, насколько это возможно: например, каждый атрибут (функция), определяющий телефон, отличается в A и B. Это вынуждает респондента торговать по цене, бренду, размеру, памяти и т. Д.; ни один из атрибутов не имеет одинакового уровня в A и B. Это может наложить когнитивную нагрузку на респондента, заставляя его / ее использовать упрощающую эвристику («всегда выбирать самый дешевый телефон»), которая не отражает его / ее истинную функцию полезности (решение правило). Недавняя эмпирическая работа подтвердила, что респонденты действительно имеют разные правила принятия решений при ответе на менее эффективный план по сравнению с высокоэффективным.
Более подробную информацию об экспериментальных планах можно найти здесь. Однако стоит повторить, что небольшие планы, которые оценивают основные эффекты, обычно делают это, сознательно смешивая взаимодействия более высокого порядка с основными эффектами. Это означает, что если на практике эти взаимодействия не равны нулю, аналитик получит предвзятые оценки основных эффектов. Кроме того, у него нет (1) возможности проверить это, и (2) нет способа исправить это в анализе. Это подчеркивает решающую роль дизайна в DCE.
Построение опроса обычно включает:
Традиционно DCE проводились с помощью бумажных и ручных методов. С мощью Интернета интернет-опросы все чаще становятся нормой. Они имеют преимущества с точки зрения стоимости, рандомизации респондентов для различных версий опроса и использования скрининга. Примером последнего может быть достижение гендерного баланса: если ответило слишком много мужчин, их можно отсеять, чтобы количество женщин соответствовало количеству мужчин.
Анализ данных из DCE требует от аналитика принятия определенного типа правила принятия решений - или функциональной формы уравнения полезности, выражаясь экономистами. Обычно это продиктовано дизайном: если был использован дизайн с основными эффектами, то в модель нельзя включить условия двустороннего взаимодействия и взаимодействия более высокого порядка. Затем обычно оцениваются модели регрессии. Они часто начинаются с модели условного логита - традиционно, хотя и немного вводящей в заблуждение, специалисты по моделированию называют полиномиальной логистической (MNL) моделью регрессии. Модель MNL преобразует наблюдаемые частоты выбора (являющиеся оценками вероятностей по шкале отношений) в оценки полезности (по шкале интервалов) с помощью логистической функции. Полезность (значение), связанная с каждым уровнем атрибута, может быть оценена, что позволяет аналитику построить общую полезность любой возможной конфигурации (в данном случае автомобиля или телефона). Однако DCE может альтернативно использоваться для оценки нерыночных экологических выгод и затрат.
Ячев и Грилихес впервые доказали, что средние значения и дисперсии смешивались в моделях с ограниченными зависимыми переменными (где зависимая переменная принимает любой из дискретного набора переменных). значения, а не непрерывный, как в обычной линейной регрессии). Это ограничение становится острым при моделировании выбора по следующей причине: большая оценочная бета из регрессионной модели MNL или любой другой модели выбора может означать:
Это имеет важное значение для интерпретации выходных данных регрессионной модели. Все статистические программы «решают» проблему среднего отклонения, устанавливая дисперсию равной константе; все оцененные бета-коэффициенты фактически являются оценкой бета, умноженной на оцененную лямбду (обратная функция дисперсии). Это соблазняет аналитика игнорировать проблему. Однако он должен учитывать, отражает ли набор больших бета-коэффициентов сильные предпочтения (большая истинная бета) или последовательность в выборе (большая истинная лямбда), или некоторую комбинацию этих двух. Разделение всех оценок друг на друга - обычно на оценку переменной цены - исключает смешанный лямбда-член из числителя и знаменателя. Это решает проблему с дополнительным преимуществом, которое дает экономистам готовность респондента платить за каждый уровень атрибута. Однако вывод о том, что результаты, оцененные по «полезной площади», не совпадают с оценками по «готовности платить за площадь», предполагает, что проблема искажения не решается этим «трюком»: отклонения могут быть специфическими для атрибута или какой-либо другой функцией переменные (которые могли бы объяснить расхождение). Это предмет текущих исследований в данной области.
Основные проблемы с вопросами рейтингов, которые не возникают в моделях выбора:
Ранжирование действительно заставляет человека указывать относительные предпочтения по интересующим вопросам. Таким образом, можно, как и в DCE, обычно оценивать компромиссы между ними. Однако модели ранжирования должны проверять, оценивается ли одна и та же функция полезности на каждой глубине ранжирования: например, те же оценки (с точностью до шкалы дисперсии) должны быть получены из данных нижнего ранга, что и из данных верхнего ранга.
Шкала от наилучшего к худшему (BWS) - это хорошо зарекомендовавшая себя альтернатива рейтингам и ранжированию. Он предлагает людям выбрать наиболее и наименее предпочтительные варианты из ряда альтернатив. Путем вычитания или интегрирования вероятностей выбора можно оценить полезность каждой альтернативы по шкале интервалов или соотношений для отдельных лиц и / или групп. Для получения наилучших-наихудших данных люди могут использовать различные психологические модели, включая модель MaxDiff.
Моделирование выбора особенно полезно для: