Моделирование выбора

редактировать

Моделирование выбора пытается смоделировать процесс принятия решения отдельным лицом или сегментом с помощью выявленных предпочтений или заявленных предпочтения, сделанные в конкретном контексте или контекстах. Как правило, он пытается использовать дискретные варианты выбора (A вместо B; B вместо A, B и C), чтобы вывести положения элементов (A, B и C) на некоторой релевантной скрытой шкале (обычно «полезность "в экономике и различных смежных областях). Действительно, существует множество альтернативных моделей в эконометрике, маркетинге, социометрии и других областях, включая максимизацию полезности, оптимизацию применяется к теории потребителей и множеству других стратегий идентификации, которые могут быть более или менее точными в зависимости от данных, выборки, гипотезы И конкретное решение моделируется. Кроме того, моделирование выбора считается наиболее подходящим методом для оценки готовности потребителей платить за повышение качества по нескольким параметрам.

Содержание

1 Связанные термины
2 Теоретические основы
3 Различие между выявленными и заявленными исследованиями предпочтений
4 История
5 Взаимосвязь с совместным анализом
6 Разработка модели выбора
- 6.1 Определение товара или услуги, подлежащих оценке
- 6.2 Выбор атрибутов и уровни полностью описывают товар или услугу
- 6.3 Построение экспериментального плана, соответствующего этим атрибутам и уровням, либо из каталога проектов, либо с помощью программного обеспечения
- 6.4 Построение обследования
- 6.5 Администрирование обследования выборке респондентов в любом из множества форматов, включая бумагу и ручку, но все чаще через веб-опросы
- 6.6 Анализ данных с использованием соответствующих моделей, часто начиная с модели полиномиальной логистической регрессии, учитывая ее привлекательность связи с точки зрения согласованности с теорией экономического спроса
7 Сильные стороны
8 Слабые стороны
9 Ошибка среднего отклонения
10 По сравнению с традиционными объединенными методами, основанными на рейтингах
11 Другие типы
- 11.1 Ранжирование
- 11.2 Масштабирование от наилучшего к худшему
12 Использование
13 См. Также
14 Ссылки
15 Внешние ссылки

Связанные термины

Есть ряд терминов, которые рассматриваются быть синонимами термина «моделирование выбора». Некоторые из них точны (хотя, как правило, для конкретной дисциплины или континента), а некоторые используются в отраслевых приложениях, хотя в академических кругах считаются неточными (например, совместный анализ).

К ним относятся следующие:

Моделирование дискретного выбора заявленных предпочтений
Дискретный выбор
Исследования заявленных предпочтений
Совместный анализ
Контролируемые эксперименты

Хотя разногласия в терминологии сохраняются, следует отметить, что академический журнал призван предоставить междисциплинарный источник новых и эмпирических исследований в этой области называется Журнал моделирования выбора.

Теоретические основы

Теория моделирования выбора была независимо разработана экономистами и математическими психологами. Истоки моделирования выбора можно проследить до исследования Терстона пищевых предпочтений в 1920-х годах и до настоящего времени. В экономике теория случайной полезности была развита Дэниелом Макфадденом, а в математической психологии - главным образом Дунканом Люсом и Энтони Марли. По сути, моделирование выбора предполагает, что полезность (выгода или ценность), которую человек получает от элемента A по сравнению с элементом B, является функцией частоты, с которой он (-а) выбирает элемент A вместо элемента B при повторных выборах. Из-за использования им нормального распределения Терстон не смог обобщить этот двоичный выбор в рамках полиномиального выбора (который требовал полиномиальной логистической регрессии, а не функции пробит-связи), поэтому метод томился более 30 лет. Однако в 1960–1980-х годах этот метод был аксиоматизирован и применен в самых разных исследованиях.

Различие между исследованиями выявленных и заявленных предпочтений

Моделирование выбора используется в исследованиях выявленных предпочтений (RP) и (SP). Исследования RP используют выбор, уже сделанный отдельными людьми, для оценки ценности, которую они приписывают предметам - они «раскрывают свои предпочтения - и, следовательно, ценности (полезности) - своим выбором». Исследования SP используют выбор, сделанный людьми, сделанными в экспериментальных условиях, для оценки этих значений - они «заявляют о своих предпочтениях через свой выбор». Макфадден успешно использовал выявленные предпочтения (сделанные в предыдущих транспортных исследованиях) для прогнозирования спроса на Bay Area Rapid Transit (BART) до его постройки. Люс и Марли ранее аксиоматизировали теорию случайной полезности, но не использовали ее в реальных приложениях; кроме того, они потратили много лет на тестирование метода в исследованиях SP с участием студентов-психологов.

История

Работа Макфаддена принесла ему Нобелевскую премию по экономическим наукам в 2000 году. Однако большая часть работы по моделированию выбора в течение почти 20 лет продолжалась в поле заявленных предпочтений. Такая работа возникла в различных дисциплинах, первоначально в сфере транспорта и маркетинга, из-за необходимости прогнозировать спрос на новые продукты, производство которых было потенциально дорогостоящим. Эта работа в значительной степени опиралась на области совместного анализа и планирования экспериментов, чтобы:

представить потребителям товары или услуги, которые были определены конкретными функциями (атрибутами), которые были уровни, например «цена» с уровнями «10, 20, 30 долларов»; «последующее обслуживание» с уровнями «без гарантии, гарантия 10 лет»;
Существующие конфигурации этих товаров, которые минимизировали количество вариантов выбора, необходимых для оценки функции полезности потребителя (правило принятия решения).

В частности, цель состояла в том, чтобы представить минимальное количество пар / троек и т. Д. (Например) мобильных / сотовых телефонов, чтобы аналитик мог оценить ценность, полученную потребителем (в денежных единицах) от каждой возможной характеристики телефона. В отличие от большей части работы по совместному анализу, нужно было делать дискретные выборы (A против B; B против A, B и C), а не рейтинги по шкалам оценок категорий (шкалы Лайкерта ). Дэвид Хеншер и Джордан Лувьер широко известны как первые заявленные модели выбора предпочтений. Они оставались ключевыми фигурами вместе с другими, в том числе Жоффре Свайтом и Моше Бен-Акива, и в течение следующих трех десятилетий в области транспорта и маркетинга помогли разработать и распространить методы. Однако многие другие деятели, в основном занимающиеся транспортной экономикой и маркетингом, внесли свой вклад в теорию и практику и помогли широко распространить эту работу.

Взаимосвязь с совместным анализом

Моделирование выбора с самого начала страдало из-за отсутствия стандартизации терминологии, и для его описания использовались все приведенные выше термины. Однако наибольшее разногласие оказалось географическим: в Северной и Южной Америке, в соответствии с отраслевой практикой, стал преобладать термин «объединенный анализ на основе выбора». Это отражало желание, чтобы моделирование выбора (1) отражало структуру атрибутов и уровней, унаследованную от совместного анализа, но (2) показывало, что дискретный выбор, а не числовые рейтинги, использовался в качестве показателя результата, полученного от потребителей. В других странах мира термин эксперимент с дискретным выбором стал доминировать практически во всех дисциплинах. Лувьер (маркетинг и транспорт) и его коллеги в области экономики окружающей среды и здравоохранения отказались от американской терминологии, заявив, что она вводит в заблуждение и скрывает фундаментальное отличие экспериментов с дискретным выбором от традиционных совместных методов: эксперименты с дискретным выбором имеют проверяемую теорию принятия решений человеком. создание их основы (теория случайной полезности), в то время как совместные методы - это просто способ разложения ценности товара с использованием статистических схем из числовых оценок, которые не имеют психологической теории, объясняющей, что означают числа шкалы оценок.

Проектирование модель выбора

Разработка модели выбора или эксперимента с дискретным выбором (DCE) обычно состоит из следующих шагов:

Определение товара или услуги, подлежащих оценке;
Определение атрибутов и уровней полностью описать товар или услугу;
Создание экспериментального проекта, который подходит для этих атрибутов и уровней, либо из каталога проектов ue, или с помощью программного обеспечения;
Построение опроса, замена кодов проекта (чисел) соответствующими уровнями атрибутов;
Проведение опроса для выборки респондентов в любом количестве форматов, включая бумагу и ручку, но все чаще с помощью веб-опросов;
Анализ данных с использованием соответствующих моделей, часто начиная с модели Полиномиальной логистической регрессии, учитывая ее привлекательные свойства с точки зрения согласованности с теория экономического спроса.

Определение оцениваемого товара или услуги

Это часто самая простая задача, обычно определяемая:

исследовательским вопросом в академическом исследовании или
потребности клиента (в контексте потребительского товара или услуги)

Решение о том, какие атрибуты и уровни полностью описывают товар или услугу

Товар или услуга, например мобильный (сотовый) телефон, обычно описывается рядом атрибутов (функций). Телефоны часто описываются по форме, размеру, памяти, марке и т. Д. В DCE должны быть изменены все атрибуты, которые интересны респондентам. Отсутствие ключевых атрибутов обычно заставляет респондентов делать выводы (предположения) о тех, которые отсутствуют в АКД, что приводит к проблемам с пропущенными переменными. Уровни, как правило, должны включать все доступные в настоящее время, и часто расширяются, чтобы включить те, которые возможны в будущем - это особенно полезно при разработке продукта.

Создание экспериментального плана, подходящего для этих атрибутов и уровней, либо из каталога проектов, либо с помощью программного обеспечения

Сильной стороной DCE и совместного анализа является то, что они обычно представляют собой подмножество полного факториала. Например, телефон двух марок, трех форм, трех размеров и четырех объемов памяти имеет 2x3x3x4 = 72 возможных конфигурации. Это полный факториал, и в большинстве случаев он слишком велик для использования респондентами. Подмножества полного факториала могут быть получены различными способами, но в целом они имеют следующую цель: дать возможность оценить определенное ограниченное количество параметров, описывающих товар: основные эффекты (например, ценность, связанная с брендом, удерживая все остальное. равно), двусторонние взаимодействия (например, ценность, связанная с этой торговой маркой и наименьшим размером, этой торговой маркой и наименьшим размером) и т. д. Это обычно достигается путем намеренного смешивания взаимодействий более высокого порядка с взаимодействиями более низкого порядка. Например, двухстороннее и трехстороннее взаимодействие можно спутать с основными эффектами. Это имеет следующие последствия:

количество профилей (конфигураций) значительно сокращается;
Коэффициент регрессии для данного основного эффекта несмещен тогда и только тогда, когда смешанные члены (взаимодействия более высокого порядка) равны нулю. ;
Коэффициент регрессии смещен в неизвестном направлении и с неизвестной величиной, если смешанные члены взаимодействия не равны нулю;
Невозможно внести поправки в анализ для решения проблемы, если смешанные члены не равны нулю.

Таким образом, исследователей неоднократно предупреждали, что дизайн включает в себя критические решения, которые необходимо принять относительно того, будут ли двусторонние взаимодействия и взаимодействия более высокого порядка отличаться от нуля; допущенная на этапе проектирования ошибка фактически делает недействительными результаты, поскольку гипотеза о том, что взаимодействия более высокого порядка не равны нулю, не подлежит проверке.

Планы доступны в каталогах и статистических программах. Традиционно они обладали свойством Ортогональность, при котором все уровни атрибутов могут оцениваться независимо друг от друга. Это обеспечивает нулевую коллинеарность и может быть объяснено на следующем примере.

Представьте себе автосалон, который продает как роскошные автомобили, так и подержанные недорогие автомобили. Используя принцип максимизации полезности и допуская модель MNL, мы выдвигаем гипотезу о том, что решение купить автомобиль в этом представительстве является суммой индивидуального вклада каждого из следующих факторов в общую полезность.

Цена
Marque (BMW, Chrysler, Mitsubishi)
Origin (немецкий, американский)
Performance

Однако использование полиномиальной регрессии для данных о продажах не дает расскажите нам, что мы хотим знать. Причина в том, что большая часть данных коллинеарна, так как автомобили в этом представительстве либо:

высокопроизводительные, дорогие немецкие автомобили;
низкопроизводительные, дешевые американские автомобили

Информации недостаточно, и когда-либо будет достаточно того, чтобы сказать нам, покупают ли люди автомобили потому, что они европейские, потому что они BMW или потому что они высокопроизводительные. Это основная причина того, почему данные RP часто не подходят и почему требуются данные SP. В данных RP эти три атрибута всегда встречаются одновременно и в этом случае полностью коррелированы. То есть: все BMW сделаны в Германии и обладают высокими характеристиками. Эти три атрибута: происхождение, марка и характеристики считаются коллинеарными или неортогональными. Только в экспериментальных условиях, с помощью данных SP, производительность и цена могут изменяться независимо - их эффекты разлагаются.

Схема эксперимента (ниже) в эксперименте по выбору - это строгая схема для контроля и представления гипотетических сценариев или наборов вариантов респондентам. Для одного и того же эксперимента можно использовать разные конструкции, каждый с разными свойствами. Наилучший дизайн зависит от целей упражнения.

Именно экспериментальный план определяет эксперимент и максимальные возможности модели. В открытом доступе существует множество очень эффективных проектов, которые позволяют проводить эксперименты, близкие к оптимальным.

Например, конструкция латинского квадрата 16 позволяет оценить все основные эффекты продукта, который может иметь до 16 конфигураций (примерно 295 с восемнадцатью нулями). Более того, этого можно было достичь в рамках выборки, состоящей всего из 256 респондентов.

Ниже приведен пример гораздо меньшего размера. Это 3 основных эффекта дизайна.

0	0	0	0
0	1	1	2
0	2	2	1
1	0	1	1
1	1	2	0
1	2	0	2
2	0	2	2
2	1	0	1
2	2	1	0

Этот план позволит оценить полезность основных эффектов из 81 (3) возможных конфигураций продукта, предполагая, что все взаимодействия более высокого порядка равны нулю. Выборка из примерно 20 респондентов могла смоделировать основные эффекты всех 81 возможных конфигураций продукта со статистически значимыми результатами.

Некоторые примеры других часто используемых экспериментальных планов:

Сбалансированные планы неполных блоков (BIBD)
Случайные планы
Основные эффекты
Взаимодействие более высокого порядка конструкции
Полный факториал

Совсем недавно были созданы эффективные конструкции. Они обычно минимизируют функции дисперсии (неизвестных, но оцененных) параметров. Общая функция - это параметры. Цель этих планов - уменьшить размер выборки, необходимый для достижения статистической значимости оцененных параметров полезности. Такие планы часто включают байесовские априорные значения для параметров для дальнейшего повышения статистической точности. Высокоэффективные конструкции стали чрезвычайно популярными, учитывая затраты на набор большего числа респондентов. Однако ключевые фигуры в разработке этих конструкций предупредили о возможных ограничениях, в первую очередь о следующих. Эффективность дизайна обычно максимальна, когда товар A и товар B настолько различаются, насколько это возможно: например, каждый атрибут (функция), определяющий телефон, отличается в A и B. Это вынуждает респондента торговать по цене, бренду, размеру, памяти и т. Д.; ни один из атрибутов не имеет одинакового уровня в A и B. Это может наложить когнитивную нагрузку на респондента, заставляя его / ее использовать упрощающую эвристику («всегда выбирать самый дешевый телефон»), которая не отражает его / ее истинную функцию полезности (решение правило). Недавняя эмпирическая работа подтвердила, что респонденты действительно имеют разные правила принятия решений при ответе на менее эффективный план по сравнению с высокоэффективным.

Более подробную информацию об экспериментальных планах можно найти здесь. Однако стоит повторить, что небольшие планы, которые оценивают основные эффекты, обычно делают это, сознательно смешивая взаимодействия более высокого порядка с основными эффектами. Это означает, что если на практике эти взаимодействия не равны нулю, аналитик получит предвзятые оценки основных эффектов. Кроме того, у него нет (1) возможности проверить это, и (2) нет способа исправить это в анализе. Это подчеркивает решающую роль дизайна в DCE.

Построение опроса

Построение опроса обычно включает:

Выполнение «поиска и замены» для того, чтобы заменить коды экспериментального плана (обычно числа, указанные в примере выше) по уровням атрибутов рассматриваемого товара.
Помещение полученных конфигураций (например, типов мобильных / сотовых телефонов) в более широкий опрос, чем может включать вопросы, относящиеся к социально-демографическим характеристикам респондентов. Это может помочь в сегментировании данных на этапе анализа: например, мужчины могут отличаться от женщин по своим предпочтениям.

Проведение опроса для выборки респондентов в любом из множества форматов, включая бумагу и ручку, но все чаще через Интернет опросы

Традиционно DCE проводились с помощью бумажных и ручных методов. С мощью Интернета интернет-опросы все чаще становятся нормой. Они имеют преимущества с точки зрения стоимости, рандомизации респондентов для различных версий опроса и использования скрининга. Примером последнего может быть достижение гендерного баланса: если ответило слишком много мужчин, их можно отсеять, чтобы количество женщин соответствовало количеству мужчин.

Анализ данных с использованием соответствующих моделей, часто начиная с модели полиномиальной логистической регрессии, учитывая ее привлекательные свойства с точки зрения соответствия теории экономического спроса

Анализ данных из DCE требует от аналитика принятия определенного типа правила принятия решений - или функциональной формы уравнения полезности, выражаясь экономистами. Обычно это продиктовано дизайном: если был использован дизайн с основными эффектами, то в модель нельзя включить условия двустороннего взаимодействия и взаимодействия более высокого порядка. Затем обычно оцениваются модели регрессии. Они часто начинаются с модели условного логита - традиционно, хотя и немного вводящей в заблуждение, специалисты по моделированию называют полиномиальной логистической (MNL) моделью регрессии. Модель MNL преобразует наблюдаемые частоты выбора (являющиеся оценками вероятностей по шкале отношений) в оценки полезности (по шкале интервалов) с помощью логистической функции. Полезность (значение), связанная с каждым уровнем атрибута, может быть оценена, что позволяет аналитику построить общую полезность любой возможной конфигурации (в данном случае автомобиля или телефона). Однако DCE может альтернативно использоваться для оценки нерыночных экологических выгод и затрат.

Сильные стороны

Заставляет респондентов рассматривать компромисс между атрибутами;
Делает систему отсчета явной для респондентов посредством включения массива атрибутов и альтернатив продуктов;
Позволяет оценивать неявные цены для атрибутов;
Позволяет оценить влияние на благосостояние для нескольких сценариев;
Может использоваться для оценки уровня потребительского спроса на альтернативный «сервисный продукт» в неденежном выражении; и
потенциально снижает стимул для респондентов к стратегическому поведению.

Слабые стороны

Дискретный выбор предоставляет только порядковые данные, которые предоставляют меньше информации, чем данные отношения или интервалы;
Выводы из порядковых данных для получения оценок по шкале интервалов / отношений требуют допущений о распределении ошибок и правил принятия решений респондента (функциональная форма функции полезности);
Дробные факторные планы, сознательно используемые на практике смешивать двусторонние взаимодействия и взаимодействия более высокого порядка с оценками более низкого порядка (обычно главными эффектами), чтобы сделать план небольшим: если взаимодействия более высокого порядка не равны нулю, то основные эффекты смещены, и аналитик не имеет возможности узнать или исправить this ex post;
Невероятностное (детерминированное) принятие решения отдельным лицом нарушает теорию случайной полезности: в рамках модели случайной полезности оценки полезности становятся бесконечными.
Есть одна фундаментальная слабость все ограничено d Модели с зависимыми переменными, такие как логит-модели и пробит-модели: средние значения (истинные позиции) и дисперсии скрытой шкалы идеальны. Другими словами, они не могут быть разделены.

Замешательство среднего отклонения

Ячев и Грилихес впервые доказали, что средние значения и дисперсии смешивались в моделях с ограниченными зависимыми переменными (где зависимая переменная принимает любой из дискретного набора переменных). значения, а не непрерывный, как в обычной линейной регрессии). Это ограничение становится острым при моделировании выбора по следующей причине: большая оценочная бета из регрессионной модели MNL или любой другой модели выбора может означать:

Респонденты помещают элемент в верхнюю часть скрытой шкалы (они высоко ценят его) или
Респонденты не помещают этот пункт наверху шкалы, НО они очень уверены в своих предпочтениях, последовательно (часто) предпочитая этот пункт другим, представленным рядом, или
Некоторая комбинация (1) и (2).

Это имеет важное значение для интерпретации выходных данных регрессионной модели. Все статистические программы «решают» проблему среднего отклонения, устанавливая дисперсию равной константе; все оцененные бета-коэффициенты фактически являются оценкой бета, умноженной на оцененную лямбду (обратная функция дисперсии). Это соблазняет аналитика игнорировать проблему. Однако он должен учитывать, отражает ли набор больших бета-коэффициентов сильные предпочтения (большая истинная бета) или последовательность в выборе (большая истинная лямбда), или некоторую комбинацию этих двух. Разделение всех оценок друг на друга - обычно на оценку переменной цены - исключает смешанный лямбда-член из числителя и знаменателя. Это решает проблему с дополнительным преимуществом, которое дает экономистам готовность респондента платить за каждый уровень атрибута. Однако вывод о том, что результаты, оцененные по «полезной площади», не совпадают с оценками по «готовности платить за площадь», предполагает, что проблема искажения не решается этим «трюком»: отклонения могут быть специфическими для атрибута или какой-либо другой функцией переменные (которые могли бы объяснить расхождение). Это предмет текущих исследований в данной области.

По сравнению с традиционными объединенными методами, основанными на рейтингах

Основные проблемы с вопросами рейтингов, которые не возникают в моделях выбора:

отсутствие информации о компромиссе. Риск, связанный с оценками, заключается в том, что респонденты склонны не различать воспринимаемые «хорошие» атрибуты и оценивать их все как привлекательные.
варианты личных шкал. Разные люди по-разному оценивают «2» по шкале от 1 до 5. Совокупность частот каждой из мер шкалы не имеет теоретической основы.
нет относительной меры. Как аналитик сравнивает то, что оценивается на 1, с тем, что имеет 2 балла? Один в два раза лучше другого? Опять же, нет теоретического способа агрегирования данных.

Другие типы

Ранжирование

Ранжирование действительно заставляет человека указывать относительные предпочтения по интересующим вопросам. Таким образом, можно, как и в DCE, обычно оценивать компромиссы между ними. Однако модели ранжирования должны проверять, оценивается ли одна и та же функция полезности на каждой глубине ранжирования: например, те же оценки (с точностью до шкалы дисперсии) должны быть получены из данных нижнего ранга, что и из данных верхнего ранга.

Шкала от наилучшего к худшему

Шкала от наилучшего к худшему (BWS) - это хорошо зарекомендовавшая себя альтернатива рейтингам и ранжированию. Он предлагает людям выбрать наиболее и наименее предпочтительные варианты из ряда альтернатив. Путем вычитания или интегрирования вероятностей выбора можно оценить полезность каждой альтернативы по шкале интервалов или соотношений для отдельных лиц и / или групп. Для получения наилучших-наихудших данных люди могут использовать различные психологические модели, включая модель MaxDiff.

Использование

Моделирование выбора особенно полезно для:

прогнозирования внедрения и совершенствования разработки новых продуктов
оценки подразумеваемой готовности платить (WTP) за товары и услуги
Тестирование жизнеспособности продукта или услуги
Оценка влияния характеристик продукта на выбор потребителя
Вариации атрибутов продукта
Понимание ценности и предпочтений бренда
Оценка спроса и оптимальное ценообразование

См. Также

Ссылки

Внешние ссылки

СМИ, связанные с Моделирование выбора на Викимедиа Commons
Кураторская библиография на IDEAS/RePEc