Многоуровневая регрессия с постстратификацией

редактировать

Регрессионный анализ
Часть серии по
Модели
Линейная регрессия Простая регрессия Полиномиальная регрессия Общая линейная модель
Обобщенная линейная модель Дискретный выбор Биномиальная регрессия Бинарная регрессия Логистическая регрессия Полиномиальная логистическая регрессия Смешанный логит Пробит Полиномиальный пробит Заказал логит Заказал пробит Пуассон
Многоуровневая модель Фиксированные эффекты Случайные эффекты Линейная модель смешанных эффектов Нелинейная модель смешанных эффектов
Нелинейная регрессия Непараметрический Полупараметрический Крепкий Квантиль Изотонический Основные компоненты Наименьший угол Местный Сегментированный
Ошибки в переменных
Предварительный расчет
Наименьших квадратов Линейный Нелинейный
Обычный Взвешенный Обобщенный
Частичное Общий Неотрицательный Регрессия хребта Регулярный
Наименьшие абсолютные отклонения Итеративно переназначенный Байесовский Байесовский многомерный
Фон
Проверка регрессии Средний и прогнозируемый ответ Ошибки и остатки Доброта подгонки Студентизированный остаток Теорема Гаусса – Маркова
Математический портал
v т е

Многоуровневая регрессия и постстратификация (MRP) (иногда называемая "Mister P") - это статистический метод, используемый для корректировки оценок модели с учетом известных различий между выборочной совокупностью (совокупностью имеющихся у вас данных) и целевой совокупностью (совокупностью, которую вы бы хотелось бы прикинуть за). Например, Wang et. al. использовали данные опроса геймеров Xbox для прогнозирования результатов президентских выборов в США. Игроками Xbox было 65% игроков в возрасте от 18 до 29 лет и 93% мужчин, тогда как электорат в целом составлял 19% от 18 до 29 лет и 47% мужчин.

Poststratification относится к процессу корректировки оценок, по существу, взвешенное среднее оценок из всех возможных комбинаций признаков (в данном примере по возрасту и полу, хотя было больше). Каждую комбинацию иногда называют «ячейкой». Многоуровневая регрессия используется для сглаживания зашумленных оценок в клетках с слишком мало данных, используя общий или около средних значений.

Одно приложение оценивает предпочтения в субрегионах (например, штатах, отдельных округах) на основе данных обследований на индивидуальном уровне, собранных на других уровнях агрегирования (например, национальных обследований).

СОДЕРЖАНИЕ

1 Методика и ее преимущества
2 История
3 Ограничения и расширения
4 ссылки

Методика и ее преимущества

Этот метод по существу включает использование данных, например, переписей, относящихся к различным типам людей, соответствующим различным характеристикам (например, возрасту, расе), на первом этапе для оценки взаимосвязи между этими типами и индивидуальными предпочтениями (т. Е. Многоуровневой регрессия набора данных). Это соотношение затем используется на втором этапе для оценки субрегионального предпочтения на основе количества людей, имеющих каждый тип / характеристику в этом субрегионе (процесс, известный как «постстратификация»). Таким образом, устраняется необходимость в проведении обследований на субрегиональном уровне, что может быть дорогостоящим и непрактичным в области (например, в стране) с множеством субрегионов (например, округа, районы или штаты). Это также позволяет избежать проблем с согласованностью опроса при сравнении различных опросов, проведенных в разных областях. Кроме того, он позволяет оценить предпочтения в конкретном населенном пункте на основе опроса, проведенного на более широкой территории, которая включает относительно небольшое количество людей из рассматриваемой местности или где выборка может быть весьма нерепрезентативной.

История

Изначально эта техника была разработана Гельманом и Т. Литтлом в 1997 году на основе идей Фэй, Херриот и Р. Литтла. Впоследствии он был расширен Паком, Гельманом и Бафуми в 2004 и 2006 годах. Он был предложен для использования при оценке предпочтений избирателей на уровне штата США Лаксом и Филипсом в 2009 году. Уоршоу и Родден впоследствии предложили его для использования при оценке округов. уровень общественного мнения в 2012 году. Wang et al. впоследствии использовал его для оценки результатов президентских выборов 2012 года в США на основе опроса пользователей Xbox, а также был предложен для использования в области эпидемиологии.

YouGov использовал эту технику, чтобы успешно предсказать общий результат всеобщих выборов в Великобритании в 2017 году, правильно предсказав результат в 93% округов.

Ограничения и расширения

MRP может быть расширен для оценки изменения мнений с течением времени, и при использовании для прогнозирования выборов лучше всего работает, когда используется относительно близко к дате голосования, после того, как номинации закрыты.

Идеи MRP как «многоуровневой регрессии» и «постстратификации» можно обобщить. Многоуровневую регрессию можно заменить непараметрической регрессией или регуляризованным прогнозом, а постстратификацию можно обобщить, чтобы учесть переменные, не связанные с переписью, т. Е. Итоги постстратификации, которые оцениваются, а не известны.

использованная литература