Выбрать смещение - это смещение, вызванное отбором лиц, групп или данных для анализа таким образом, что не достигается надлежащая рандомизация, что гарантирует, что полученная выборка не репрезентативна для предполагаемой совокупности. подлежат анализу. Иногда его называют эффектом выбора . Фраза «систематическая ошибка отбора» чаще всего относится к искажению статистического анализа, вызванному методом сбора образцов. Если не учитывать систематическую ошибку отбора, то некоторые выводы исследования могут быть ложными.
Существует много типов возможной систематической ошибки выбора, в том числе:
Ошибка выборки - это систематическая ошибка из-за не случайной выборки генеральной совокупности, в результате чего вероятность включения одних членов совокупности в выборку ниже, чем у других, что приводит к предвзятая выборка, определяемая как статистическая выборка из совокупности (или нечеловеческих факторов), в которой все участники не одинаково сбалансированы или объективно представлены. Это в основном классифицируется как подтип смещения выборки, иногда конкретно называемый смещением выборки, но некоторые классифицируют его как отдельный тип смещения.
Различие смещения выборки (хотя и не является общепринятым) заключается в том, что он подрывает внешнюю валидность теста (возможность обобщения его результатов для остальной совокупности), в то время как систематическая ошибка отбора в основном касается внутренней валидности различий или сходств, обнаруженных в образец под рукой. В этом смысле ошибки, возникающие в процессе сбора выборки или когорты, вызывают смещение выборки, тогда как ошибки в любом процессе впоследствии вызывают смещение выборки.
Примеры систематической ошибки выборки включают самостоятельный выбор, предварительный отбор участников исследования, дисконтирование субъектов исследования / тестов, которые не были завершены, и систематическую ошибку миграции путем исключения субъектов, которые недавно переехали в или за пределами области исследования.
Систематическая ошибка отсева - это своего рода систематическая ошибка отбора, вызванная отсевами (потерей участников), не считая субъектов испытаний / тестов, которые не прошли до завершения. Это тесно связано с смещением выживаемости, когда в анализ включаются только субъекты, которые «пережили» процесс, или с смещением неудач, где только субъекты, которые «не прошли» процесс включены. Сюда входят прекращение обучения, отсутствие ответа (более низкий уровень ответов ), отказ от участия и отклонения от протокола. Он дает предвзятые результаты, если они не одинаковы в отношении воздействия и / или результата. Например, при тестировании программы диеты исследователь может просто отвергнуть всех, кто выбывает из исследования, но большинство из тех, кто выбывает, - это те, для кого она не сработала. Различные потери субъектов в группе вмешательства и группы сравнения могут изменить характеристики этих групп и исходы независимо от изучаемого вмешательства.
Потерянный для последующего наблюдения - это еще одна форма систематической ошибки истощения, которая в основном встречается в медицинских исследованиях. в течение длительного периода времени. Ошибка отсутствия ответов или удержания может зависеть от ряда как материальных, так и нематериальных факторов, таких как: богатство, образование, альтруизм, начальное понимание учебы и ее требований. Исследователи также могут быть не в состоянии провести последующий контакт из-за неадекватной идентифицирующей информации и контактных данных, собранных на начальном этапе набора и исследования.
Философ Ник Бостром утверждал, что данные фильтруются не только по дизайну исследования и измерениям, но и по необходимому предварительному условию, что кто-то должен исследование. В ситуациях, когда существование наблюдателя или исследования коррелирует с данными, возникают эффекты выбора наблюдения и требуется антропное обоснование.
Примером может служить прошлое столкновение запись Земли: если большие столкновения вызовут массовые вымирания и экологические нарушения, исключающие эволюцию разумных наблюдателей на длительные периоды, никто не будет наблюдать никаких свидетельств крупных столкновений в недавнем прошлом (поскольку они препятствовали бы развитию разумных наблюдателей). Следовательно, есть потенциальная погрешность в записях столкновений с Землей. Астрономические экзистенциальные риски также могут быть недооценены из-за систематической ошибки отбора, и необходимо ввести антропную поправку.
Предвзятость самоотбора или предвзятость добровольцев в исследования предлагают дополнительную угрозу достоверности исследования, поскольку эти участники могут иметь характеристики, существенно отличающиеся от целевой популяции исследования. Исследования показали, что волонтеры, как правило, имеют более высокое социальное положение, чем более низкое социально-экономическое положение. Кроме того, другое исследование показывает, что женщины более склонны участвовать в исследованиях, чем мужчины. Предвзятость волонтеров очевидна на протяжении всего жизненного цикла исследования, от набора до последующих наблюдений. В более общем плане реакцию добровольцев можно объяснить индивидуальным альтруизмом, желанием одобрения, личным отношением к теме исследования и другими причинами. Как и в большинстве случаев, смягчением последствий в случае предвзятости добровольцев является увеличение размера выборки.
В общем случае смещения выборки невозможно преодолеть только статистическим анализом существующих данных, хотя поправка Хекмана может использоваться в особых случаях. Оценка степени систематической ошибки отбора может быть сделана путем изучения корреляций между экзогенными (фоновыми) переменными и показателем лечения. Однако в регрессионных моделях именно корреляция между ненаблюдаемыми детерминантами результата и ненаблюдаемыми детерминантами отбора в выборку приводит к смещению оценок, и эта корреляция между ненаблюдаемыми объектами не может быть напрямую оценена наблюдаемыми детерминантами лечения. 48>
Когда данные выбираются для подгонки или прогнозирования, можно настроить коалиционную игру, чтобы можно было определить функцию подгонки или точности прогноза для всех подмножеств переменных данных.
Смещение отбора тесно связано с: