Мета-анализ

редактировать
О процессе в исторической лингвистике, известном как метанализ, см. Rebracketing.

Графическое резюме метаанализа более 1000 случаев диффузной внутренней глиомы моста и других педиатрических глиом, в котором информация об участвующих мутациях, а также об общих исходах была извлечена из основной первичной литературы.

Мета-анализ представляет собой статистический анализ, который сочетает в себе результаты нескольких научных исследований. Мета-анализ может быть выполнен, когда есть несколько научных исследований, посвященных одному и тому же вопросу, причем каждое отдельное исследование сообщает об измерениях, которые, как ожидается, будут иметь некоторую степень ошибки. Затем цель состоит в том, чтобы использовать статистические подходы для получения объединенной оценки, наиболее близкой к неизвестной общей истине, на основе того, как воспринимается эта ошибка.

Метаанализ может не только дать оценку неизвестной общей истины, но и дать возможность сопоставить результаты различных исследований и выявить закономерности среди результатов исследований, источники разногласий между этими результатами или другие интересные взаимосвязи, которые могут выявиться с множественные исследования.

Однако при выполнении метаанализа исследователь должен делать выбор, который может повлиять на результаты, включая решение о том, как искать исследования, выбирать исследования на основе набора объективных критериев, работать с неполными данными, анализировать данные и учитывать или решив не учитывать предвзятость публикации. Вызов суждения, сделанный при завершении метаанализа, может повлиять на результаты. Например, Ванус и его коллеги изучили четыре пары метаанализа по четырем темам: (а) соотношение производительности труда и удовлетворенности, (б) реалистичные предварительные просмотры вакансий, (в) корреляты ролевого конфликта и двусмысленности, и (г) работа. соотношение удовлетворенности и прогулов и проиллюстрировал, как различные суждения, сделанные исследователями, приводили к разным результатам.

Метаанализ часто, но не всегда, является важным компонентом процедуры систематического обзора. Например, метаанализ может быть проведен по нескольким клиническим испытаниям лечения, чтобы лучше понять, насколько хорошо лечение работает. Здесь удобно следовать терминологии, используемой Кокрановским сотрудничеством, и использовать «мета-анализ» для обозначения статистических методов объединения доказательств, оставляя другие аспекты « синтеза исследований » или «синтеза доказательств», таких как объединение информации из качественных данных. исследования, для более общего контекста систематических обзоров. Метаанализ - вторичный источник.

СОДЕРЖАНИЕ
  • 1 История
  • 2 шага в метаанализе
  • 3 Методы и предположения
    • 3.1 Подходы
    • 3.2 Статистические модели для агрегированных данных
      • 3.2.1 Прямые доказательства: модели, учитывающие только эффекты исследования
        • 3.2.1.1 Модель с фиксированными эффектами
        • 3.2.1.2 Модель случайных эффектов
        • 3.2.1.3 Модель IVhet
      • 3.2.2 Прямое свидетельство: модели, включающие дополнительную информацию
        • 3.2.2.1 Модель качественных эффектов
      • 3.2.3 Косвенные свидетельства: методы сетевого метаанализа
        • 3.2.3.1 Байесовская структура
        • 3.2.3.2 Многомерная структура частотности
        • 3.2.3.3 Обобщенная структура попарного моделирования
        • 3.2.3.4 Индивидуальный мета-анализ
      • 3.2.4 Агрегирование IPD и AD
    • 3.3 Проверка результатов метаанализа
  • 4 испытания
    • 4.1 Предвзятость публикации: проблема с файловым ящиком
    • 4.2 Проблемы, связанные с исследованиями, в которых не сообщалось о статистически значимых эффектах
    • 4.3 Проблемы, связанные со статистическим подходом
    • 4.4 Проблемы, возникающие из-за предвзятости, связанной с повесткой дня
    • 4.5 Слабые стандарты включения приводят к ошибочным выводам
  • 5 Приложения в современной науке
  • 6 См. Также
  • 7 ссылки
  • 8 Дальнейшее чтение
  • 9 Внешние ссылки
История

Исторические корни метаанализа можно проследить до астрономических исследований 17-го века, в то время как статья, опубликованная в 1904 году статистиком Карлом Пирсоном в British Medical Journal, в которой собраны данные нескольких исследований прививок брюшного тифа, рассматривается как первый раз. метааналитический подход использовался для агрегирования результатов нескольких клинических исследований. Первый метаанализ всех концептуально идентичных экспериментов, касающихся конкретной исследовательской проблемы и проведенный независимыми исследователями, был идентифицирован как издание 1940 года « Экстрасенсорное восприятие после шестидесяти лет», автором которого являются психологи Университета Дьюка Дж. Г. Пратт, Дж. Б. Рейн и соратники. Это включало обзор 145 отчетов об экспериментах ESP, опубликованных с 1882 по 1939 год, и включал оценку влияния неопубликованных статей на общий эффект ( проблема с файловым ящиком). Термин «метаанализ» был придуман в 1976 году статистиком Джином В. Глассом, который заявил, что «в настоящее время меня больше всего интересует то, что мы стали называть... метаанализом исследований., но точно и мета... Мета-анализ относится к анализу анализов ». Хотя это привело к тому, что он получил широкое признание как современный основатель метода, методология, лежащая в основе того, что он назвал «метаанализом», предшествует его работе на несколько десятилетий. Статистическая теория метаанализа была значительно продвинута в работах Нэмбери С. Раджу, Ларри В. Хеджеса, Харриса Купера, Ингрэма Олкина, Джона Э. Хантера, Джейкоба Коэна, Томаса Чалмерса, Роберта Розенталя, Фрэнка Л. Шмидта., Джон Э. Хантер и Дуглас Г. Бонетт. В 1992 году метаанализ был впервые применен к экологическим вопросам Джессикой Гуревич, которая использовала метаанализ для изучения конкуренции в полевых экспериментах.

Шаги в метаанализе

Метаанализу обычно предшествует систематический обзор, так как это позволяет идентифицировать и критически оценить все соответствующие доказательства (тем самым ограничивая риск систематической ошибки в итоговых оценках). Общие шаги заключаются в следующем:

  1. Формулировка вопроса исследования, например, с использованием модели PICO (популяция, вмешательство, сравнение, результат).
  2. Поиск литературы
  3. Выбор исследований («критерии включения»)
    1. На основе критериев качества, например, требования рандомизации и ослепления в клиническом исследовании.
    2. Выбор конкретных исследований по четко определенной теме, например, по лечению рака груди.
    3. Решите, будут ли включены неопубликованные исследования, чтобы избежать предвзятости публикации ( проблема с файловым ящиком )
  4. Решите, какие зависимые переменные или сводные меры разрешены. Например, при рассмотрении метаанализа опубликованных (агрегированных) данных:
    • Различия (дискретные данные)
    • Средства (непрерывные данные)
    • G хеджирования - это популярная сводная мера для непрерывных данных, которая стандартизирована для устранения различий в масштабах, но включает индекс вариации между группами:
      1. δ знак равно μ т - μ c σ , {\ displaystyle \ delta = {\ frac {\ mu _ {t} - \ mu _ {c}} {\ sigma}},}где - среднее значение обработки, - среднее значение контроля, объединенная дисперсия. μ т {\ displaystyle \ mu _ {t}} μ c {\ displaystyle \ mu _ {c}} σ 2 {\ displaystyle \ sigma ^ {2}}
  5. Выбор модели метаанализа, например метаанализа фиксированных или случайных эффектов.
  6. Изучите источники неоднородности между исследованиями, например, используя анализ подгрупп или мета-регрессию.

Официальное руководство по проведению метаанализов и отчетности по ним содержится в Кокрановском справочнике.

Инструкции по отчетности см. В заявлении о предпочтительных элементах отчетности для систематических обзоров и метаанализов (PRISMA).

Методы и предположения

Подходы

В общем, при выполнении метаанализа можно выделить два типа свидетельств: данные отдельных участников (IPD) и агрегированные данные (AD). Сводные данные могут быть прямыми или косвенными.

AD более широко доступен (например, из литературы) и обычно представляет собой сводные оценки, такие как отношения шансов или относительные риски. Это можно напрямую синтезировать в концептуально схожих исследованиях с использованием нескольких подходов (см. Ниже). С другой стороны, косвенные совокупные данные измеряют эффект двух видов лечения, каждое из которых сравнивалось с аналогичной контрольной группой в метаанализе. Например, если лечение A и лечение B напрямую сравнивались с плацебо в отдельных метаанализах, мы можем использовать эти два объединенных результата, чтобы получить оценку эффектов A и B в косвенном сравнении как эффект A против плацебо минус эффект B. против плацебо.

Доказательства IPD представляют собой необработанные данные, собранные исследовательскими центрами. Это различие вызвало необходимость в различных метааналитических методах, когда требуется синтез доказательств, и привело к развитию одноэтапных и двухэтапных методов. В одноэтапных методах IPD из всех исследований моделируются одновременно с учетом кластеризации участников в рамках исследований. Двухэтапные методы сначала вычисляют сводную статистику для AD из каждого исследования, а затем вычисляют общую статистику как средневзвешенное значение статистики исследования. За счет сокращения IPD до AD двухэтапные методы также могут применяться, когда IPD доступен; это делает их привлекательным выбором при выполнении метаанализа. Хотя обычно считается, что одноэтапные и двухэтапные методы дают схожие результаты, недавние исследования показали, что иногда они могут приводить к разным выводам.

Статистические модели для агрегированных данных

Прямые доказательства: модели, учитывающие только эффекты исследования.

Модель с фиксированными эффектами

Модель фиксированного эффекта обеспечивает средневзвешенное значение ряда оценок исследования. В качестве веса исследования обычно используется величина, обратная дисперсии оценок, поэтому более крупные исследования, как правило, вносят больший вклад в средневзвешенное значение, чем более мелкие исследования. Следовательно, когда в исследованиях в рамках метаанализа преобладает очень большое исследование, результаты небольших исследований практически игнорируются. Наиболее важно то, что модель фиксированных эффектов предполагает, что все включенные исследования исследуют одну и ту же популяцию, используют одни и те же переменные и определения результатов и т. Д. Это предположение обычно нереалистично, поскольку исследования часто склонны к нескольким источникам неоднородности ; например, эффекты лечения могут различаться в зависимости от места действия, уровней дозировки, условий исследования,...

Модель случайных эффектов

Распространенной моделью, используемой для синтеза гетерогенных исследований, является модель метаанализа со случайными эффектами. Это просто средневзвешенное значение величины эффекта группы исследований. Вес, который применяется в этом процессе взвешенного усреднения с метаанализом случайных эффектов, достигается в два этапа:

  1. Шаг 1. Обратное взвешивание дисперсии
  2. Шаг 2: Отмена взвешивания этого обратного взвешивания дисперсии путем применения компонента дисперсии случайных эффектов (REVC), который просто выводится из степени изменчивости размеров эффекта в базовых исследованиях.

Это означает, что чем больше эта изменчивость в величине эффекта (также известная как неоднородность ), тем больше невзвешенность, и это может достигнуть точки, когда результат метаанализа случайных эффектов станет просто невзвешенным средним размером эффекта по всем исследованиям. С другой стороны, когда все размеры эффекта схожи (или вариабельность не превышает ошибку выборки), REVC не применяется, а метаанализ случайных эффектов по умолчанию сводится к простому метаанализу с фиксированным эффектом (только с обратным взвешиванием дисперсии).

Степень этого разворота зависит исключительно от двух факторов:

  1. Неоднородность точности
  2. Неоднородность величины эффекта

Поскольку ни один из этих факторов автоматически не указывает на ошибочное более крупное исследование или более надежные более мелкие исследования, перераспределение весов в рамках этой модели не будет иметь отношения к тому, что на самом деле могут предложить эти исследования. Действительно, было продемонстрировано, что перераспределение весов происходит просто в одном направлении от больших исследований к меньшим по мере увеличения неоднородности, пока в конечном итоге все исследования не станут равными и перераспределение станет невозможным. Другая проблема модели случайных эффектов заключается в том, что наиболее часто используемые доверительные интервалы обычно не сохраняют вероятность охвата выше указанного номинального уровня и, таким образом, существенно недооценивают статистическую ошибку и потенциально чрезмерно уверены в своих выводах. Было предложено несколько исправлений, но дебаты продолжаются. Еще одна проблема заключается в том, что средний эффект лечения иногда может быть даже менее консервативным по сравнению с моделью фиксированного эффекта и, следовательно, вводить в заблуждение на практике. Одно из предложенных способов интерпретации - создать интервал прогнозирования вокруг оценки случайных эффектов, чтобы отобразить диапазон возможных эффектов на практике. Однако при расчете такого интервала прогноза предполагается, что испытания считаются более или менее однородными, а исследования, включающие популяции пациентов и препараты сравнения, должны считаться взаимозаменяемыми, а это обычно недостижимо на практике.

Наиболее широко используемый метод оценки дисперсии между исследованиями (REVC) - это подход Дерсимониан-Лэрда (DL). Существует несколько продвинутых итерационных (и дорогостоящих в вычислительном отношении) методов вычисления дисперсии между исследованиями (например, методы максимального правдоподобия, профильного правдоподобия и ограниченного максимального правдоподобия), и модели случайных эффектов, использующие эти методы, могут быть запущены в Stata с помощью команды metaan. Команду metaan следует отличать от классической команды metan (одиночной "a") в Stata, которая использует оценщик DL. Эти расширенные методы также были реализованы в бесплатном и простом в использовании надстройке Microsoft Excel MetaEasy. Однако сравнение этих передовых методов и метода DL для вычисления дисперсии между исследованиями показало, что здесь мало пользы, и DL вполне адекватен в большинстве сценариев.

Однако большинство метаанализов включают от 2 до 4 исследований, и такой выборки чаще всего недостаточно для точной оценки неоднородности. Таким образом, кажется, что в небольших метаанализах получается неверный ноль между оценками дисперсии исследований, что приводит к ложному предположению об однородности. В целом, похоже, что неоднородность постоянно недооценивается в метаанализах и анализах чувствительности, в которых предполагается, что высокие уровни неоднородности могут быть информативными. Эти модели случайных эффектов и программные пакеты, упомянутые выше, относятся к метаанализу совокупного исследования, и исследователям, желающим провести метаанализ данных отдельных пациентов (IPD), необходимо рассмотреть подходы к моделированию смешанных эффектов.

IVhet модель

Дои и Барендрегт в сотрудничестве с Кханом, Талибом и Уильямсом (из Университета Квинсленда, Университета Южного Квинсленда и Университета Кувейта) создали квази-правдоподобную альтернативу обратной дисперсии модели случайных эффектов (RE), для которой подробности доступны в Интернете. Это было включено в MetaXL версии 2.0, бесплатную надстройку Microsoft Excel для метаанализа, разработанную Epigear International Pty Ltd, и сделанную доступной 5 апреля 2014 года. Авторы заявляют, что явным преимуществом этой модели является то, что она решает две проблемы. основные проблемы модели случайных эффектов. Первое преимущество модели IVhet заключается в том, что охват остается на номинальном (обычно 95%) уровне для доверительного интервала, в отличие от модели со случайными эффектами, охват которой уменьшается с увеличением неоднородности. Второе преимущество состоит в том, что модель IVhet поддерживает весовые коэффициенты обратной дисперсии отдельных исследований, в отличие от модели RE, которая придает небольшим исследованиям больший вес (и, следовательно, более крупным исследованиям меньше) с увеличением неоднородности. Когда неоднородность становится большой, веса отдельных исследований в модели RE становятся равными, и, таким образом, модель RE возвращает среднее арифметическое, а не средневзвешенное. Этот побочный эффект модели RE не возникает с моделью IVhet, которая, таким образом, отличается от оценки модели RE с двух точек зрения: объединенные оценки будут отдавать предпочтение более крупным испытаниям (в отличие от штрафов за более крупные испытания в модели RE) и будут иметь уверенность. интервал, который остается в пределах номинального покрытия в условиях неопределенности (неоднородности). Doi amp; Barendregt предполагают, что, хотя модель RE предоставляет альтернативный метод объединения данных исследования, их результаты моделирования демонстрируют, что использование более конкретной вероятностной модели с несостоятельными предположениями, как в случае модели RE, не обязательно дает лучшие результаты. В последнем исследовании также сообщается, что модель IVhet решает проблемы, связанные с недооценкой статистической ошибки, плохим охватом доверительного интервала и повышенным MSE, наблюдаемым с помощью модели случайных эффектов, и авторы приходят к выводу, что исследователи отныне должны отказаться от использования модели случайных эффектов. в метаанализе. Хотя их данные убедительны, разветвления (с точки зрения величины ложно положительных результатов в базе данных Кокрейн) огромны, и поэтому принятие этого вывода требует тщательного независимого подтверждения. Доступность бесплатного программного обеспечения (MetaXL), которое запускает модель IVhet (и все другие модели для сравнения), облегчает это для исследовательского сообщества.

Прямые доказательства: модели, включающие дополнительную информацию

Модель качественных эффектов

Дои и Талиб первоначально представили модель качественных эффектов. Они представили новый подход к корректировке вариативности между исследованиями, включив вклад дисперсии из-за соответствующего компонента (качества) в дополнение к вкладу дисперсии из-за случайной ошибки, которая используется в любой модели метаанализа с фиксированными эффектами для генерации веса для каждого исследования. Сила метаанализа качественных эффектов заключается в том, что он позволяет использовать имеющиеся методологические доказательства вместо субъективных случайных эффектов и тем самым помогает закрыть разрушительный разрыв, который образовался между методологией и статистикой в ​​клинических исследованиях. Для этого на основе информации о качестве вычисляется синтетическая дисперсия смещения для корректировки весов обратной дисперсии и вводится вес с поправкой на качество i- го исследования. Эти скорректированные веса затем используются в метаанализе. Другими словами, если исследование i хорошего качества, а другие исследования низкого качества, часть их весов с поправкой на качество математически перераспределяется между исследованиями i, придавая ему больший вес в отношении общей величины эффекта. По мере того, как исследования становятся все более похожими с точки зрения качества, повторное распространение становится все меньше и прекращается, когда все исследования имеют одинаковое качество (в случае равного качества модель эффектов качества по умолчанию соответствует модели IVhet - см. Предыдущий раздел). Недавняя оценка модели эффектов качества (с некоторыми обновлениями) демонстрирует, что, несмотря на субъективность оценки качества, производительность (MSE и истинная дисперсия при моделировании) выше, чем достижимая модель со случайными эффектами. Таким образом, эта модель заменяет несостоятельные интерпретации, которые имеются в большом количестве в литературе, и доступно программное обеспечение для дальнейшего изучения этого метода.

Косвенные доказательства: методы сетевого метаанализа

Сетевой метаанализ рассматривает косвенные сравнения. На изображении A был проанализирован по отношению к C, а C был проанализирован по отношению к b. Однако связь между A и B известна только косвенно, и сетевой метаанализ рассматривает такие косвенные свидетельства различий между методами и вмешательствами с использованием статистических методов.

В методах метаанализа косвенного сравнения (также называемых сетевым метаанализом, в частности, когда одновременно оценивается несколько видов лечения) обычно используются две основные методологии. Во-первых, это метод Бухера, который представляет собой однократное или повторяющееся сравнение замкнутого цикла из трех процедур, так что одно из них является общим для двух исследований и образует узел, на котором цикл начинается и заканчивается. Следовательно, для сравнения нескольких курсов лечения необходимы множественные сравнения два на два (петли из 3 процедур). Эта методология требует, чтобы в исследованиях с более чем двумя группами были выбраны только две группы, поскольку требуются независимые попарные сравнения. Альтернативная методология использует сложное статистическое моделирование для одновременного включения нескольких клинических испытаний и сравнений между всеми конкурирующими видами лечения. Они были выполнены с использованием байесовских методов, смешанных линейных моделей и мета-регрессионных подходов.

Байесовская структура

Определение модели метаанализа байесовской сети включает в себя написание модели направленного ациклического графа (DAG) для универсального программного обеспечения Монте-Карло цепи Маркова (MCMC), такого как WinBUGS. Кроме того, для ряда параметров должны быть указаны предыдущие распределения, а данные должны быть предоставлены в определенном формате. Вместе DAG, априорные значения и данные образуют байесовскую иерархическую модель. Чтобы еще больше усложнить ситуацию, из-за характера оценки MCMC необходимо выбрать сверхдисперсные начальные значения для ряда независимых цепочек, чтобы можно было оценить сходимость. В настоящее время нет программного обеспечения, которое автоматически генерирует такие модели, хотя есть некоторые инструменты, помогающие в этом процессе. Сложность байесовского подхода ограничивает использование этой методологии. Была предложена методология автоматизации этого метода, но она требует наличия данных об исходах на уровне группы, а они обычно недоступны. Иногда делаются большие заявления о врожденной способности байесовской структуры обрабатывать сетевой метаанализ и ее большей гибкости. Однако этот выбор реализации схемы вывода, байесовской или частотной, может быть менее важным, чем другие варианты моделирования эффектов (см. Обсуждение моделей выше).

Многопараметрическая система частотности

С другой стороны, частотные многомерные методы включают приближения и предположения, которые не указываются явно или не проверяются при применении методов (см. Обсуждение моделей метаанализа выше). Например, пакет mvmeta для Stata позволяет выполнять метаанализ сети в частотной структуре. Однако, если в сети нет общего компаратора, то с этим необходимо справиться путем расширения набора данных вымышленными руками с высокой дисперсией, что не очень объективно и требует решения относительно того, что составляет достаточно высокую дисперсию. Другой проблемой является использование модели случайных эффектов как в этой частотной структуре, так и в байесовской структуре. Сенн советует аналитикам с осторожностью относиться к интерпретации анализа «случайных эффектов», поскольку допускается только один случайный эффект, но можно предусмотреть множество. Сенн продолжает, что это довольно наивно, даже в случае, когда сравниваются только два лечения, предполагать, что анализ случайных эффектов учитывает всю неопределенность в отношении того, как эффекты могут варьироваться от испытания к испытанию. Новые модели метаанализа, такие как рассмотренные выше, безусловно, помогут облегчить эту ситуацию, и они были реализованы в следующей структуре.

Обобщенная структура парного моделирования

Подход, который был опробован с конца 1990-х годов, - это реализация множественного анализа с замкнутым контуром с тремя обработками. Это не было популярным, потому что процесс быстро становится подавляющим по мере увеличения сложности сети. Затем от разработок в этой области отказались в пользу байесовских и многомерных частотных методов, которые появились в качестве альтернативы. Совсем недавно некоторые исследователи разработали автоматизацию метода замкнутого цикла с тремя обработками для сложных сетей как способ сделать эту методологию доступной для основного исследовательского сообщества. Это предложение действительно ограничивает каждое испытание двумя вмешательствами, но также вводит обходной путь для нескольких испытаний рук: другой фиксированный узел управления может быть выбран в разных прогонах. В нем также используются надежные методы метаанализа, позволяющие избежать многих из перечисленных выше проблем. Требуются дальнейшие исследования этой схемы, чтобы определить, действительно ли она лучше байесовской или многомерной частотной схемы. Исследователи, желающие попробовать это, имеют доступ к этой структуре через бесплатное программное обеспечение.

Индивидуальный мета-анализ

Другая форма дополнительной информации исходит из предполагаемой настройки. Если целевая настройка для применения результатов метаанализа известна, то можно будет использовать данные из настройки для адаптации результатов, таким образом, производя «специализированный мета-анализ»., Это использовалось в мета-анализах точности тестирования, где эмпирические знания о частоте положительных результатов теста и распространенности были использованы для получения области в пространстве рабочих характеристик приемника (ROC), известной как «применимая область». Затем выбираются исследования для целевого параметра на основе сравнения с этим регионом и объединяются для получения итоговой оценки, адаптированной к целевому параметру.

Агрегирование IPD и AD

Мета-анализ также может применяться для объединения IPD и AD. Это удобно, когда исследователи, проводящие анализ, имеют свои собственные необработанные данные при сборе агрегированных или сводных данных из литературы. Обобщенная интеграционная модель (GIM) является обобщением метаанализа. Это позволяет отличать модель, подобранную по данным отдельных участников (IPD) от моделей, используемых для вычисления агрегированных данных (AD). GIM можно рассматривать как метод калибровки модели для большей гибкости интеграции информации.

Проверка результатов метаанализа

Оценка метаанализа представляет собой средневзвешенное значение по исследованиям, и при наличии неоднородности это может привести к тому, что итоговая оценка не будет репрезентативной для отдельных исследований. Качественная оценка первичных исследований с использованием установленных инструментов может выявить потенциальные ошибки, но не дает количественной оценки совокупного влияния этих ошибок на итоговую оценку. Хотя результат метаанализа можно сравнить с независимым проспективным первичным исследованием, такое внешнее подтверждение часто нецелесообразно. Это привело к разработке методов, которые используют форму перекрестной проверки исключения по одному, иногда называемую перекрестной проверкой внутри и снаружи (IOCV). Здесь каждое из k включенных исследований по очереди опускается и сравнивается с итоговой оценкой, полученной путем агрегирования оставшихся k-1 исследований. Общая проверочная статистика Vn на основе IOCV была разработана для измерения статистической достоверности результатов метаанализа. Для проверки точности и прогнозирования, особенно когда есть многомерные эффекты, также были предложены другие подходы, которые стремятся оценить ошибку прогнозирования.

Вызовы

Метаанализ нескольких небольших исследований не всегда позволяет предсказать результаты одного большого исследования. Некоторые утверждали, что недостатком метода является то, что источники смещения не контролируются методом: хороший мета-анализ не может исправить плохой дизайн или смещение в исходных исследованиях. Это означало бы, что в метаанализ следует включать только методологически обоснованные исследования, практику, называемую «синтезом наилучших доказательств». Другие метааналитики включили бы более слабые исследования и добавили бы предикторную переменную на уровне исследования, которая отражает методологическое качество исследований, чтобы изучить влияние качества исследования на величину эффекта. Однако другие утверждали, что лучший подход состоит в том, чтобы сохранить информацию о дисперсии в исследуемой выборке, используя как можно более широкую сеть, и что методологические критерии отбора привносят нежелательную субъективность, сводя на нет цель подхода.

Предвзятость публикации: проблема с файловым ящиком

Ожидаемый график воронки без проблем с файловым ящиком. Крупнейшие исследования сходятся на вершине, в то время как более мелкие исследования показывают более или менее симметричный разброс у основания. Ожидается график воронки при проблеме с файловым ящиком. Крупнейшие исследования по-прежнему группируются вокруг вершины, но предвзятость в отношении публикации отрицательных исследований привела к тому, что более мелкие исследования в целом дали неоправданно благоприятный результат для гипотезы.

Еще одна потенциальная ловушка - это зависимость от доступного объема опубликованных исследований, что может привести к завышенным результатам из-за предвзятости публикации, поскольку исследования, которые показывают отрицательные или незначительные результаты, с меньшей вероятностью будут опубликованы. Например, известно, что фармацевтические компании скрывают отрицательные исследования, а исследователи могут упустить из виду неопубликованные исследования, такие как исследования диссертаций или тезисы конференций, которые не были опубликованы. Это нелегко решить, поскольку невозможно знать, сколько исследований осталось незарегистрированным.

Эта проблема с файловым ящиком (характеризуемая отрицательными или несущественными результатами, спрятанными в шкафу) может привести к смещенному распределению размеров эффекта, создавая, таким образом, серьезную ошибку базовой ставки, в которой значимость опубликованных исследований переоценивается, поскольку другие исследования либо не были представлены для публикации, либо были отклонены. Это следует серьезно учитывать при интерпретации результатов метаанализа.

Распределение размеров эффекта можно визуализировать с помощью воронкообразного графика, который (в его наиболее распространенной версии) представляет собой диаграмму разброса стандартной ошибки в зависимости от размера эффекта. Он использует тот факт, что более мелкие исследования (следовательно, более крупные стандартные ошибки) имеют больший разброс величины эффекта (будучи менее точными), в то время как более крупные исследования имеют меньший разброс и образуют вершину воронки. Если многие отрицательные исследования не были опубликованы, оставшиеся положительные исследования дают начало графику воронки, основание которого смещено в одну сторону (асимметрия графика воронки). Напротив, когда нет предвзятости публикации, эффект небольших исследований не имеет причин для отклонения в одну сторону, и поэтому получается симметричный график воронки. Это также означает, что при отсутствии предвзятости публикации не будет никакой связи между стандартной ошибкой и размером эффекта. Отрицательная или положительная связь между стандартной ошибкой и размером эффекта будет означать, что более мелкие исследования, которые обнаружили эффекты только в одном направлении, с большей вероятностью будут опубликованы и / или представлены для публикации.

Помимо визуальной воронки, были также предложены статистические методы обнаружения систематической ошибки публикации. Они противоречивы, потому что обычно имеют низкую мощность для обнаружения смещения, но также могут давать ложные срабатывания при некоторых обстоятельствах. Например, эффекты небольших исследований (предвзятые более мелкие исследования), в которых существуют методологические различия между более мелкими и более крупными исследованиями, могут вызвать асимметрию в размерах эффекта, которая напоминает предвзятость публикации. Однако эффекты небольших исследований могут быть столь же проблематичными для интерпретации метаанализов, и авторы метааналитики обязаны исследовать потенциальные источники систематической ошибки.

Для сокращения числа ложноположительных ошибок был предложен тандемный метод анализа предвзятости публикации. Этот тандемный метод состоит из трех этапов. Во-первых, вычисляется отказоустойчивое N Орвина, чтобы проверить, сколько исследований следует добавить, чтобы уменьшить статистику теста до тривиального размера. Если это количество исследований больше, чем количество исследований, использованных в метаанализе, это признак того, что нет систематической ошибки публикации, поскольку в этом случае требуется много исследований, чтобы уменьшить размер эффекта. Во-вторых, можно провести регрессионный тест Эггера, который проверяет, является ли график воронки симметричным. Как упоминалось ранее: симметричный график воронки является признаком отсутствия предвзятости публикации, поскольку размер эффекта и размер выборки не зависят. В-третьих, можно использовать метод обрезки и заполнения, который вводит данные, если график воронки асимметричен.

Проблема предвзятости публикации не является тривиальной, поскольку предполагается, что 25% метаанализов в психологических науках могли пострадать от предвзятости публикации. Однако низкая мощность существующих тестов и проблемы с внешним видом графика воронки остаются проблемой, а оценки систематической ошибки публикации могут оставаться ниже реальных.

Большинство дискуссий о предвзятости публикации сосредоточено на практике журналов, благоприятствующей публикации статистически значимых результатов. Однако сомнительные методы исследования, такие как переработка статистических моделей до достижения значимости, также могут способствовать получению статистически значимых результатов в поддержку гипотез исследователей.

Проблемы, связанные с исследованиями, в которых не сообщалось о статистически значимых эффектах

Исследования часто не сообщают о эффектах, когда они не достигают статистической значимости. Например, они могут просто сказать, что группы не показали статистически значимых различий, без предоставления какой-либо другой информации (например, статистики или p-значения). Исключение этих исследований привело бы к ситуации, аналогичной систематической ошибке публикации, но их включение (при допущении нулевых эффектов) также повлияло бы на метаанализ. MetaNSUE, метод, созданный Хоакимом Радуа, показал, что позволяет исследователям беспристрастно включать эти исследования. Его шаги следующие:

Проблемы, связанные со статистическим подходом

Другими недостатками является то, что не было определено, является ли статистически наиболее точным методом объединения результатов модели фиксированного, IVhet, случайного или качественного эффекта, хотя критика модели случайных эффектов усиливается из-за восприятия того, что новые случайные эффекты ( используются в метаанализе), по сути, являются формальными устройствами для облегчения сглаживания или сжатия, и прогнозирование может быть невозможным или необдуманным. Основная проблема подхода со случайными эффектами заключается в том, что он использует классическую статистическую мысль о создании «компромиссной оценки», которая делает веса близкими к естественно взвешенной оценке, если неоднородность между исследованиями велика, но близка к оценке, взвешенной с обратной дисперсией, если между неоднородность исследования мала. Однако игнорировалось различие между моделью, которую мы выбираем для анализа данного набора данных, и механизмом, с помощью которого эти данные возникли. Случайный эффект может присутствовать в любой из этих ролей, но эти две роли совершенно разные. Нет оснований полагать, что модель анализа и механизм (модель) генерации данных похожи по форме, но многие подобласти статистики выработали привычку предполагать, для теории и моделирования, что механизм (модель) генерации данных является идентична модели анализа, которую мы выбираем (или хотели бы, чтобы ее выбрали другие). В качестве гипотетического механизма для получения данных модель случайных эффектов для метаанализа является глупой, и более уместно рассматривать эту модель как поверхностное описание и что-то, что мы выбираем как аналитический инструмент, но этот выбор для метаанализа может не работают, потому что эффекты исследования являются фиксированной функцией соответствующего метаанализа, а распределение вероятностей является только описательным инструментом.

Проблемы, возникающие из-за предвзятости, связанной с повесткой дня

Наиболее серьезная ошибка в метаанализе часто возникает, когда человек или лица, выполняющие метаанализ, имеют экономическую, социальную или политическую повестку дня, такую ​​как принятие или отклонение законодательства. Люди с такими программами могут с большей вероятностью злоупотребить метаанализом из-за личных предубеждений. Например, исследователи благоприятствующих программы автора, скорее всего, чтобы их исследования вишней в то время как не выгодно будет игнорироваться или помечены как «не заслуживает доверия». Кроме того, избранные авторы могут сами быть предвзятыми или получать деньги за получение результатов, которые поддерживают их общие политические, социальные или экономические цели, например, путем выбора небольших благоприятных наборов данных и исключения более крупных неблагоприятных наборов данных. Влияние таких предубеждений на результаты метаанализа возможно, потому что методология метаанализа очень гибкая.

В исследовании 2011 года, проведенном для выявления возможных конфликтов интересов в основных исследованиях, используемых для медицинских метаанализов, было проанализировано 29 метаанализов и обнаружено, что конфликты интересов в исследованиях, лежащих в основе метаанализов, раскрывались редко. 29 метаанализов включали 11 из журналов общей медицины, 15 из специализированных медицинских журналов и три из Кокрановской базы данных систематических обзоров. В 29 метаанализах было проанализировано в общей сложности 509 рандомизированных контролируемых испытаний (РКИ). Из них 318 РКИ сообщили об источниках финансирования, при этом 219 (69%) получали финансирование от промышленности (т. Е. Один или несколько авторов имели финансовые связи с фармацевтической промышленностью). Из 509 РКИ 132 сообщили о раскрытии информации о конфликте интересов авторов, а 91 исследование (69%) раскрыло, что один или несколько авторов имеют финансовые связи с промышленностью. Однако информация редко отражалась в метаанализах. Только два (7%) сообщили об источниках финансирования РКИ, и ни один не сообщил о связях между авторами РКИ и отраслью. Авторы пришли к выводу, что «без признания ИСП из-за финансирования отрасли или финансовых связей автора с отраслью из РКИ, включенных в метаанализ, понимание читателями и оценка доказательств из метаанализа может быть поставлено под угрозу».

Например, в 1998 году федеральный судья США обнаружил, что Агентство по охране окружающей среды США злоупотребило процессом метаанализа для проведения исследования, в котором утверждалось, что табачный дым в окружающей среде (ETS) подвергается риску рака для некурящих с намерением повлиять на разработчиков политики. принять законы о запрете курения на рабочем месте. Судья установил, что:

Выбор исследования EPA вызывает беспокойство. Во-первых, в протоколе есть доказательства, подтверждающие обвинение в том, что EPA «вишня» собрала его данные. Без критериев для объединения исследований в метаанализ суд не может определить, было ли исключение исследований, которые могли бы опровергнуть априорную гипотезу EPA, совпадением или преднамеренным. Во-вторых, исключение EPA почти половины доступных исследований прямо противоречит предполагаемой цели EPA по анализу эпидемиологических исследований и противоречит Руководству EPA по оценке рисков. См. ETS Risk Assessment at 4-29 («Эти данные также должны быть изучены с целью взвешивания всех имеющихся доказательств, как рекомендовано в рекомендациях EPA по оценке канцерогенного риска (US EPA, 1986a) (курсив добавлен)). В-третьих, выборочные EPA использование данных противоречит Закону об исследованиях радона. В законе говорится, что программа EPA должна «собирать данные и информацию по всем аспектам качества воздуха в помещениях» (Закон об исследованиях радона, § 403 (a) (1)) (курсив добавлен).

В результате злоупотребления суд аннулировал главы 1–6 и приложения к EPA «Влияние пассивного курения на респираторное здоровье: рак легких и другие заболевания».

Слабые стандарты включения приводят к ошибочным выводам

Мета-анализ в образовании часто недостаточно ограничивает методологическое качество включаемых в него исследований. Например, исследования, включающие небольшие выборки или меры, разработанные исследователями, приводят к завышенным оценкам размера эффекта.

Приложения в современной науке

Современный статистический метаанализ делает больше, чем просто объединяет размеры эффекта набора исследований с использованием средневзвешенного значения. Он может проверить, демонстрируют ли результаты исследований больше вариаций, чем ожидаемые, из-за выборки разного числа участников исследования. Кроме того, характеристики исследования, такие как используемый инструмент измерения, выборка населения или аспекты дизайна исследования, могут быть закодированы и использованы для уменьшения дисперсии оценщика (см. Статистические модели выше). Таким образом, некоторые методологические недостатки исследований можно исправить статистически. Другие виды использования метааналитических методов включают разработку и проверку моделей клинического прогнозирования, где метаанализ может использоваться для объединения данных отдельных участников из разных исследовательских центров и для оценки обобщаемости модели или даже для агрегирования существующих моделей прогнозирования.

Мета-анализ может проводиться как с индивидуальным дизайном, так и с дизайном групповых исследований. Это важно, потому что многие исследования проводились с использованием планов исследований по одному предмету. Существуют серьезные споры о наиболее подходящей метааналитической технике для исследования одного предмета.

Мета-анализ приводит к смещению акцента с отдельных исследований на множественные. Он подчеркивает практическую важность величины эффекта вместо статистической значимости отдельных исследований. Этот сдвиг в мышлении получил название «метааналитическое мышление». Результаты метаанализа часто отображаются на лесном участке.

Результаты исследований объединены с использованием разных подходов. Один из подходов, часто используемых в метаанализе в медицинских исследованиях, называется « методом обратной дисперсии ». Средний размер эффекта по всем исследованиям вычисляется как средневзвешенное значение, при этом веса равны обратной дисперсии оценки эффекта каждого исследования. Более крупным исследованиям и исследованиям с меньшим количеством случайных вариаций придается больший вес, чем небольшим исследованиям. Другие общие подходы включают метод Mantel-Haenszel и метод Пето.

D-картирование на основе семян (ранее подписанное дифференциальное картирование, SDM) - это статистический метод для метаанализа исследований различий в активности или структуре мозга, в котором использовались методы нейровизуализации, такие как фМРТ, VBM или ПЭТ.

Для понимания экспрессии генов использовались различные высокопроизводительные методы, такие как микроматрицы. МикроРНК профили экспрессии была использована для идентификации дифференциальна выраженный микроРНКа в конкретных условиях клетки или ткани типа или заболевания или для проверки эффекта лечения. Метаанализ таких профилей экспрессии был проведен для получения новых выводов и подтверждения известных результатов.

Смотрите также
использованная литература
дальнейшее чтение
внешние ссылки
Последняя правка сделана 2024-01-02 08:22:05
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте