Иерархия свидетельств

редактировать

A иерархия свидетельств (или уровней свидетельств ) является эвристикой используется для ранжирования относительной силы результатов, полученных в результате научных исследований. Существует широкое согласие относительно относительной силы крупномасштабных эпидемиологических исследований. Было предложено более 80 различных иерархий для оценки медицинских доказательств. Дизайн исследования (например, отчет для отдельного пациента или слепое рандомизированное контролируемое исследование ) и измеренные конечные точки (такие как выживаемость или качество жизни ) влияют на силу доказательств. В клинических исследованиях лучшие доказательства эффективности лечения получены в основном из метаанализов рандомизированных контролируемых исследований (РКИ). Как правило, систематические обзоры завершенных высококачественных рандомизированных контролируемых исследований - например, опубликованные Cochrane Collaboration - имеют наивысшее качество доказательств выше обсервационных исследований, в то время как мнения экспертов и анекдотический опыт находятся на самом низком уровне качества доказательств. Иерархия доказательств часто применяется в доказательной практике и является неотъемлемой частью доказательной медицины (ДМ).

Содержание

1 Определение
2 Примеры
- 2.1 КЛАСС
- 2.2 Guyatt and Sackett
- 2.3 Saunders et al.
- 2.4 Khan et al.
- 2.5 Национальный реестр США Практика и программы, основанные на фактах
- 2,6 Mercer and Pignotti
3 История
- 3,1 Канада
- 3,2 США
- 3,3 Великобритания
- 3,4 В мире
4 Сторонники
5 Критика
6 См. Также
7 Ссылки
8 Дополнительная литература
9 Внешние ссылки

Определение

В 2014 году Стегенга определил иерархию доказательств как «ранжирование видов методов в соответствии с потенциальной систематической предвзятости этого метода ". На вершине иерархии находится метод с наибольшей свободой от системной предвзятости или лучшей внутренней валидностью по сравнению с предполагаемой эффективностью протестированного медицинского вмешательства. В 1997 году Гринхал предположил, что это «относительный вес различных типов первичных исследований при принятии решений о клинических вмешательствах».

Национальный институт рака определяет уровни доказательности как « система ранжирования, используемая для описания силы результатов, измеренных в клиническом исследовании или научном исследовании. Дизайн исследования [...] и конечные точки измеренные [...] влияют на силу доказательств ».

Примеры

Было предложено большое количество иерархий доказательств. Подобные протоколы для оценки качества исследований все еще находятся в разработке. Пока в доступных протоколах относительно мало внимания уделяется тому, имеет ли исследование результатов отношение к эффективности (результат лечения, проведенного в идеальных условиях) или результативности (результат лечения, проведенного в обычных ожидаемых условиях).

GRADE

Подход GRADE (градация оценки, разработки и оценки рекомендаций) - это метод оценки достоверности доказательств (также известной как качество доказательств или достоверность оценок эффекта) и сила рекомендаций. GRADE начался в 2000 году как результат сотрудничества методологов, разработчиков руководств, биостатистов, клиницистов, ученых в области общественного здравоохранения и других заинтересованных участников.

Более 100 организаций (включая Всемирную организацию здравоохранения, Национальный институт здравоохранения и повышения квалификации Великобритании (NICE), Канадскую рабочую группу по профилактике здравоохранения, Министерство здравоохранения Колумбии, среди прочего) одобрили и / или используют GRADE для оценки качества доказательств и силы рекомендаций здравоохранения. (См. Примеры руководств по клинической практике с использованием GRADE онлайн.)

Качество доказательств по шкале GRADE оценивается следующим образом:

Высокое	Существует большая уверенность в том, что истинный эффект близок к этому оцениваемого эффекта.
Умеренный	Существует умеренная уверенность в оценке эффекта: истинный эффект, вероятно, будет близок к ожидаемому эффекту, но есть вероятность, что он существенно отличается.
Низкий	В оценочном эффекте есть ограниченный эффект: истинный эффект может существенно отличаться от оцененного эффекта.
Очень низкий	Существует очень небольшая уверенность в оценке эффекта: истинный эффект, вероятно, будет существенно отличаться от оцененного эффекта.

Гайатт и Сакетт

В 1995 году Гайятт и Сакетт опубликовали первую такую иерархию.

Гринхал расположил различные типы первичного исследования в следующем порядке:

Систематические обзоры и метаанализ «РКИ с окончательными результатами».
РКИ с окончательными результатами (доверительные интервалы, которые не перекрывают пороговое значение клинически значимого эффекта)
РКИ с не окончательные результаты (точечная оценка, которая предполагает клинически значимый эффект, но с доверительными интервалами, перекрывающими порог для этого эффекта)
Когортные исследования
Исследования случай-контроль
Межсекторные исследования
Отчеты о случаях

Saunders et al.

Протокол, предложенный Saunders et al. распределяет отчеты об исследованиях по шести категориям на основе плана исследования, теоретической базы, доказательств возможного вреда и всеобщего признания. Чтобы быть отнесенным к этому протоколу, должны быть описательные публикации, включая руководство или подобное описание вмешательства. Этот протокол не учитывает природу какой-либо группы сравнения, влияние смешанных переменных, характер статистического анализа или ряд других критериев. Вмешательства оцениваются как относящиеся к Категории 1, хорошо поддерживаемые, эффективные методы лечения, если есть два или более рандомизированных контролируемых исследования результатов, в которых целевое лечение сравнивается с подходящим альтернативным лечением и демонстрируется значительное преимущество перед целевым лечением. Вмешательства относятся к Категории 2, поддерживаемое и, вероятно, эффективное лечение, на основании положительных результатов нерандомизированных схем с некоторой формой контроля, которые могут включать группу, не получающую лечения. Категория 3, поддерживаемое и приемлемое лечение, включает вмешательства, поддерживаемые одним контролируемым или неконтролируемым исследованием, или серией исследований с одним субъектом, или работой с другой популяцией, чем та, которая представляет интерес. Категория 4, перспективное и приемлемое лечение, включает вмешательства, не пользующиеся поддержкой, за исключением общепринятой и клинической анекдотической литературы; однако любые доказательства возможного вреда исключают лечение из этой категории. Категория 5, инновационное и новое лечение, включает вмешательства, которые не считаются вредными, но широко не используются и не обсуждаются в литературе. Категория 6, касающаяся лечения, представляет собой классификацию методов лечения, которые могут причинить вред, а также имеют неизвестные или несоответствующие теоретические основы.

Khan et al.

Протокол оценки качества исследования был предложен в отчете Центра обзоров и распространения, подготовленном Khan et al. и предназначен как общий метод оценки как медицинских, так и психосоциальных вмешательств. Настоятельно рекомендуя использовать рандомизированные схемы, в этом протоколе отмечалось, что такие схемы были полезны только в том случае, если они соответствовали строгим критериям, таким как истинная рандомизация и сокрытие назначенной группы лечения от клиента и других, включая людей, оценивающих результат. Хан и др. В протоколе подчеркивалась необходимость проводить сравнения на основе «намерения лечить», чтобы избежать проблем, связанных с большим оттоком в одной группе. Хан и др. Протокол также представил требовательные критерии для нерандомизированных исследований, включая сопоставление групп по потенциальным смешивающим переменным и адекватное описание групп и методов лечения на каждой стадии, а также сокрытие выбора лечения от лиц, оценивающих результаты. В этом протоколе не приводилась классификация уровней доказательности, но было включено или исключено лечение из классификации как основанное на доказательствах в зависимости от того, соответствовало ли исследование заявленным стандартам.

США Национальный реестр доказательных практик и программ

Протокол оценки был разработан Национальным реестром доказательных практик и программ США (NREPP). Оценка в соответствии с этим протоколом происходит только в том случае, если вмешательство уже имело один или несколько положительных результатов с вероятностью менее 0,05, если они были опубликованы в рецензируемом журнале или отчете об оценке, и если документация, такая как доступны учебные материалы. Оценка NREPP, которая присваивает рейтинги качества от 0 до 4 определенным критериям, изучает надежность и валидность показателей результатов, используемых в исследовании, доказательства достоверности вмешательства (предсказуемое использование лечения одинаково каждый раз), уровни недостающих данных истощение, потенциальные искажающие переменные и уместность статистической обработки, включая размер выборки.

Мерсер и Пиньотти

Протокол, предложенный Мерсером и Пиньотти, использует таксономию, предназначенную для классификации как по качеству исследования. и другие критерии. В этом протоколе вмешательства, основанные на фактических данных, поддерживаются работой с рандомизированными схемами, использующими сравнения с установленными методами лечения, независимое воспроизведение результатов, слепую оценку результатов и наличие руководства. Подтвержденные доказательствами вмешательства - это вмешательства, поддерживаемые нерандомизированными планами, в том числе внутрисубъектными, и отвечающие критериям предыдущей категории. Основанные на фактах методы лечения включают тематические исследования или вмешательства, протестированные на популяциях, отличных от целевой группы, без независимых повторений; руководство существует, и нет никаких доказательств вреда или возможности причинения вреда. Для интервенций, основанных на убеждениях, нет опубликованных отчетов об исследованиях или отчетов, основанных на сложных случаях; они могут быть основаны на религиозных или идеологических принципах или могут претендовать на основу в принятой теории без приемлемого обоснования; может быть или не быть руководства, и нет никаких доказательств вреда или возможности причинения вреда. Наконец, в категорию потенциально вредных методов лечения входят такие вмешательства, которые документируют вредные психические или физические эффекты, либо руководство или другой источник указывают на возможность причинения вреда.

История

Канада

Этот термин впервые был использован в отчете 1979 года «Канадской целевой группой по периодическому обследованию состояния здоровья» (CTF) для «оценки эффективности вмешательства в соответствии с качеством полученных доказательств». Целевая группа использовала три уровня, разделив уровень II:

Уровень I: Доказательства по крайней мере одного рандомизированного контролируемого исследования,
Уровень II1: Данные по крайней мере одного хорошо спланированного когортного исследования или исследование случай-контроль, то есть контролируемое исследование, которое не является рандомизированным
Уровень II2: Сравнение времени и места с вмешательством или без него
Уровень III: Мнения уважаемых авторитетов, основанных на клиническом опыте, описательных исследованиях или отчетах комитетов экспертов.

CTF оценил свои рекомендации по 5-балльной шкале A – E: A: Хороший уровень доказательности для рекомендации рассмотреть состояние, B: Удовлетворительный уровень доказательств для рекомендации рассмотреть условие, C: низкий уровень доказательств для рекомендации рассмотреть условие, D: достаточный уровень доказательств для рекомендации исключить состояние, и E: хороший уровень доказательств для рекомендации исключить условие из рассмотрения. CTF обновила свой отчет в 1984, 1986 и 1987 годах.

США

В 1988 году Целевая группа превентивных служб США (USPSTF) опубликовала свои руководящие принципы на основе CTF с использованием тех же 3 уровней, дальнейшее разделение уровня II.

Уровень I: Доказательства, полученные по крайней мере из одного правильно спланированного рандомизированного контролируемого исследования.
Уровень II-1: Доказательства, полученные в результате хорошо спланированного контролируемого исследования испытания без рандомизации.
Уровень II-2: Доказательства, полученные в результате хорошо спланированных аналитических исследований когорт или случай-контроль, предпочтительно из более чем одного центра или исследовательской группы.
Уровень II-3: Доказательства, полученные из нескольких дизайнов временных рядов с вмешательством или без него. Драматические результаты неконтролируемых исследований также могут рассматриваться как доказательства этого типа.
Уровень III: Мнения уважаемых авторитетов, основанные на клиническом опыте, описательных исследованиях или отчетах комитетов экспертов.

На протяжении многих лет многие было описано больше систем оценки.

Великобритания

В сентябре 2000 г. были опубликованы свои рекомендации по «Уровням» доказательств, касающиеся прогнозов, диагнозов, преимуществ лечения, вреда лечения и скрининга. Он касался не только терапии и профилактики, но и диагностических тестов, прогностических маркеров или вреда. Первоначальные уровни CEBM были впервые выпущены для Evidence-Based On Call, чтобы сделать процесс поиска доказательств возможным, а его результаты - явными. В том виде, в каком они были опубликованы в 2009 г., они:

1a: Систематические обзоры (с однородностью) рандомизированных контролируемых исследований
1b: Индивидуальные рандомизированные контролируемые исследования (с узким доверительным интервалом )
1c: Все рандомизированные контролируемые исследования или ни одного
2a: Систематические обзоры (с однородностью) когортных исследований
2b: Индивидуальное когортное исследование или рандомизированные контролируемые исследования низкого качества (например, <80% follow-up)
2c: Исследование результатов; экологические исследования
3a: Систематический обзор (с однородностью) исследований случай-контроль
3b: Индивидуальное исследование случай-контроль
4: Серия случаев (а также низкокачественные когортные исследования и исследования случай-контроль)
5: Мнение эксперта без явной критической оценки или основанное на физиологии, лабораторных исследованиях или "основные принципы "

В 2011 году международная группа специалистов переработала Oxford CEBM Levels, чтобы сделать их более понятными и учесть последние разработки в схемах ранжирования доказательств. Уровни использовались пациентами, c врачей-терапевтов, а также разработать клинические руководства, включая рекомендации по оптимальному использованию фототерапии и местной терапии при псориазе и руководящие принципы использования системы определения стадии BCLC для диагностики и мониторинга гепатоцеллюлярной карциномы в Канаде..

Глобальный

В 2007 году система оценок Всемирного фонда исследований рака описывала 4 уровня: убедительные, вероятные, возможные и недостаточные доказательства. Все Исследования глобального бремени болезней использовали его для оценки эпидемиологических данных, подтверждающих причинно-следственные связи.

Сторонники

В 1995 г. Wilson et al., В 1996 г. Hadorn et al. и в 1996 г. Аткинс и др. описали и защитили различные типы систем оценивания.

Критика

Спустя более чем десять лет после ее создания использование иерархии доказательств подвергалось все большей критике в 21 веке. В 2011 году систематический обзор критической литературы выявил 3 вида критики: процедурные аспекты EBM (особенно от Картрайта, Уорролла и Хоуика), более высокая, чем ожидалось, подверженность ошибкам EBM (Ioaanidis и другие) и EBM, являющаяся неполной как философия науки (Эшкрофт и др.). Многие критики публиковались в философских журналах, игнорируемых клиническими сторонниками доказательной медицины. Роулинз и Блум отмечают, что доказательная медицина ограничивает способность результатов исследований информировать об уходе за отдельными пациентами, и что для понимания причин заболеваний необходимы как популяционные, так и лабораторные исследования.. Иерархия доказательств EBM не принимает во внимание исследования безопасности и эффективности медицинских вмешательств. РКИ должны быть разработаны для «выяснения внутригрупповой изменчивости, что может быть выполнено только в том случае, если иерархия доказательств заменена сетью, которая учитывает взаимосвязь между эпидемиологическими и лабораторными исследованиями»

Иерархия полученных доказательств дизайн исследования подвергался сомнению, поскольку в руководящих принципах «не удалось должным образом определить ключевые термины, оценить достоинства некоторых нерандомизированных контролируемых исследований и использовать исчерпывающий список ограничений дизайна исследования».

Стегенга подверг критике в частности, метаанализ размещается на вершине такой иерархии. Предположение, что РКИ обязательно должны находиться на вершине такой иерархии, было подвергнуто критике Уорроллом. и Картрайт

В 2005 году Росс Апшур отметил, что EBM претендует на то, чтобы быть нормативным руководством к лучшему врачу, но не является философской доктриной. Он отметил, что сторонники EBM проявили «почти евангелический пыл», убежденные в его превосходстве, игнорируя критиков, которые стремятся расширить границы EBM с философской точки зрения.

Боргерсон в 2009 году написал, что оправдания для уровни иерархии не являются абсолютными и не эпистемически оправдывают их, но то, что «медицинские исследователи должны уделять больше внимания социальным механизмам для управления повсеместными предубеждениями». Ла Каз отметил, что фундаментальная наука находится на нижних уровнях EBM, хотя она «играет роль в постановке экспериментов, но также в анализе и интерпретации данных».

Конкато утверждал в 2004 году, что это давало РКИ слишком большой авторитет, и что не все вопросы исследования могли быть получены с помощью РКИ либо по практическим, либо по этическим причинам. Даже когда доказательства доступны из высококачественных РКИ, доказательства из других типов исследований все еще могут быть актуальными. Стегенга считает, что схемы оценки доказательств необоснованно ограничивают и менее информативны, чем другие доступные в настоящее время схемы.

См. Также

Научный портал

Ссылки

Дополнительная литература

Внешние ссылки

Уровни доказательности с пояснениями - запись в Центре доказательной медицины
Страница ресурсов доказательной медицины - со схемой, показывающей различные уровни доказательств, образующих пирамиду

Эта статья включает материалы, являющиеся общественным достоянием из документа Национального института рака США : " Словарь терминов по раку ".