Z- Фактор является мерой статистической величины эффекта. Он был предложен для использования в высокопроизводительном скрининге (где он также известен как Z-prime и обычно обозначается как Z ', чтобы определить, является ли ответ в конкретном анализе достаточно большой, чтобы требовать дальнейшего внимания.
На экранах с высокой пропускной способностью экспериментаторы часто сравнивают большое количество (от сотен тысяч до десятков миллионов) отдельных измерений неизвестных образцов с положительными и отрицательными контрольными образцами. Выбор экспериментальных условий и измерений называется анализом. Большие экраны дороги по времени и ресурсам. Поэтому перед запуском большого экрана используются меньшие тестовые (или пилотные) скрины для оценки качества анализа в попытке предсказать, будет ли он полезен в условиях высокой пропускной способности. Z-фактор - это попытка количественно оценить пригодность ритикулярный анализ для использования в полномасштабном высокопроизводительном скрининге.
Z-фактор определяется четырьмя параметрами: означает () и стандартные отклонения () как положительного (p), так и отрицательного (n) контролей (, и , ). Учитывая эти значения, Z-фактор определяется как:
На практике Z-фактор оценивается из выборочных средних и выборочных стандартных отклонений
Следующие интерпретации Z-фактора взяты из:
Z-фактор | Интерпретация |
---|---|
1.0 | Идеально. Z-фактор никогда не может превышать 1. |
от 0,5 до 1,0 | Отличный анализ. Обратите внимание, что если , 0,5 эквивалентно разделению 12 стандартным отклонения между и . |
между 0 и 0,5 | Маргинальный анализ. |
меньше 0 | Слишком большое перекрытие между положительным и отрицательным контролями, чтобы анализ был применим. |
Обратите внимание, что по стандартам многих типов экспериментов нулевой Z-фактор предполагает большую величину эффекта, а не пограничный бесполезный результат, как предлагалось выше. Например, если σ p=σn= 1, то μ p = 6 и μ n = 0 дает нулевой Z-фактор. Но для нормально распределенных данных с этими параметрами вероятность того, что значение положительного контроля будет меньше значения отрицательного контроля, составляет менее 1 из 10. При скрининге с высокой пропускной способностью используется крайний консерватизм из-за большого количества выполненных тестов.
Постоянный коэффициент 3 в определении Z-фактора мотивирован нормальным распределением, для которого более 99% значений находятся в пределах 3 стандартных отклонения от среднего. Если данные имеют строго ненормальное распределение, контрольные точки (например, значение отрицательного значения) могут вводить в заблуждение. Другая проблема заключается в том, что обычные оценки среднего и стандартного отклонения не являются надежными ; соответственно, многие пользователи в сообществе высокопроизводительного скрининга предпочитают "Robust Z-prime". Крайние значения (выбросы) в положительном или отрицательном контроле могут отрицательно повлиять на Z-фактор, потенциально приводя к явно неблагоприятному Z-фактору, даже если анализ будет хорошо работать при фактическом скрининге. Кроме того, применение единого критерия, основанного на Z-факторе, к двум или более положительным контролям с разной силой в одном и том же анализе приведет к ошибочным результатам. Абсолютный знак Z-фактора делает неудобным математический вывод статистического вывода Z-фактора. Недавно предложенный статистический параметр, строго стандартизованная разница средних значений (SSMD ), может решить эти проблемы. Одна оценка SSMD устойчива к выбросам.