Вероятность успеха (POS) - это понятие статистики, обычно используемое в фармацевтическая промышленность, включая органы здравоохранения для поддержки принятия решений.
Вероятность успеха - это понятие, тесно связанное с условной мощностью и предсказательной силой. Условная мощность - это вероятность наблюдения статистической значимости с учетом наблюдаемых данных при условии, что параметр лечебного эффекта равен определенному значению. За это предположение часто критикуют условную власть. Если нам известна точная величина лечебного эффекта, нет необходимости проводить эксперимент. Чтобы решить эту проблему, мы можем рассмотреть условную мощность в настройке байесовского, рассматривая параметр эффекта лечения как случайную величину. Принятие ожидаемого значения условной мощности по отношению к апостериорному распределению параметра дает предсказательную силу. Прогнозирующая мощность также может быть рассчитана в настройке частотного специалиста. Независимо от того, как она рассчитывается, предсказательная сила - это случайная величина, поскольку это условная вероятность, обусловленная случайно наблюдаемыми данными. Как условная мощность, так и прогнозная мощность используют статистическую значимость в качестве критерия успеха. Однако статистической значимости часто недостаточно для определения успеха. Например, орган здравоохранения часто требует, чтобы величина лечебного эффекта была больше, чем эффект, который является просто статистически значимым, для поддержки успешной регистрации. Чтобы решить эту проблему, мы можем расширить условную мощность и способность прогнозирования до концепции вероятности успеха. Для вероятности успеха критерий успеха не ограничивается статистической значимостью. Это может быть что-то еще, например, клинически значимый результат.
Традиционный дизайн пилотных исследований обычно осуществляется путем управления ошибкой I типа скорость и мощность для обнаружения определенного значения параметра. Целью пилотного испытания, такого как испытание фазы II, обычно не является поддержка регистрации. Поэтому нет смысла контролировать частоту ошибок типа I, особенно большую ошибку типа I, как это обычно делается в испытаниях фазы II. Пилотное испытание обычно предоставляет доказательства в поддержку решения «Не годен / не годен» для подтверждающего исследования. Поэтому имеет смысл разработать испытание на основе PPOS. Традиционные методы требуют, чтобы PPOS был небольшим. Однако PPOS может быть небольшим просто случайно. Чтобы решить эту проблему, мы можем потребовать, чтобы надежный интервал PPOS был узким, чтобы расчет PPOS поддерживался достаточной информацией, и, следовательно, PPOS не является маленьким просто из-за случая. Поиск оптимального дизайна эквивалентен поиску решения следующих 2 уравнений.
где PPOS1 и PPOS2 - некоторые определяемые пользователем значения отсечки. Первое уравнение гарантирует, что PPOS будет небольшим, так что не слишком много испытаний будет предотвращено переходом на следующий этап для защиты от ложных отрицательных результатов. Первое уравнение также гарантирует, что PPOS не будет слишком маленьким, так что не слишком много испытаний перейдет на следующий этап, чтобы предотвратить ложных срабатываний. Второе уравнение гарантирует, что интервал достоверности PPOS является узким, так что расчет PPOS поддерживается достаточной информацией. Второе уравнение также гарантирует, что интервал достоверности PPOS не будет слишком узким и не потребует слишком много ресурсов.
Традиционный промежуточный период бесполезности разработан на основе затрат на бета-тестирование. Однако расходы на бета-тестирование не имеют интуитивной интерпретации. Поэтому трудно общаться с коллегами, не являющимися статистиками. Поскольку PPOS имеет интуитивно понятную интерпретацию, имеет смысл спроектировать временный интервал бесполезности с помощью PPOS. Чтобы объявить бесполезным, мы требуем, чтобы PPOS был небольшим, а расчет PPOS подтверждался достаточной информацией. По словам Танга, к 2015 году поиск оптимального дизайна эквивалентен решению следующих 2 уравнений.
Традиционный промежуточный период эффективности разработан на основе функций расходов. Поскольку функции расходов не имеют интуитивной интерпретации, их трудно общаться с коллегами, не являющимися статистиками. Напротив, вероятность успеха имеет интуитивную интерпретацию и, следовательно, может облегчить общение с коллегами-нестатистами. Тан (2016) предлагает использовать следующие критерии для поддержки принятия промежуточных решений по эффективности: mCPOS>c1 lCPOS>c2, где mCPOS - это медиана CPOS по отношению к распределению параметра, а lCPOS - нижняя граница вероятного интервала между CPOS. Первый критерий гарантирует, что вероятность успеха велика. Второй критерий гарантирует, что надежный интервал CPOS невелик; расчет CPOS подтверждается достаточным количеством информации; следовательно, вероятность успеха невелика. Поиск оптимального дизайна эквивалентен поиску решения следующих уравнений: