Блокировка (статистика)

редактировать

В статистической теории плана экспериментов, блокировка - это объединение экспериментальных единиц в группы (блоки), похожие друг на друга.

Содержание

  • 1 Использование
    • 1.1 Примеры
  • 2 Рандомизированный блок-дизайн
    • 2.1 Блокирование, используемое для мешающих факторов, которые можно контролировать
    • 2.2 Определение блокирующих факторов
    • 2.3 Блокирование некоторых из наиболее важные мешающие факторы
    • 2.4 Таблица
    • 2.5 Пример
      • 2.5.1 Описание эксперимента
      • 2.5.2 Матричное представление
    • 2.6 Модель
    • 2.7 Оценки
    • 2.8 Обобщения
  • 3 Теоретическая основа
  • 4 См. Также
  • 5 Ссылки
  • 6 Библиография

Использование

Блокирование снижает необъяснимую изменчивость. Его принцип заключается в том, что непреодолимая изменчивость (например, необходимость двух партий сырья для производства 1 контейнера с химическим веществом) смешивается или налагается (n) (высший / высший порядок) взаимодействием чтобы исключить его влияние на конечный продукт. Взаимодействия высокого порядка обычно имеют наименьшее значение (подумайте о том факте, что температура реактора или партии сырья более важна, чем их комбинация - это особенно верно, когда больше (3, 4,...) факторы присутствуют); таким образом, предпочтительно смешать эту изменчивость с более высоким взаимодействием.

Примеры

  • Мужчина и женщина : эксперимент разработан для тестирования нового лекарства на пациентах. В рамках двойного слепого исследования существует два уровня лечения: лекарственное средство и плацебо, которое назначают пациентам мужского и женского пола. Пол пациента является блокирующим фактором, влияющим на вариабельность лечения мужчин и женщин. Это уменьшает источники изменчивости и, таким образом, приводит к большей точности.
  • Высота : эксперимент разработан для проверки воздействия нового пестицида на конкретный участок травы. Зона травы имеет большое изменение высоты и, таким образом, состоит из двух отдельных областей - «высокий уровень» и «низкий уровень». Группу обработки (новый пестицид) и группу плацебо применяют как для высоких, так и для низких участков травы. В этом случае исследователь блокирует фактор роста, который может объяснять вариабельность применения пестицида.
  • Вмешательство : предположим, что изобретен процесс, призванный продлить срок службы подошвы обуви, и составлен план для провести полевые испытания. Для группы из n добровольцев одним из возможных способов было бы дать n / 2 из них обуви с новой подошвой и n / 2 из них обуви с обычной подошвой, случайным образом назначив два вида обуви. подошвы. Этот тип эксперимента представляет собой полностью рандомизированный план. Затем обе группы просят надеть обувь в течение определенного периода времени, а затем измеряют степень износа подошвы. Это работоспособный экспериментальный план, но чисто с точки зрения статистической точности (игнорируя любые другие факторы), лучшим вариантом было бы дать каждому человеку одну обычную подошву и одну новую подошву, случайным образом назначив два типа слева и правый ботинок каждого добровольца. Такой дизайн называется «рандомизированный полный блочный дизайн ». Этот дизайн будет более чувствительным, чем первый, потому что каждый человек действует как свой собственный контроль, и, таким образом, контрольная группа более точно соответствует группе лечения.

Рандомизированный блочный дизайн

В статистической теории плана экспериментов блокировка - это объединение экспериментальных единиц в группы (блоки), похожие на одну еще один. Обычно фактор блокировки является источником изменчивости, которая не представляет особого интереса для экспериментатора. Примером блокирующего фактора может быть пол пациента; блокируя пол, этот источник изменчивости контролируется, что приводит к большей точности.

В теории вероятностей метод блоков заключается в разделении выборки на блоки (группы), разделенные меньшими субблоками, так что блоки можно считать почти независимыми. Метод блоков помогает доказывать предельные теоремы в случае зависимых случайных величин.

Метод блоков был введен С. Бернштейн :

Бернштейн С.Н. (1926) Sur l'extension du théorème limit du исчисление вероятностей aux sommes de Quantités dependantes. Математика. Аннален, т. 97, 1-59.

Метод успешно применен в теории сумм зависимых случайных величин и в теории экстремальных значений:

Ибрагимов И.А. и Линник Ю.В. (1971) Независимые и стационарные последовательности случайных величин. Вольтерс-Нордхофф, Гронинген.

Лидбеттер М.Р., Линдгрен Г. и Рутцен Х. (1983) Крайности и связанные свойства случайных последовательностей и процессов. Нью-Йорк: Springer Verlag.

Новак С.Ю. (2011) Экстремальные методы ценности с приложениями к финансам. Chapman Hall / CRC Press, Лондон.

Блокирование, используемое для мешающих факторов, которые можно контролировать

Когда мы можем контролировать мешающие факторы, можно использовать важный метод, известный как блокирование, для уменьшения или устранения вклада в экспериментальную ошибку, вносимого мешающими факторами. Основная концепция заключается в создании однородных блоков, в которых факторы помех остаются постоянными, а интересующий фактор может изменяться. Внутри блоков можно оценить влияние различных уровней интересующего фактора, не беспокоясь о вариациях из-за изменений факторов блока, которые учитываются в анализе.

Определение факторов блокировки

Фактор помех используется в качестве фактора блокировки, если каждый уровень основного фактора встречается одинаковое количество раз с каждым уровнем фактора помехи. Анализ эксперимента будет сосредоточен на влиянии различных уровней первичного фактора в каждом блоке эксперимента.

Заблокируйте несколько наиболее важных факторов, мешающих вам;

Общее правило:

«Блокируйте то, что можете; рандомизируйте то, что вы не можете ».

Блокирование используется для устранения воздействия нескольких наиболее важных мешающих переменных. Затем используется рандомизация для уменьшения негативного воздействия оставшихся мешающих переменных. Для важных мешающих переменных блокирование даст более высокую значимость интересующих переменных, чем рандомизация.

Таблица

Один из полезных способов взглянуть на рандомизированный блочный эксперимент - это рассматривать его как набор полностью рандомизированных экспериментов, каждый из которых запускается в одном из блоков тотальный эксперимент.

Рандомизированные блочные схемы (RBD)
Название дизайнаКоличество факторов kКоличество прогонов n
2-факторная RBD2L1* L 2
3-факторный RBD3L1* L 2 * L 3
4-факторный RBD4L1* L 2 * L 3 * L 4
⋮ {\ displaystyle \ vdots}\ vdots ⋮ {\ displaystyle \ vdots}\ vdots ⋮ {\ displaystyle \ vdots}\ vdots
k-фактор RBDkL1* L 2* ⋯ {\ displaystyle \ cdots}\ cdots * L k

с

L1= количество уровней (настроек) фактора 1
L2= количество уровней (настроек) фактора 2
L3= количество уровней (настроек) фактора 3
L4= количество уровней (настроек) коэффициента 4
⋮ {\ displaystyle \ vdots}\ vdots
Lk= количество уровней (настроек) коэффициента k

Пример

Предположим, инженеры на предприятие по производству полупроводников хочет проверить, оказывают ли различные дозировки материала имплантата пластины существенное влияние на измерения удельного сопротивления после процесса диффузии, происходящего в печи. У них есть четыре разных дозировки, которые они хотят попробовать, и достаточно экспериментальных пластин из одной партии, чтобы запустить три пластины при каждой дозировке.

Фактором неудобства, с которым они сталкиваются, является «ход печи», поскольку известно, что каждый прогон печи отличается от предыдущего и влияет на многие параметры процесса.

Идеальный способ провести этот эксперимент - запустить все пластины 4x3 = 12 в одной печи. Это полностью устранило бы мешающий фактор печи. Тем не менее, обычные производственные пластины имеют приоритет в печи, и только несколько экспериментальных пластин допускаются в любую печь одновременно.

Неблокируемым способом проведения этого эксперимента было бы запуск каждой из двенадцати экспериментальных пластин в случайном порядке, по одной на прогон печи. Это увеличило бы экспериментальную ошибку каждого измерения удельного сопротивления из-за вариабельности работы печи и затруднило бы изучение эффектов различных дозировок. Заблокированный способ проведения этого эксперимента, предполагающий, что вы можете убедить производство позволить вам поместить четыре экспериментальных пластины в печь, будет помещать четыре пластины с разными дозировками в каждую из трех прогонов печи. Единственная случайность будет заключаться в выборе того, какая из трех пластин с дозировкой 1 пойдет в печь 1, и аналогично для пластин с дозировками 2, 3 и 4.

Описание эксперимента

Пусть X 1 будет «уровнем» дозировки, а X 2 будет коэффициентом блокировки при работе печи. Тогда эксперимент можно описать следующим образом:

k = 2 фактора (1 первичный фактор X 1 и 1 блокирующий фактор X 2)
L1= 4 уровня фактора X 1
L2= 3 уровня фактора X 2
n = 1 репликация на ячейку
N = L 1 * L 2 = 4 * 3 = 12 прогонов

Перед рандомизацией дизайн испытания выглядят следующим образом:

X1X2
11
12
13
21
22
23
31
32
33
41
42
43

Представление матрицы

Альтернативным способом обобщения испытаний дизайна было бы использование матрицы 4x3, 4 строки которой являются уровнями обработки X 1 и столбцы являются 3 уровнями блокирующей переменной X 2. Ячейки в матрице имеют индексы, которые соответствуют комбинациям X 1, X 2, указанным выше.

ОбработкаБлок 1Блок 2Блок 3
1111
2111
3111
4111

В более широком смысле, обратите внимание, что испытания для любой схемы рандомизированного блока с K-фактором представляют собой просто индексы ячеек k-мерной матрицы.

Модель

Модель для рандомизированного блочного дизайна с одной мешающей переменной:

Y ij = μ + T i + B j + randomerror {\ displaysty le Y_ {ij} = \ mu + T_ {i} + B_ {j} + \ mathrm {random \ error}}Y_ {ij } = \ mu + T_ {i} + B_ {j} + \ mathrm {random \ error}

, где

Yij- любое наблюдение, для которого X 1 = i и X 2 = j
X1- первичный фактор
X2- коэффициент блокировки
μ - общий параметр местоположения (т.е. среднее значение)
Ti- эффект для при лечении i (фактора X 1)
Bj- это эффект нахождения в блоке j (фактора X 2)

Оценки

Оценка для μ: Y ¯ {\ displaystyle {\ overline {Y}}}{\ overline {Y}} = среднее значение всех данных
Оценка для T i: Y ¯ i ⋅ - Y ¯ {\ displaystyle {\ overline {Y}} _ {i \ cdot} - {\ overline {Y}}}{\ overl ine {Y}} _ {i \ cdot} - {\ overline {Y}} с Y ¯ i ⋅ {\ displaystyle {\ overline {Y}} _ {i \ cdot}}{\ overline {Y}} _ {i \ cdot} = среднее значение всех Y, для которых X 1 = i.
Оценка для B j: Y ¯ ⋅ j - Y ¯ {\ displaystyle {\ overline {Y}} _ {\ cdot j} - {\ overline {Y}}}{\ overline {Y}} _ {\ cdot j} - {\ overline {Y}} с Y ¯ ⋅ j {\ displaystyle {\ overline {Y}} _ {\ cdot j}}{\ overline {Y}} _ {\ cdot j} = среднее значение всех Y, для которых X 2 = j.

Обобщения

Теоретические основы

Теоретической основой блокировки является следующий математический результат. Для заданных случайных величин X и Y

Var ⁡ (X - Y) = Var ⁡ (X) + Var ⁡ (Y) - 2 Cov ⁡ (X, Y). {\ displaystyle \ operatorname {Var} (XY) = \ operatorname {Var} (X) + \ operatorname {Var} (Y) -2 \ operatorname {Cov} (X, Y).}\ operatorname {Var} (XY) = \ operatorname {Var} (X) + \ operatorname {Var} (Y) -2 \ operatorname {Cov} (X, Y).

Разница между Таким образом, обработка и контроль могут получить минимальную дисперсию (т.е. максимальную точность) за счет максимизации ковариации (или корреляции) между X и Y.

См. также

  • значок Портал математики

Ссылки

Библиография

.

Последняя правка сделана 2021-05-12 10:44:34
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте