Блокировка (статистика)

редактировать

В статистической теории плана экспериментов, блокировка - это объединение экспериментальных единиц в группы (блоки), похожие друг на друга.

Содержание

1 Использование
- 1.1 Примеры
2 Рандомизированный блок-дизайн
- 2.1 Блокирование, используемое для мешающих факторов, которые можно контролировать
- 2.2 Определение блокирующих факторов
- 2.3 Блокирование некоторых из наиболее важные мешающие факторы
- 2.4 Таблица
- 2.5 Пример
  - 2.5.1 Описание эксперимента
  - 2.5.2 Матричное представление
- 2.6 Модель
- 2.7 Оценки
- 2.8 Обобщения
3 Теоретическая основа
4 См. Также
5 Ссылки
6 Библиография

Использование

Блокирование снижает необъяснимую изменчивость. Его принцип заключается в том, что непреодолимая изменчивость (например, необходимость двух партий сырья для производства 1 контейнера с химическим веществом) смешивается или налагается (n) (высший / высший порядок) взаимодействием чтобы исключить его влияние на конечный продукт. Взаимодействия высокого порядка обычно имеют наименьшее значение (подумайте о том факте, что температура реактора или партии сырья более важна, чем их комбинация - это особенно верно, когда больше (3, 4,...) факторы присутствуют); таким образом, предпочтительно смешать эту изменчивость с более высоким взаимодействием.

Примеры

Мужчина и женщина : эксперимент разработан для тестирования нового лекарства на пациентах. В рамках двойного слепого исследования существует два уровня лечения: лекарственное средство и плацебо, которое назначают пациентам мужского и женского пола. Пол пациента является блокирующим фактором, влияющим на вариабельность лечения мужчин и женщин. Это уменьшает источники изменчивости и, таким образом, приводит к большей точности.
Высота : эксперимент разработан для проверки воздействия нового пестицида на конкретный участок травы. Зона травы имеет большое изменение высоты и, таким образом, состоит из двух отдельных областей - «высокий уровень» и «низкий уровень». Группу обработки (новый пестицид) и группу плацебо применяют как для высоких, так и для низких участков травы. В этом случае исследователь блокирует фактор роста, который может объяснять вариабельность применения пестицида.
Вмешательство : предположим, что изобретен процесс, призванный продлить срок службы подошвы обуви, и составлен план для провести полевые испытания. Для группы из n добровольцев одним из возможных способов было бы дать n / 2 из них обуви с новой подошвой и n / 2 из них обуви с обычной подошвой, случайным образом назначив два вида обуви. подошвы. Этот тип эксперимента представляет собой полностью рандомизированный план. Затем обе группы просят надеть обувь в течение определенного периода времени, а затем измеряют степень износа подошвы. Это работоспособный экспериментальный план, но чисто с точки зрения статистической точности (игнорируя любые другие факторы), лучшим вариантом было бы дать каждому человеку одну обычную подошву и одну новую подошву, случайным образом назначив два типа слева и правый ботинок каждого добровольца. Такой дизайн называется «рандомизированный полный блочный дизайн ». Этот дизайн будет более чувствительным, чем первый, потому что каждый человек действует как свой собственный контроль, и, таким образом, контрольная группа более точно соответствует группе лечения.

Рандомизированный блочный дизайн

В статистической теории плана экспериментов блокировка - это объединение экспериментальных единиц в группы (блоки), похожие на одну еще один. Обычно фактор блокировки является источником изменчивости, которая не представляет особого интереса для экспериментатора. Примером блокирующего фактора может быть пол пациента; блокируя пол, этот источник изменчивости контролируется, что приводит к большей точности.

В теории вероятностей метод блоков заключается в разделении выборки на блоки (группы), разделенные меньшими субблоками, так что блоки можно считать почти независимыми. Метод блоков помогает доказывать предельные теоремы в случае зависимых случайных величин.

Метод блоков был введен С. Бернштейн :

Бернштейн С.Н. (1926) Sur l'extension du théorème limit du исчисление вероятностей aux sommes de Quantités dependantes. Математика. Аннален, т. 97, 1-59.

Метод успешно применен в теории сумм зависимых случайных величин и в теории экстремальных значений:

Ибрагимов И.А. и Линник Ю.В. (1971) Независимые и стационарные последовательности случайных величин. Вольтерс-Нордхофф, Гронинген.

Лидбеттер М.Р., Линдгрен Г. и Рутцен Х. (1983) Крайности и связанные свойства случайных последовательностей и процессов. Нью-Йорк: Springer Verlag.

Новак С.Ю. (2011) Экстремальные методы ценности с приложениями к финансам. Chapman Hall / CRC Press, Лондон.

Блокирование, используемое для мешающих факторов, которые можно контролировать

Когда мы можем контролировать мешающие факторы, можно использовать важный метод, известный как блокирование, для уменьшения или устранения вклада в экспериментальную ошибку, вносимого мешающими факторами. Основная концепция заключается в создании однородных блоков, в которых факторы помех остаются постоянными, а интересующий фактор может изменяться. Внутри блоков можно оценить влияние различных уровней интересующего фактора, не беспокоясь о вариациях из-за изменений факторов блока, которые учитываются в анализе.

Определение факторов блокировки

Фактор помех используется в качестве фактора блокировки, если каждый уровень основного фактора встречается одинаковое количество раз с каждым уровнем фактора помехи. Анализ эксперимента будет сосредоточен на влиянии различных уровней первичного фактора в каждом блоке эксперимента.

Заблокируйте несколько наиболее важных факторов, мешающих вам;

Общее правило:

«Блокируйте то, что можете; рандомизируйте то, что вы не можете ».

Блокирование используется для устранения воздействия нескольких наиболее важных мешающих переменных. Затем используется рандомизация для уменьшения негативного воздействия оставшихся мешающих переменных. Для важных мешающих переменных блокирование даст более высокую значимость интересующих переменных, чем рандомизация.

Таблица

Один из полезных способов взглянуть на рандомизированный блочный эксперимент - это рассматривать его как набор полностью рандомизированных экспериментов, каждый из которых запускается в одном из блоков тотальный эксперимент.

Рандомизированные блочные схемы (RBD)
Название дизайна	Количество факторов k	Количество прогонов n
2-факторная RBD	2	L1* L 2
3-факторный RBD	3	L1* L 2 * L 3
4-факторный RBD	4	L1* L 2 * L 3 * L 4
$⋮ {\ displaystyle \ vdots}$ $\ vdots$	$⋮ {\ displaystyle \ vdots}$ $\ vdots$	$⋮ {\ displaystyle \ vdots}$ $\ vdots$
k-фактор RBD	k	L1* L 2* $⋯ {\ displaystyle \ cdots}$ $\ cdots$ * L k

L1= количество уровней (настроек) фактора 1

L2= количество уровней (настроек) фактора 2

L3= количество уровней (настроек) фактора 3

L4= количество уровней (настроек) коэффициента 4

⋮ {\ displaystyle \ vdots}

\ vdots

Lk= количество уровней (настроек) коэффициента k

Пример

Предположим, инженеры на предприятие по производству полупроводников хочет проверить, оказывают ли различные дозировки материала имплантата пластины существенное влияние на измерения удельного сопротивления после процесса диффузии, происходящего в печи. У них есть четыре разных дозировки, которые они хотят попробовать, и достаточно экспериментальных пластин из одной партии, чтобы запустить три пластины при каждой дозировке.

Фактором неудобства, с которым они сталкиваются, является «ход печи», поскольку известно, что каждый прогон печи отличается от предыдущего и влияет на многие параметры процесса.

Идеальный способ провести этот эксперимент - запустить все пластины 4x3 = 12 в одной печи. Это полностью устранило бы мешающий фактор печи. Тем не менее, обычные производственные пластины имеют приоритет в печи, и только несколько экспериментальных пластин допускаются в любую печь одновременно.

Неблокируемым способом проведения этого эксперимента было бы запуск каждой из двенадцати экспериментальных пластин в случайном порядке, по одной на прогон печи. Это увеличило бы экспериментальную ошибку каждого измерения удельного сопротивления из-за вариабельности работы печи и затруднило бы изучение эффектов различных дозировок. Заблокированный способ проведения этого эксперимента, предполагающий, что вы можете убедить производство позволить вам поместить четыре экспериментальных пластины в печь, будет помещать четыре пластины с разными дозировками в каждую из трех прогонов печи. Единственная случайность будет заключаться в выборе того, какая из трех пластин с дозировкой 1 пойдет в печь 1, и аналогично для пластин с дозировками 2, 3 и 4.

Описание эксперимента

Пусть X 1 будет «уровнем» дозировки, а X 2 будет коэффициентом блокировки при работе печи. Тогда эксперимент можно описать следующим образом:

k = 2 фактора (1 первичный фактор X 1 и 1 блокирующий фактор X 2)

L1= 4 уровня фактора X 1

L2= 3 уровня фактора X 2

n = 1 репликация на ячейку

N = L 1 * L 2 = 4 * 3 = 12 прогонов

Перед рандомизацией дизайн испытания выглядят следующим образом:

X1	X2
1	1
1	2
1	3
2	1
2	2
2	3
3	1
3	2
3	3
4	1
4	2
4	3

Представление матрицы

Альтернативным способом обобщения испытаний дизайна было бы использование матрицы 4x3, 4 строки которой являются уровнями обработки X 1 и столбцы являются 3 уровнями блокирующей переменной X 2. Ячейки в матрице имеют индексы, которые соответствуют комбинациям X 1, X 2, указанным выше.

Обработка	Блок 1	Блок 2	Блок 3
1	1	1	1
2	1	1	1
3	1	1	1
4	1	1	1

В более широком смысле, обратите внимание, что испытания для любой схемы рандомизированного блока с K-фактором представляют собой просто индексы ячеек k-мерной матрицы.

Модель

Модель для рандомизированного блочного дизайна с одной мешающей переменной:

Y ij = μ + T i + B j + randomerror {\ displaysty le Y_ {ij} = \ mu + T_ {i} + B_ {j} + \ mathrm {random \ error}}

Y_ {ij } = \ mu + T_ {i} + B_ {j} + \ mathrm {random \ error}

, где

Yij- любое наблюдение, для которого X 1 = i и X 2 = j

X1- первичный фактор

X2- коэффициент блокировки

μ - общий параметр местоположения (т.е. среднее значение)

Ti- эффект для при лечении i (фактора X 1)

Bj- это эффект нахождения в блоке j (фактора X 2)

Оценки

Оценка для μ:

Y ¯ {\ displaystyle {\ overline {Y}}}

{\ overline {Y}}

= среднее значение всех данных

Оценка для T i:

Y ¯ i ⋅ - Y ¯ {\ displaystyle {\ overline {Y}} _ {i \ cdot} - {\ overline {Y}}}

{\ overl ine {Y}} _ {i \ cdot} - {\ overline {Y}}

Y ¯ i ⋅ {\ displaystyle {\ overline {Y}} _ {i \ cdot}}

{\ overline {Y}} _ {i \ cdot}

= среднее значение всех Y, для которых X 1 = i.

Оценка для B j:

Y ¯ ⋅ j - Y ¯ {\ displaystyle {\ overline {Y}} _ {\ cdot j} - {\ overline {Y}}}

{\ overline {Y}} _ {\ cdot j} - {\ overline {Y}}

Y ¯ ⋅ j {\ displaystyle {\ overline {Y}} _ {\ cdot j}}

{\ overline {Y}} _ {\ cdot j}

= среднее значение всех Y, для которых X 2 = j.

Обобщения

Обобщенные рандомизированные блочные конструкции (GRBD) позволяют проводить тесты блокирующего взаимодействия и имеет ровно один блокирующий фактор, такой как RCBD.
Латинские квадраты (и другие конструкции строка-столбец) имеют два блокирующих фактора, которые, как считается, не взаимодействуют.
Выборка из латинского гиперкуба
Греко-латинские квадраты
Гипер-греко-латинские квадраты

Теоретические основы

Теоретической основой блокировки является следующий математический результат. Для заданных случайных величин X и Y

Var ⁡ (X - Y) = Var ⁡ (X) + Var ⁡ (Y) - 2 Cov ⁡ (X, Y). {\ displaystyle \ operatorname {Var} (XY) = \ operatorname {Var} (X) + \ operatorname {Var} (Y) -2 \ operatorname {Cov} (X, Y).}

\ operatorname {Var} (XY) = \ operatorname {Var} (X) + \ operatorname {Var} (Y) -2 \ operatorname {Cov} (X, Y).

Разница между Таким образом, обработка и контроль могут получить минимальную дисперсию (т.е. максимальную точность) за счет максимизации ковариации (или корреляции) между X и Y.

См. также

Портал математики

Ссылки

Эта статья включает материалы, являющиеся общественным достоянием, с веб-сайта Национального института стандартов и технологий https://www.nist.gov.

Библиография

(1969). «Обобщенный рандомизированный блочный дизайн». Американский статистик. 23 (4): 35–36. DOI : 10.2307 / 2681737. JSTOR 2681737.
Аддельман, С. (1970). «Вариативность методов и экспериментальных единиц в дизайне и анализе экспериментов». Журнал Американской статистической ассоциации. 65 (331): 1095–1108. DOI : 10.2307 / 2284277. JSTOR 2284277.
Энскомб, Ф.Дж. (1948). «Достоверность сравнительных экспериментов». Журнал Королевского статистического общества. Генерал). 111 (3): 181–211. DOI : 10.2307 / 2984159. JSTOR 2984159. MR 0030181.
(2008). План сравнительных экспериментов. Издательство Кембриджского университета. ISBN 978-0-521-68357-9. Архивировано из оригинала от 22 марта 2018 года. Главы перед публикацией доступны в Интернете.
Бапат, Р. Б. (2000). Линейная алгебра и линейные модели (Второе изд.). Springer. ISBN 978-0-387-98871-9.
Калински Т. и Кагеяма С. (2000). Блочные конструкции: подход рандомизации, Том I : Анализ. Конспект лекций по статистике. 150 . Нью-Йорк: Springer-Verlag. ISBN 0-387-98578-6.
Калински Т. и Кагеяма С. (2003). Блочные конструкции: подход рандомизации, Том II : Дизайн. Конспект лекций по статистике. 170 . Нью-Йорк: Springer-Verlag. ISBN 0-387-95470-8. MR 1994124.
Гейтс, С.Е. (ноябрь 1995 г.). «Что такое экспериментальная ошибка в конструкциях блоков?». Американский статистик. 49 (4): 362–363. DOI : 10.2307 / 2684574. JSTOR 2684574.
Кемпторн, Оскар (1979). Планирование и анализ экспериментов (исправленная перепечатка (1952) изд. Wiley). Роберт Э. Кригер. ISBN 0-88275-105-0.
Хинкельманн, Клаус и Кемпторн, Оскар (2008). Планирование и анализ экспериментов. I и II (Второе изд.). Вайли. ISBN 978-0-470-38551-7. CS1 maint: несколько имен: список авторов (ссылка )
- Хинкельманн, Клаус и Кемпторн, Оскар (2008). Планирование и анализ экспериментов, Том I: Введение в экспериментальный план (второе издание). Wiley. ISBN 978-0-471-72756-9. CS1 maint: несколько имен: список авторов (ссылка )
- Хинкельманн, Клаус и Кемпторн, Оскар (2005). Планирование и анализ экспериментов, Том 2: Расширенные эксперименты Дизайн (Первое изд.). Wiley. ISBN 978-0-471-55177-5. CS1 maint: несколько имен: список авторов (ссылка )
Lentner, Marvin; Thomas Bishop (1993). «The Generalized RCB Design (Chapter 6.13)». Experimental design and analysis (Second ed.). PO Box 884, Blacksburg, VA 24063: Valley Book Company, стр. 225–226. ISBN 0-9616255-2-X. CS1 maint: location (ссылка )
Рагхаварао, Дамараджу (1988). Конструкции и комбинаторные задачи планирования экспериментов (кор. исправленное переиздание изд. Wiley 1971 г.). Нью-Йорк: Дувр. ISBN 0-486-65685-3.
Рагхаварао, Дамараджу и Паджетт, Л.В. (2005). Блочные конструкции: анализ, комбинаторика и приложения. World Scientific. ISBN 981-256-360-1. CS1 maint: несколько имен: список авторов (ссылка )
Шах, Кирти Р. и Синха, Бикас К.. (1989). Theory of Optimal Designs. Lecture Notes in Statistics. 54. Springer-Verlag. Pp. 171 + viii. ISBN 0-387. -96991-8.
Street, Anne Penfold ; Street, Deborah J. (1987). Combinatorics of Experimental Design. Oxford UP [Clarendon]. ISBN 0-19-853256-3.
Wilk, MB (1955). "Рандомизационный анализ обобщенного рандомизированного блочного дизайна". Biometrika. 42 (1-2) : 70–79. doi : 10.2307 / 2333423. JSTOR 2333423.
Зискинд, Джордж (1963). "Некоторые последствия рандомизации в обобщении сбалансированного неполного блочного дизайна ". Анналы математической статистики. 34 (4): 1569–1581. doi : 10.1214 / aoms / 1177703889. JSTOR 2238364.