Планирование экспериментов

редактировать

Составление задач для поиска ответов

Планирование экспериментов с полным факторным планом (слева), поверхность отклика с полиномом второй степени (справа)

план экспериментов (DOE, DOX или экспериментальный план ) - это план любой задачи, целью которого является описание и объяснение вариации информации в условиях, которые, как предполагается, отражают вариацию. Этот термин обычно ассоциируется с экспериментами, в которых план вводит условия, которые непосредственно влияют на вариацию, но также может относиться к плану квазиэкспериментов, в которых естественный для наблюдения выбраны условия, влияющие на изменение.

В своей простейшей форме эксперимент направлен на прогнозирование результата путем введения изменения предварительных условий, которое представлено одной или несколькими независимыми переменными, также называемыми «входными переменными». или «переменные-предикторы». Обычно предполагается, что изменение одной или нескольких независимых переменных приводит к изменению одной или нескольких зависимых переменных, также называемых «выходными переменными» или «переменными ответа». План эксперимента может также определять контрольные переменные, которые должны оставаться постоянными, чтобы внешние факторы не влияли на результаты. Планирование эксперимента включает не только выбор подходящих независимых, зависимых и управляющих переменных, но и планирование проведения эксперимента в статистически оптимальных условиях с учетом ограничений доступных ресурсов. Существует несколько подходов к определению набора проектных точек (уникальных комбинаций настроек независимых переменных), которые будут использоваться в эксперименте.

Основные проблемы при разработке эксперимента включают установление достоверности, надежности и воспроизводимости. Например, эти проблемы можно частично решить, тщательно выбрав независимую переменную, снизив риск ошибки измерения и обеспечив достаточно подробное описание метода. Связанные с этим проблемы включают достижение соответствующих уровней статистической мощности и чувствительности.

Правильно спланированные эксперименты расширяют знания в естественных, социальных и технических науках. Другие приложения включают маркетинг и разработку политики. Изучение плана экспериментов является важной темой в метанауке.

Содержание

1 История
- 1.1 Статистические эксперименты по Чарльзу С. Пирсу
  - 1.1.1 Рандомизированные эксперименты
  - 1.1. 2 Оптимальные планы для регрессионных моделей
- 1.2 Последовательности экспериментов
2 Принципы Фишера
3 Пример
4 Как избежать ложных срабатываний
5 Темы для обсуждения при настройке экспериментального плана
6 Причинная атрибуция
7 Статистический контроль
8 Планы экспериментов по Фишеру
9 Ограничения участников
10 См. Также
11 Ссылки
- 11.1 Источники
12 Внешние ссылки

История

Статистические эксперименты по Чарльзу С. Пирсу

Теория статистического вывода была разработана Чарльзом С. Пирсом в «Иллюстрациях логики науки » ( 1877–1878) и «Теория вероятного вывода » (1883), две публикации, в которых подчеркивалась важность рандомизационного вывода в статистике.

Рандомизированные эксперименты

Чарльз С. Пирс случайным образом распределил добровольцев по слепому, плану повторных измерений для оценки их способности различать веса. Эксперимент Пирса вдохновил других исследователей в области психологии и образования, которые разработали исследовательскую традицию рандомизированных экспериментов в лабораториях и специализированных учебниках в 1800-х годах.

Оптимальный дизайн для регрессионных моделей

Чарльз С. Пирс также внес свой вклад первая англоязычная публикация по оптимальному дизайну для регрессионных моделей в 1876 году. Новаторский оптимальный дизайн для полиномиальной регрессии был предложен Жергонном в 1815 году. В 1918 году Кирстин Смит опубликовала оптимальные планы для многочленов шестой степени (и меньше).

Последовательности экспериментов

Использование последовательности экспериментов, дизайн каждого из которых может зависеть от результатов предыдущих экспериментов, включая возможное решение прекратить эксперименты, находится в рамках последовательного анализа, поле, которое было впервые открыто Абрахамом Уолдом в контексте последовательной проверки статистических гипотез. Она Человек Чернов написал обзор оптимальных последовательных планов, а адаптивные планы были исследованы С. Заксом. Одним из специфических типов последовательного дизайна является «двурукий бандит», обобщенный на многорукий бандит, ранняя работа над которым была выполнена Гербертом Роббинсом в 1952 году.

Принципы Фишера

Методология планирования экспериментов была предложена Рональдом Фишером в его новаторских книгах: Организация полевых экспериментов (1926) и План экспериментов (1935 г.). Большая часть его новаторских работ была связана с применением статистических методов в сельском хозяйстве. В качестве обыденного примера он описал, как проверить дама, дегустирующая чай гипотезу, о том, что некая женщина может различать только по вкусу, было ли молоко или чай сначала помещено в чашку. Эти методы широко применялись в биологических, психологических и сельскохозяйственных исследованиях.

Сравнение: В некоторых областях исследований невозможно провести независимые измерения в соответствии с прослеживаемым метрологическим стандартом. Сравнения между видами лечения гораздо более ценны и, как правило, предпочтительнее и часто сравниваются с научным контролем или традиционным лечением, которое выступает в качестве исходного уровня.

Рандомизация: Случайное распределение - это процесс случайного назначения лиц группам или разным группам в эксперименте, чтобы каждый человек из популяции имел одинаковые шансы стать участником исследования. Случайное распределение людей по группам (или условиям внутри группы) отличает строгий, «истинный» эксперимент от наблюдательного исследования или «квазиэксперимента». Существует обширная математическая теория, в которой исследуются последствия распределения единиц для лечения с помощью некоторого случайного механизма (такого как таблицы случайных чисел или использование устройств рандомизации, таких как игральные карты или игральные кости). Присвоение единиц лечения случайным образом имеет тенденцию смягчать искажение, в результате которого эффекты, обусловленные другими факторами, помимо лечения, кажутся результатом лечения.

Риски, связанные с случайным распределением (например, наличие серьезного дисбаланс ключевой характеристики между экспериментальной и контрольной группой) можно вычислить и, следовательно, можно снизить до приемлемого уровня, используя достаточное количество экспериментальных единиц. Однако, если популяция разделена на несколько субпопуляций, которые так или иначе различаются, и исследование требует, чтобы каждая субпопуляция была равной по размеру, можно использовать стратифицированную выборку. Таким образом, рандомизируются единицы в каждой подгруппе, но не вся выборка. Результаты эксперимента могут быть надежно обобщены от экспериментальных единиц к более крупной статистической совокупности единиц, только если экспериментальные единицы являются случайной выборкой из большей совокупности; вероятная ошибка такой экстраполяции, среди прочего, зависит от размера выборки.

Статистическое воспроизведение: Измерения обычно подвержены вариациям и неопределенности измерения ; таким образом, они повторяются, и полные эксперименты воспроизводятся, чтобы помочь определить источники вариации, лучше оценить истинные эффекты лечения, еще больше повысить надежность и достоверность эксперимента и добавить к существующим знаниям по теме. Однако перед повторением эксперимента должны быть соблюдены определенные условия: исходный вопрос исследования был опубликован в рецензируемом журнале или широко цитируется, исследователь не зависит от исходного эксперимента, исследователь сначала необходимо попытаться воспроизвести исходные результаты с использованием исходных данных, и в описании должно быть указано, что проведенное исследование является повторным исследованием, в котором пытались максимально точно следовать исходному исследованию.

Блокирование: Блокирование - это неслучайное расположение экспериментальных единиц в группы (блоки), состоящие из единиц, похожих друг на друга. Блокирование уменьшает известные, но нерелевантные источники вариации между единицами измерения и, таким образом, позволяет повысить точность оценки источника исследуемой вариации.

Ортогональность

Пример ортогонального факторного плана

Ортогональность касается форм сравнения (контрастов) это может быть выполнено законным и эффективным образом. Контрасты могут быть представлены векторами, а наборы ортогональных контрастов не коррелированы и независимо распределяются, если данные нормальные. Из-за этой независимости каждое ортогональное лечение предоставляет разную информацию другим. Если есть T обработок и T - 1 ортогональных контрастов, вся информация, которая может быть получена из эксперимента, может быть получена из набора контрастов.

Факториальные эксперименты: Использование факторных экспериментов вместо однофакторных экспериментов -разовый метод. Они эффективны при оценке эффектов и возможных взаимодействий нескольких факторов (независимых переменных). Анализ плана эксперимента построен на основе дисперсионного анализа, набора моделей, которые разделяют наблюдаемую дисперсию на компоненты, в зависимости от того, какие факторы эксперимент должен оценить или проверить.

Пример

Этот пример дизайнерских экспериментов приписывается Гарольду Хотеллингу и основан на примерах из Фрэнка Йейтса. Эксперименты, разработанные в этом примере, включают комбинаторные планы.

. Вес восьми объектов измеряется с помощью чашечных весов и набора стандартных гирь. При каждом взвешивании измеряется разница в весе между объектами на левой чашке и любыми объектами на правой чаше весов путем добавления откалиброванных гирь к более легкой чаше до тех пор, пока весы не придут в равновесие. Каждое измерение имеет случайную ошибку. Средняя ошибка равна нулю; стандартное отклонение распределения вероятностей ошибок - это одно и то же число σ при разных взвешиваниях; ошибки на разных взвешиваниях независимы. Обозначим истинные веса через

θ 1,…, θ 8. {\ displaystyle \ theta _ {1}, \ dots, \ theta _ {8}. \,}

\ theta_1, \ dots, \ theta_8. \,

Мы рассматриваем два разных эксперимента:

Взвешивайте каждый объект на одной чаше, а другая - пустой. Пусть X i будет измеренным весом объекта для i = 1,..., 8.
Выполните восемь взвешиваний в соответствии со следующим графиком и пусть Y i быть измеренной разностью для i = 1,..., 8:

левая чаша правая чаша 1-е взвешивание: 1 2 3 4 5 6 7 8 (пусто) 2-е: 1 2 3 8 4 5 6 7 3-е : 1 4 5 8 2 3 6 7 4-й: 1 6 7 8 2 3 4 5 5-й: 2 4 6 8 1 3 5 7 6-й: 2 5 7 8 1 3 4 6 7-й: 3 4 7 8 1 2 5 6 8-й : 3 5 6 8 1 2 4 7 {\ displaystyle {\ begin {array} {lcc} {\ text {left pan}} {\ text {right pan}} \\\ hline {\ text {1-е взвешивание: }} 1 \ 2 \ 3 \ 4 \ 5 \ 6 \ 7 \ 8 {\ text {(empty)}} \\ {\ text {2nd:}} 1 \ 2 \ 3 \ 8 \ 4 \ 5 \ 6 \ 7 \\ {\ text {3rd:}} 1 \ 4 \ 5 \ 8 \ 2 \ 3 \ 6 \ 7 \\ {\ text {4th:}} 1 \ 6 \ 7 \ 8 \ 2 \ 3 \ 4 \ 5 \\ {\ text {5th:}} 2 \ 4 \ 6 \ 8 \ 1 \ 3 \ 5 \ 7 \\ {\ text {6th:}} 2 \ 5 \ 7 \ 8 \ 1 \ 3 \ 4 \ 6 \\ {\ text {7th:}} 3 \ 4 \ 7 \ 8 \ 1 \ 2 \ 5 \ 6 \\ {\ text {8th:}} 3 \ 5 \ 6 \ 8 \ 1 \ 2 \ 4 \ 7 \ end {array}}

{\ displaystyle {\ begin {array} {lcc} {\ text {left pan}} {\ text {right pan}} \\\ hline {\ text {1-е взвешивание:}} 1 \ 2 \ 3 \ 4 \ 5 \ 6 \ 7 \ 8 {\ text {(пусто) }} \\ {\ text {2nd:}} 1 \ 2 \ 3 \ 8 \ 4 \ 5 \ 6 \ 7 \\ {\ text {3rd:}} 1 \ 4 \ 5 \ 8 \ 2 \ 3 \ 6 \ 7 \\ {\ text {4th:}} 1 \ 6 \ 7 \ 8 \ 2 \ 3 \ 4 \ 5 \\ {\ text {5th:}} 2 \ 4 \ 6 \ 8 \ 1 \ 3 \ 5 \ 7 \\ {\ text {6th:}} 2 \ 5 \ 7 \ 8 \ 1 \ 3 \ 4 \ 6 \\ {\ text {7th:}} 3 \ 4 \ 7 \ 8 \ 1 \ 2 \ 5 \ 6 \\ {\ text {8th:}} 3 \ 5 \ 6 \ 8 \ 1 \ 2 \ 4 \ 7 \ end {array}}}

Тогда оценочное значение веса θ 1is

θ ^ 1 = Y 1 + Y 2 + Y 3 + Y 4 - Y 5 - Y 6 - Y 7 - Y 8 8. {\ displaystyle {\ widehat {\ theta}} _ {1} = {\ frac {Y_ {1} + Y_ {2} + Y_ {3} + Y_ {4} -Y_ {5} -Y_ {6} - Y_ {7} -Y_ {8}} {8}}.}

\ widehat {\ theta} _1 = \ frac {Y_1 + Y_2 + Y_3 + Y_4 - Y_5 - Y_6 - Y_7 - Y_8} {8}.

Подобные оценки можно найти для весов других элементов. Например,

θ ^ 2 = Y 1 + Y 2 - Y 3 - Y 4 + Y 5 + Y 6 - Y 7 - Y 8 8. θ ^ 3 знак равно Y 1 + Y 2 - Y 3 - Y 4 - Y 5 - Y 6 + Y 7 + Y 8 8. θ ^ 4 знак равно Y 1 - Y 2 + Y 3 - Y 4 + Y 5 - Y 6 + Y 7 - Y 8 8. θ ^ 5 знак равно Y 1 - Y 2 + Y 3 - Y 4 - Y 5 + Y 6 - Y 7 + Y 8 8. θ ^ 6 = Y 1 - Y 2 - Y 3 + Y 4 + Y 5 - Y 6 - Y 7 + Y 8 8. θ ^ 7 = Y 1 - Y 2 - Y 3 + Y 4 - Y 5 + Y 6 + Y 7 - Y 8 8. θ ^ 8 знак равно Y 1 + Y 2 + Y 3 + Y 4 + Y 5 + Y 6 + Y 7 + Y 8 8. {\ displaystyle {\ begin {align} {\ widehat {\ theta}} _ {2} = {\ frac {Y_ {1} + Y_ {2} -Y_ {3} -Y_ {4} + Y_ {5 } + Y_ {6} -Y_ {7} -Y_ {8}} {8}}. \\ [5pt] {\ widehat {\ theta}} _ {3} = {\ frac {Y_ {1} + Y_ {2} -Y_ {3} -Y_ {4} -Y_ {5} -Y_ {6} + Y_ {7} + Y_ {8}} {8}}. \\ [5pt] {\ widehat {\ theta}} _ {4} = {\ frac {Y_ {1} -Y_ {2} + Y_ {3} -Y_ {4} + Y_ {5} -Y_ {6} + Y_ {7} -Y_ { 8}} {8}}. \\ [5pt] {\ widehat {\ theta}} _ {5} = {\ frac {Y_ {1} -Y_ {2} + Y_ {3} -Y_ {4} -Y_ {5} + Y_ {6} -Y_ {7} + Y_ {8}} {8}}. \\ [5pt] {\ widehat {\ theta}} _ {6} = {\ frac {Y_ {1} -Y_ {2} -Y_ {3} + Y_ {4} + Y_ {5} -Y_ {6} -Y_ {7} + Y_ {8}} {8}}. \\ [5pt] { \ widehat {\ theta}} _ {7} = {\ frac {Y_ {1} -Y_ {2} -Y_ {3} + Y_ {4} -Y_ {5} + Y_ {6} + Y_ {7 } -Y_ {8}} {8}}. \\ [5pt] {\ widehat {\ theta}} _ {8} = {\ frac {Y_ {1} + Y_ {2} + Y_ {3} + Y_ {4} + Y_ {5} + Y_ {6} + Y_ {7} + Y_ {8}} {8}}. \ End {align}}}

{\ displaystyle {\ begin {align} { \ widehat {\ theta}} _ {2} = {\ frac {Y_ {1} + Y_ {2} -Y_ {3} -Y_ {4} + Y_ {5} + Y_ {6} -Y_ {7 } -Y_ {8}} {8}}. \\ [5pt] {\ widehat {\ theta}} _ {3} = {\ frac {Y_ {1} + Y_ {2} -Y_ {3} - Y_ {4} -Y_ {5} -Y_ {6} + Y_ {7} + Y_ {8}} {8}}. \\ [5pt] {\ widehat {\ theta}} _ {4} = { \ frac {Y_ {1} -Y_ {2} + Y_ {3} -Y_ {4} + Y_ {5} -Y_ {6} + Y_ {7} -Y_ {8}} {8}}. \\ [5pt] {\ widehat {\ theta}} _ {5} = {\ frac {Y_ {1} -Y_ {2} + Y_ {3} -Y_ {4} -Y_ {5} + Y_ {6} -Y_ {7} + Y_ {8}} {8}}. \\ [5pt] {\ widehat {\ theta}} _ {6} = {\ fra c {Y_ {1} -Y_ {2} -Y_ {3} + Y_ {4} + Y_ {5} -Y_ {6} -Y_ {7} + Y_ {8}} {8}}. \\ [ 5pt] {\ widehat {\ theta}} _ {7} = {\ frac {Y_ {1} -Y_ {2} -Y_ {3} + Y_ {4} -Y_ {5} + Y_ {6} + Y_ {7} -Y_ {8}} {8}}. \\ [5pt] {\ widehat {\ theta}} _ {8} = {\ frac {Y_ {1} + Y_ {2} + Y_ { 3} + Y_ {4} + Y_ {5} + Y_ {6} + Y_ {7} + Y_ {8}} {8}}. \ End {align}}}

Вопрос планирования экспериментов: какой эксперимент лучше?

Дисперсия оценки X 1 для θ 1 равна σ, если мы используем первый эксперимент. Но если мы воспользуемся вторым экспериментом, то дисперсия приведенной выше оценки составит σ / 8. Таким образом, второй эксперимент дает нам в 8 раз большую точность для оценки одного элемента и оценивает все элементы одновременно с той же точностью. То, что достигается во втором эксперименте с восемью, потребует 64 взвешивания, если предметы взвешиваются отдельно. Однако обратите внимание, что оценки для пунктов, полученные во втором эксперименте, имеют ошибки, которые коррелируют друг с другом.

Многие проблемы планирования экспериментов связаны с комбинаторными планами, как в этом примере и других.

Как избежать ложных срабатываний

Ложноположительных заключений, часто в результате давления на публикацию или собственной предвзятости подтверждения автора, являются неотъемлемой опасностью во многих областях. Хороший способ предотвратить систематические ошибки, потенциально ведущие к ложным срабатываниям на этапе сбора данных, - это использовать двойной слепой дизайн. Когда используется двойной слепой дизайн, участники случайным образом распределяются по экспериментальным группам, но исследователь не знает, какие участники к какой группе принадлежат. Следовательно, исследователь не может повлиять на реакцию участников на вмешательство. Проблемой являются экспериментальные конструкции с нераскрытыми степенями свободы. Это может привести к сознательному или бессознательному «p-hacking »: пробовать несколько вещей до тех пор, пока вы не получите желаемый результат. Обычно это связано с манипулированием - возможно, бессознательным - процессом статистического анализа и степенями свободы до тех пор, пока они не вернут число ниже p <.05 level of statistical significance. So the design of the experiment should include a clear statement proposing the analyses to be undertaken. P-hacking can be prevented by preregistering researches, in which researchers have to send their data analysis plan to the journal they wish to publish their paper in before they even start their data collection, so no data manipulation is possible (https://osf.io ). Еще один способ предотвратить это - применить двойной слепой дизайн к фазе анализа данных, когда данные отправляются аналитику данных, не имеющему отношения к исследованию, который собирает данные, так что нет никакого способа узнать, к каким участникам относятся раньше. они потенциально могут быть исключены как выбросы.

Ясная и полная документация экспериментальной методологии также важна для поддержки воспроизведения результатов.

Темы для обсуждения при разработке экспериментального плана

Экспериментальный план или рандомизированный Клиническое испытание требует тщательного рассмотрения нескольких факторов, прежде чем фактически проводить эксперимент. План эксперимента - это разработка подробного плана эксперимента перед проведением эксперимента. Некоторые из следующих тем уже обсуждались в разделе принципов экспериментального дизайна:

Сколько факторов имеет план, и уровни этих факторов фиксированы или случайны?
Нужны ли контрольные условия, и какими они должны быть?
Проверки манипуляции; действительно ли манипуляция сработала?
Какие фоновые переменные?
Каков размер выборки. Сколько единиц необходимо собрать, чтобы эксперимент мог быть обобщенным и обладал достаточной мощностью ?
Каково значение взаимодействий между факторами?
Какое влияние оказывают отсроченные эффекты существенных факторов на результаты?
Как изменение ответа влияет на показатели самооценки?
Насколько возможно повторное применение одних и тех же измерительных инструментов в одних и тех же единицах в разных случаях, с пост-тестом и последующими тестами ?
Как насчет использования прокси-теста?
Существуют ли скрытые переменные?
Следует ли клиенту / пациенту, исследователю или даже аналитику данных не учитывать условия?
Какова осуществимость последующего применения различных условий к одним и тем же установкам?
Сколько факторов контроля и шума следует принимать во внимание?

Независимая переменная исследования часто имеет много уровней или разных групп. В настоящем эксперименте исследователи могут иметь экспериментальную группу, в которой реализуется их вмешательство, проверяющее гипотезу, и контрольную группу, которая имеет тот же элемент, что и экспериментальная группа, без элемента вмешательства. Таким образом, когда все остальное, кроме одного вмешательства, остается неизменным, исследователи могут с некоторой уверенностью подтвердить, что именно этот элемент вызвал наблюдаемое изменение. В некоторых случаях наличие контрольной группы неэтично. Иногда это решается с помощью двух разных экспериментальных групп. В некоторых случаях независимыми переменными нельзя манипулировать, например, при тестировании разницы между двумя группами, у которых разное заболевание, или тестировании разницы между полами (очевидно, переменные, к которым было бы трудно или неэтично назначать участников). В этих случаях может использоваться квазиэкспериментальный план.

Причинно-следственные связи

В чисто экспериментальном дизайне независимой (предикторной) переменной манипулирует исследователь, то есть каждый участник исследования выбирается случайным образом из совокупности, и каждый участник выбранный случайным образом назначается условиям независимой переменной. Только когда это будет сделано, можно с высокой вероятностью подтвердить, что причина различий в переменных результата вызвана различными условиями. Следовательно, исследователи должны по возможности выбирать экспериментальный план по сравнению с другими типами дизайна. Однако природа независимой переменной не всегда допускает манипуляции. В таких случаях исследователи должны знать, что нельзя сертифицировать причинно-следственную связь, если их дизайн не позволяет этого. Например, в планах наблюдения участники не распределяются по условиям случайным образом, и поэтому, если есть различия, обнаруженные в переменных результата между условиями, вполне вероятно, что есть нечто иное, чем различия между условиями, которые вызывают различия в результатах, что is - третья переменная. То же самое и с исследованиями с корреляционным дизайном. (Адер и Мелленберг, 2008 г.).

Статистический контроль

Лучше всего, чтобы процесс находился под разумным статистическим контролем до проведения запланированных экспериментов. Когда это невозможно, правильная блокировка, репликация и рандомизация позволяют тщательно проводить запланированные эксперименты. Чтобы контролировать мешающие переменные, исследователи вводят контрольные проверки в качестве дополнительных мер. Исследователи должны убедиться, что неконтролируемые влияния (например, восприятие достоверности источника) не искажают результаты исследования. Проверка манипуляции является одним из примеров контрольной проверки. Проверки манипуляции позволяют исследователям изолировать главные переменные, чтобы усилить поддержку того, что эти переменные работают, как планировалось.

Одним из наиболее важных требований к плану экспериментального исследования является необходимость устранения эффектов ложных, промежуточных и предшествующих переменных. В самой базовой модели причина (X) ведет к следствию (Y). Но может существовать третья переменная (Z), которая влияет на (Y), а X может быть вовсе не истинной причиной. Z считается ложной переменной, и ее необходимо контролировать. То же самое верно для промежуточных переменных (переменная между предполагаемой причиной (X) и следствием (Y)) и предшествующих переменных (переменная до предполагаемой причины (X), которая является истинной причина). Когда третья переменная задействована и не контролируется, отношение называется отношением. В большинстве практических применений планов экспериментальных исследований существует несколько причин (X1, X2, X3). В большинстве проектов одновременно обрабатывается только одна из этих причин.

Экспериментальные планы по Фишеру

Некоторые эффективные планы для оценки нескольких основных эффектов были найдены независимо и почти последовательно Раджем Чандрой Бозом и К. Кишеном в 1940 году в Индийский статистический институт, но оставался малоизвестным до тех пор, пока планы Плакетта-Бермана не были опубликованы в Biometrika в 1946 году. Примерно в то же время С. Р. Рао представил концепции ортогональных массивов как экспериментальные конструкции. Эта концепция сыграла центральную роль в разработке методов Тагучи Геничи Тагучи, которая имела место во время его визита в Индийский статистический институт в начале 1950-х годов. Его методы были успешно применены и приняты промышленными предприятиями Японии и Индии, а затем, хотя и с некоторыми оговорками, также были приняты промышленностью США.

В 1950 году Гертруда Мэри Кокс и Уильям Геммелл Кокран опубликовали книгу Experimental Designs, которая на долгие годы стала основным справочником по планированию экспериментов для статистиков..

Развитие теории линейных моделей охватило и превзошло случаи, которые касались ранних писателей. Сегодня теория опирается на сложные темы в линейной алгебре, алгебре и комбинаторике.

Как и в других отраслях статистики, экспериментальный план проводится с использованием как частотного и Байесовские подходы: при оценке статистических процедур, таких как экспериментальные планы, частотная статистика изучает распределение выборки, а байесовская статистика обновляет распределение вероятностей в пространстве параметров.

Некоторые важные участники в области экспериментального дизайна: C. С. Пирс, Р. А. Фишер, Ф. Йейтс, Р. К. Боз, А.С. Аткинсон, Р. А. Бейли, Д. Р. Кокс, Г. E. P. Box, W. Г. Кокран, В. Т. Федерер, В. В. Федоров, А. С. Хедаят, Дж. Кифер, О. Кемпторн, Дж. А. Нельдер, Андрей Пазман, Фридрих Пукельсхайм, Д. Рагхаварао, К. Р. Рао, Шриханд С. С., Дж. Н. Шривастава, Уильям Дж. Студден, Г. Тагучи и Х. П. Винн.

Учебники Д. Монтгомери, Р. Майерса и Г. Бокса / У. Хантер / Дж. Хантер достигли поколения студентов и практиков.

Некоторое обсуждение экспериментального дизайна в контексте идентификации системы (построение модели для статических или динамических моделей) приведено в и

Ограничения человека-участника

Законы и этические соображения исключают некоторые тщательно спланированные эксперименты с людьми. Юридические ограничения зависят от юрисдикции. Ограничения могут включать экспертные советы учреждений, информированное согласие и конфиденциальность, влияющие как на клинические (медицинские) испытания, так и на поведенческие и социальные исследования. В области токсикологии, например, проводятся эксперименты на лабораторных животных с целью определения безопасных пределов воздействия для человека. Уравновешивание ограничений - взгляды из области медицины. Что касается рандомизации пациентов, «... если никто не знает, какая терапия лучше, нет этического императива использовать ту или иную терапию». (стр. 380) Что касается дизайна эксперимента, «... явно неэтично подвергать субъектов риску для сбора данных в плохо спланированном исследовании, когда этой ситуации можно легко избежать...». (стр. 393)

См. также

Ссылки

Источники

Внешние ссылки

На Wikimedia Commons есть материалы, связанные с разделом.

A Дизайн экспериментов из "NIST / SEMATECH Справочник по инженерной статистике " в NIST
конструкции Бокса – Бенкена из « Руководства NIST / SEMATECH по инженерной статистике » в NIST
Подробные математические разработки наиболее распространенного DoE в онлайн-справочнике Opera Magistris v3.6 Глава 15, раздел 7.4, ISBN 978-2-8399-0932-7.