В плане экспериментов в статистике, дама, дегустирующая чай, представляет собой рандомизированный эксперимент, разработанный Рональда Фишера и сообщил в своей книге План экспериментов (1935). Эксперимент является оригинальным изложением идеи Фишера о нулевой гипотезе, которая «никогда не доказана и не установлена, но, возможно, опровергнута в ходе экспериментов».
Рассматриваемая женщина (Мюриэль Бристол ) утверждала, что могла сказать , был ли сначала добавлен чай или молоко в чашку. Фишер предложил подать ей восемь чашек, по четыре каждого сорта, в случайном порядке. Тогда можно было бы спросить, какова вероятность того, что она получит определенное количество чашек, которое она правильно определила, но просто случайно.
Описание Фишера составляет менее 10 страниц и отличается простотой и полнотой в отношении терминологии, расчетов и плана эксперимента. Пример в общих чертах основан на событии из жизни Фишера. В качестве теста использовался точный тест Фишера.
В ходе эксперимента испытуемому предоставляется 8 случайно упорядоченных чашек чая: 4 приготовлены путем наливания чая, а затем добавления молока, 4 приготовлены путем наливания молока, а затем добавления чая. Испытуемый должен выбрать 4 чашки, приготовленные одним способом. Допускается оценка кубков путем прямого сравнения. Испытуемый полностью раскрывает метод, использованный в эксперименте.
нулевая гипотеза заключается в том, что субъект не способен различать чаи. В подходе Фишера не было альтернативной гипотезы, в отличие от подхода Неймана – Пирсона.
Статистика теста представляет собой простой подсчет количества успехов в выборе 4 чашек (количество чашки данного типа успешно отобраны). Распределение возможного числа успехов при условии, что нулевая гипотеза верна, может быть вычислено с использованием количества комбинаций. Используя формулу комбинации , где общее количество чашек и Выбрано чашек, всего
возможных комбинаций.
Количество успешных действий | Выбранные комбинации | Количество комбинаций |
---|---|---|
0 | oooo | 1 × 1 = 1 |
1 | ooox, ooxo, oxoo, xooo | 4 × 4 = 16 |
2 | ooxx, oxox, oxxo, xoxo, xxoo, xoox | 6 × 6 = 36 |
3 | oxxx, xoxx, xxox, xxxo | 4 × 4 = 16 |
4 | xxxx | 1 × 1 = 1 |
Всего | 70 |
Частоты возможных количества успехов, указанные в последнем столбце этой таблицы, вычисляются следующим образом. Для 0 успехов есть только один набор из четырех вариантов (а именно, выбор всех четырех неправильных чашек), дающий такой результат. Для одного успеха и трех неудач есть четыре правильных чашки, из которых выбирается одна, что по формуле комбинации может быть в разными способами (как показано в столбце 2, где x означает правильную выбранную чашку, а o означает правильную чашку, которая не выбрана); и независимо от этого есть четыре неправильных чашки, из которых три выбраны, что может произойти в способов (как показано во втором столбце, на этот раз x интерпретируется как неправильная чашка, которая не выбрана, а o указывает на неправильную чашку, которая выбрана). Таким образом, выбор любой одной правильной чашки и любых трех неправильных чашек может происходить любым из 4 × 4 = 16 способов. Соответственно рассчитываются частоты других возможных успехов. Таким образом, количество успехов распределяется согласно гипергеометрическому распределению. Распределение комбинаций для создания k выборок из 2k доступных вариантов соответствует k-й строке треугольника Паскаля, так что каждое целое число в строке возводится в квадрат. В данном случае , потому что из 8 доступных чашек выбрано 4 чашки.
Критическая область для отклонения нуля отсутствия способности различать была единичным случаем 4 успехов из 4 возможных, на основе общепринятого критерия вероятности < 5%. This is the critical region because under the null of no ability to distinguish, 4 successes has 1 chance out of 70 (≈ 1.4% < 5%) of occurring, whereas at least 3 of 4 successes has a probability of (16+1)/70 (≈ 24.3%>5%).
Таким образом, если и только если женщина правильно классифицировала все 8 чашек, Фишер был готов отвергнуть нулевую гипотезу - фактически признав способность женщины на уровне значимости 1,4% (но без количественной оценки ее способности). Позже Фишер обсудил преимущества дополнительных испытаний и повторных тестов.
Дэвид Салсбург сообщает, что коллега Фишера показал, что в реальном эксперименте женщине удалось правильно идентифицировать все восемь чашек. Вероятность того, что кто-то просто догадывается, что все правильно, если предположить, что она угадает, что в любые четыре были добавлены чай первыми, а в остальные четыре - молоко, будет только 1 из 70 (комбинаций из 8, взятых за 4 вовремя).
Дэвид Салсбург опубликовал научно-популярную книгу под названием The Lady Tasting Tea, в которой описываются эксперимент и идеи Фишера по рандомизация. Деб Басу написала, что «знаменитый случай« дамы, дегустирующей чай »» был «одним из двух поддерживающих столпов... рандомизационного анализа экспериментальных данных».