Статистическая случайность

редактировать

Числовая последовательность называется статистически случайной, если она не содержит распознаваемых закономерности или закономерности; последовательности, такие как результаты идеального броска костей или цифры π, демонстрируют статистическую случайность.

Статистическая случайность не обязательно означает «истинную» случайность, т. Е. Объективная непредсказуемость. Псевдослучайности достаточно для многих целей, например для статистики, отсюда и название статистическая случайность.

Глобальная случайность и локальная случайность отличаются. Большинство философских концепций случайности являются глобальными, потому что они основаны на идее, что «в конечном итоге» последовательность выглядит действительно случайной, даже если некоторые подпоследовательности не будут выглядеть случайными. Например, в «истинно» случайной последовательности чисел достаточной длины, вероятно, будут длинные последовательности, состоящие только из повторяющихся чисел, хотя в целом последовательность может быть случайной. Локальная случайность относится к идее, что могут быть минимальные длины последовательности, в которых случайные распределения аппроксимируются. Длинные отрезки одних и тех же чисел, даже те, которые сгенерированы «истинно» случайными процессами, уменьшили бы «локальную случайность» выборки (это может быть только локально случайным для последовательностей из 10 000 чисел; выбор последовательности менее 1000 может не казаться случайным у всех, например).

Тем самым не доказывается, что последовательность, демонстрирующая узор, не является статистически случайной. Согласно принципам теории Рамсея, достаточно большие объекты обязательно должны содержать заданную субструктуру («полный беспорядок невозможен»).

Законодательство, касающееся азартных игр, налагает определенные стандарты статистической случайности для игровых автоматов.

Содержание

1 Тесты
2 См. Также
3 Ссылки
4 Внешние ссылки

Тесты

Первые тесты для случайных чисел были опубликованы MG. Кендалл и Бернард Бабингтон Смит в Журнале Королевского статистического общества в 1938 году. Они были основаны на статистических инструментах, таких как критерий хи-квадрат Пирсона которые были разработаны, чтобы различать, соответствуют ли экспериментальные явления их теоретическим вероятностям. Первоначально Пирсон разработал свой тест, показав, что в ряде экспериментов с игральными костями, проведенными W.F.R. Велдон не проявлял «случайного» поведения.

Исходными четырьмя тестами Кендалла и Смита были тесты гипотез, в которых в качестве нулевой гипотезы принималась идея о том, что каждое число в заданной случайной последовательности имеет равные шансы встретиться, и что различные другие шаблоны в данных также должны быть распределены равномерно.

Тест частоты был очень простым: проверка, чтобы убедиться, что было примерно одинаковое количество нулей, единиц, двух, трех и т. Д.
серийный номер test, проделал то же самое, но для последовательностей из двух цифр одновременно (00, 01, 02 и т. д.), сравнив наблюдаемые частоты с их гипотетическими прогнозами, были ли они распределены одинаково.
тест в покер, тестировался для определенных последовательностей пяти чисел (AAAAA, AAAAB, AAABB и т. Д.) На основе рук в игре покер.
тест на разрыв, посмотрел на расстояния между нулями (00 было бы расстоянием 0, 030 было бы расстоянием 1, 02250 было бы расстоянием 3 и т. д.).

Если бы данная последовательность могла пройти все эти тесты в пределах заданной степени значимости (обычно 5%), то она была признана, по их словам, «локально случайной». Кендалл и Смит дифференцировали «локальную случайность» от «истинной случайности» в том, что многие последовательности, сгенерированные с помощью действительно случайных методов, могут не отображать «локальную случайность» в заданной степени - очень большие последовательности могут содержать много строк из одной цифры. Это может быть «случайным» в масштабе всей последовательности, но в меньшем блоке оно не будет «случайным» (не пройдет их тесты) и будет бесполезным для ряда статистических приложений.

По мере того, как наборы случайных чисел становились все более и более распространенными, использовалось все больше и больше тестов. Некоторые современные тесты отображают случайные цифры как точки на трехмерной плоскости, которые затем можно вращать для поиска скрытых закономерностей. В 1995 году статистик Джордж Марсалья создал набор тестов, известный как несгибаемые тесты, который он распространяет с CD-ROM на 5 миллиардов псевдослучайные числа. В 2015 году Yongge Wang распространил программный пакет Java для статистически удаленного тестирования случайности.

Генераторы псевдослучайных чисел требуют тестов в качестве исключительной проверки их «случайности», поскольку они явно не производятся «истинно случайными» процессами, а скорее детерминированными алгоритмами. За всю историю генерации случайных чисел многие источники чисел, которые считались «случайными» при тестировании, позже было обнаружено, что они не являются случайными при проведении определенных типов тестов. Понятие квазислучайных чисел было разработано, чтобы обойти некоторые из этих проблем, хотя генераторы псевдослучайных чисел по-прежнему широко используются во многих приложениях (даже тех, которые известны как чрезвычайно "неслучайные"), поскольку они "достаточно хорошо" для большинства приложений.

Другие тесты:

Тест обрабатывает каждый выходной бит генератора случайных чисел как тест подбрасывания монеты и определяет, близко ли наблюдаемое количество орлов и решек к ожидаемой частоте 50%. Количество орлов в следе подбрасывания монеты формирует биномиальное распределение.
Вальд-Вулфовиц запускает тест для определения количества переходов битов между 0 битами и 1 битами, сравнивая наблюдаемые частоты с ожидаемой частотой случайной битовой последовательности.
Информационная энтропия
Автокорреляционный тест
Тест Колмогорова – Смирнова
Тест случайности, основанный на статистическом расстоянии. Юнгге Ван показал, что стандартов тестирования NIST SP800-22 недостаточно для обнаружения некоторых слабых мест в генераторах случайности, и предложил тест случайности на основе статистического расстояния.
Оценка спектральной плотности - выполнение преобразования Фурье на «случайный» сигнал преобразует его в сумму периодических функций для обнаружения неслучайных повторяющихся тенденций
Универсальный статистический тест Маурера
Тесты Дихарда

См. также

Ссылки

Внешние ссылки

DieHarder : бесплатный (GPL ) C набор тестов случайных чисел.
Генерация нормальных распределенных случайных чисел