Интуитивно, алгоритмически случайная последовательность (или случайная последовательность ) представляет собой последовательность двоичных цифр, которая кажется случайной для любого алгоритма, работающего на (без префиксов или без них) универсальной машине Тьюринга. Это понятие можно применять аналогично к последовательностям любого конечного алфавита (например, десятичных цифр). Случайные последовательности являются ключевыми объектами исследования в теории алгоритмической информации.
, поскольку иногда рассматриваются различные типы алгоритмов, начиная от алгоритмов с определенными границами времени их выполнения до алгоритмов, которые могут задавать вопросы машине-оракулу существуют разные представления о случайности. Наиболее распространенная из них известна как случайность Мартина-Лёфа (K-случайность или 1-случайность ), но также существуют более сильные и более слабые формы случайности. Термин «алгоритмически случайный», используемый для обозначения конкретной одиночной (конечной или бесконечной) последовательности без пояснений, обычно означает «несжимаемая» или, в случае, если последовательность бесконечна и префикс алгоритмически случайна (т. Е. K-несжимаемая), «Мартин-Лёф-Чайтин случайный».
Важно устранить неоднозначность алгоритмической случайности со стохастической случайностью. В отличие от алгоритмической случайности, которая определена для вычислимых (и, следовательно, детерминированных) процессов, стохастическая случайность обычно называется свойством последовательности, которая, как известно априори, генерируется (или является результатом) независимым идентично распределенному равновероятному случайному процессу.
Поскольку бесконечные последовательности двоичных цифр можно идентифицировать с действительными числами в единичном интервале, случайные двоичные последовательности часто называются (алгоритмически) случайными действительными числами . Кроме того, бесконечные двоичные последовательности соответствуют характеристическим функциям наборов натуральных чисел; поэтому эти последовательности можно рассматривать как наборы натуральных чисел.
Класс всех случайных (двоичных) последовательностей Мартина-Лёфа обозначается RAND или MLR.
Было дано первое подходящее определение случайной последовательности Автор Пер Мартин-Лёф в 1966 году. Более ранние исследователи, такие как Ричард фон Мизес, пытались формализовать понятие теста на случайность, чтобы определить случайный последовательность как та, которая прошла все тесты на случайность; однако точное понятие теста на случайность осталось неясным. Ключевой вывод Мартина-Лёфа заключался в использовании теории вычислений для формального определения понятия теста на случайность. Это контрастирует с идеей случайности в вероятности ; В этой теории ни один конкретный элемент пространства выборки нельзя назвать случайным.
Было показано, что с момента своего создания случайность Мартина-Лёфа допускает множество эквивалентных характеристик - в терминах сжатия, тестов на случайность и азартных игр, - которые не имеют ничего общего с внешним миром. сходство с исходным определением, но каждое из которых удовлетворяет нашему интуитивному представлению о свойствах, которыми должны обладать случайные последовательности: случайные последовательности должны быть несжимаемыми, они должны проходить статистические тесты на случайность, и должно быть трудно зарабатывать деньги делая ставки на них. Существование этих множественных определений случайности Мартина-Лёфа и стабильность этих определений при различных моделях вычислений свидетельствуют о том, что случайность Мартина-Лёфа является фундаментальным свойством математики, а не случайностью конкретной модели Мартина-Лёфа. Тезис о том, что определение случайности Мартина-Лёфа «правильно» отражает интуитивное понятие случайности, был назван тезисом Мартина-Лёфа-Чейтина ; это в чем-то похоже на тезис Черча – Тьюринга.
Первоначальное определение случайной последовательности Мартином-Лёфом было в терминах конструктивных нулевых покрытий; он определил последовательность как случайную, если она не содержится ни в одном таком покрытии. Грегори Чейтин, Леонид Левин и Клаус-Питер Шнорр доказали характеристику в терминах алгоритмической сложности : последовательность случайна, если существует равномерная оценка сжимаемости его начальных участков. Шнорр дал третье эквивалентное определение в терминах мартингалов. Книга Ли и Витаньи Введение в колмогоровскую сложность и ее приложения является стандартным введением в эти идеи.
Характеристика сложности Колмогорова передает интуицию, что случайная последовательность несжимаема: никакой префикс не может быть создан программой намного короче префикса.
Характеристика нулевого покрытия передает интуицию, что случайное действительное число не должно иметь каких-либо свойств, которые являются "необычными". Каждый набор тактов 0 можно рассматривать как необычное свойство. Последовательность не может лежать ни в каких наборах меры 0, потому что каждое одноточечное множество имеет меру 0. Идея Мартина-Лёфа заключалась в том, чтобы ограничить определение мерой 0 множеств, которые эффективно описываются; определение эффективного нулевого покрытия определяет счетную коллекцию эффективно описываемых множеств меры 0 и определяет последовательность как случайную, если она не лежит ни в одном из этих конкретных множеств меры 0. Поскольку объединение счетного набора множеств меры 0 имеет меру 0, это определение немедленно приводит к теореме о том, что существует множество случайных последовательностей меры 1. Обратите внимание, что если мы отождествляем пространство Кантора двоичных последовательностей с интервалом [0,1] действительных чисел, мера на пространстве Кантора согласуется с мерой Лебега.
Характеристика мартингала передает интуицию, что никакая эффективная процедура не должна быть возможность делать деньги, делая ставки против случайной последовательности. Мартингейл d - это стратегия ставок. d читает конечную строку w и ставит деньги на следующий бит. Он ставит некоторую часть своих денег на то, что следующий бит будет равен 0, а затем оставшуюся часть своих денег на то, что следующий бит будет равным 1. d удваивает деньги, которые он вложил в фактически возникший бит, и теряет оставшуюся часть. d (w) - это количество денег, которое он получил после просмотра строки w. Поскольку ставка, сделанная после просмотра строки w, может быть вычислена на основе значений d (w), d (w0) и d (w1), вычисление имеющейся суммы денег эквивалентно вычислению ставки. Характеристика мартингейла говорит, что никакая стратегия ставок, реализуемая любым компьютером (даже в слабом смысле конструктивных стратегий, которые не обязательно вычислимы ), не может делать деньги, делая ставки на случайную последовательность.
Поскольку каждое из эквивалентных определений случайной последовательности Мартина-Лёфа основано на том, что вычислимо с помощью некоторой машины Тьюринга, можно Естественно спросить, что может вычислить машина оракула Тьюринга . Для фиксированного оракула A последовательность B, которая не только случайна, но фактически удовлетворяет эквивалентным определениям вычислимости относительно A (например, ни один мартингал, который является конструктивным относительно оракула A, не преуспевает на B), называется случайной относительной на A. Две последовательности, хотя сами по себе случайны, могут содержать очень похожую информацию, и поэтому ни одна из них не будет случайной относительно другой. Каждый раз, когда происходит редукция по Тьюрингу от одной последовательности к другой, вторая последовательность не может быть случайной относительно первой, точно так же, как вычислимые последовательности сами по себе неслучайны; в частности, это означает, что Ω Чейтина не является случайным по сравнению с проблемой остановки.
Важным результатом, относящимся к относительной случайности, является теорема ван Ламбальгена, которая утверждает что если C - последовательность, составленная из A и B путем чередования первого бита A, первого бита B, второго бита A, второго бита B и т. д., то C является алгоритмически случайным, если и только если A является алгоритмически случайным, а B алгоритмически случайным относительно A. Тесно связанным следствием является то, что если A и B сами являются случайными, то A является случайным относительно B тогда и только тогда, когда B является случайным относительно A.
Относительная случайность дает нам первое понятие, которое сильнее, чем случайность Мартина-Лёфа, которая является случайностью относительно некоторого фиксированного оракула A. Для любого оракула это, по крайней мере, как сильный, и для большинства оракулов он строго сильнее, так как будут случайные последовательности Мартина-Лёфа, которые не являются случайными относительно оракула A. Важными оракулами, которые часто рассматриваются, являются проблема остановки, , и n-й оракул прыжка, , поскольку эти оракулы могут отвечать на конкретные вопросы, которые возникают естественным образом. Последовательность, которая является случайной относительно оракула , называется n-случайной; следовательно, последовательность 1-случайна тогда и только тогда, когда она случайна по Мартину-Лёфу. Последовательность, которая является n-случайной для каждого n, называется арифметически случайной. N-случайные последовательности иногда возникают при рассмотрении более сложных свойств. Например, существует только счетное количество наборов , поэтому можно подумать, что они не должны быть случайными. Однако вероятность остановки Ω равна и 1-случайна; только после достижения 2-случайности случайный набор не может быть .
Кроме того, есть несколько понятий случайности, которые слабее, чем случайность Мартина-Лёфа. Некоторые из них - слабая 1-случайность, случайность Шнорра, вычислимая случайность, частичная вычислимая случайность. Юнгге Ван показал, что случайность Шнорра отличается от вычислимой случайности. Кроме того, известно, что случайность Колмогорова-Ловленда не сильнее случайности Мартина-Лёфа, но неизвестно, действительно ли она слабее.
На противоположном конце спектра случайности есть понятие K-тривиального множества. Эти наборы являются антислучайными в том смысле, что весь начальный сегмент является логарифмически сжимаемым (т. Е. для каждого начального сегмента w), но они не вычислимы.