Тестирование суррогатных данных (или метод суррогатных данных) представляет собой статистическое доказательство методом противоречия и аналогично параметрическому бутстрапингу, используемому для обнаружения нелинейности во временном ряду. Этот метод в основном включает в себя определение нулевой гипотезы, описывающей линейный процесс, а затем создание нескольких наборов суррогатных данных в соответствии с методами Монте-Карло. Затем рассчитывается различающая статистика для исходного временного ряда и всего суррогатного набора. Если значение статистики существенно отличается для исходного ряда от значения для суррогатного набора, нулевая гипотеза отклоняется и предполагается нелинейность.
Конкретный используемый метод проверки суррогатных данных напрямую связан с нулевой гипотезой. Обычно это похоже на следующее: данные представляют собой реализацию стационарной линейной системы, выход которой, возможно, измерялся монотонно возрастающей, возможно, нелинейной (но статической) функцией. Здесь линейный означает, что каждое значение линейно зависит от прошлых значений или от настоящих и прошлых значений некоторого независимого идентично распределенного (iid) процесса, обычно также гауссова. Это эквивалентно тому, что процесс относится к типу ARMA. В случае потоков (непрерывных отображений) линейность системы означает, что она может быть выражена линейным дифференциальным уравнением. В этой гипотезе статическая функция измерения зависит только от текущего значения аргумента, а не от прошлых значений.
Было предложено множество алгоритмов генерации суррогатных данных. Обычно их делят на две группы:
Последние методы суррогатных данных не зависят ни от конкретной модели, ни от каких-либо параметров, поэтому они являются непараметрическими методами. Эти методы суррогатных данных обычно основаны на сохранении линейной структуры исходного ряда (например, путем сохранения автокорреляционной функции или, что эквивалентно периодограммы, оценки спектра выборки). Среди методов реализации с ограничениями наиболее широко используются (и поэтому их можно назвать классическими методами):
Было предложено много других методов суррогатных данных, некоторые из которых основаны на оптимизации для достижения автокорреляции, близкой к исходной, некоторые на основе вейвлет-преобразования, а некоторые способны работать с некоторыми типами нестационарных данных.
Вышеупомянутые методы называются линейными суррогатными методами, потому что они основаны на линейном процессе и обращаются к линейной нулевой гипотезе. Вообще говоря, эти методы полезны для данных, показывающих нерегулярные колебания (краткосрочные изменчивости), и данных с таким поведением много в реальном мире. Однако мы часто наблюдаем данные с явной периодичностью, например, годовые числа солнечных пятен, электрокардиограмму (ЭКГ) и так далее. Временные ряды, демонстрирующие сильную периодичность, явно не согласуются с линейной нулевой гипотезой. Чтобы справиться с этим случаем, были предложены некоторые алгоритмы и нулевые гипотезы.