Спектральный анализ наименьших квадратов

редактировать

Спектральный анализ наименьших квадратов (LSSA ) - это метод оценки частотный спектр, основанный на подборе наименьших квадратов синусоид для выборок данных, аналогично анализу Фурье. анализу Фурье, наиболее часто используемый в науке спектральный метод, обычно усиливает длиннопериодический шум в записях с длинными интервалами; LSSA смягчает такие проблемы.

LSSA также известен как метод Ваничека после Петра Ваничека и как метод Ломба (или периодограмма Ломба ) и метод Ломба – Скаргла (или периодограмма Ломба – Скаргла ), основанный на вкладе Николаса Р. Ломба и, независимо, Джеффри Д. Scargle. Тесно связанные методы были разработаны Майклом Коренбергом, Скоттом Ченом и Дэвидом Донохо.

Содержание
  • 1 Историческая справка
  • 2 Метод Ваничека
  • 3 Периодограмма Ломба – Скаргла
  • 4 обобщенная периодограмма Ломба – Скаргла
  • 5 Метод «быстрого ортогонального поиска» Коренберга
  • 6 Метод «поиска базиса» Чена и Донохо
  • 7 Метод хи-квадрат Палмера
  • 8 Приложения
  • 9 Реализация
  • 10 См. Также
  • 11 Ссылки
  • 12 Внешние ссылки
Историческая справка

Тесная связь между анализом Фурье, периодограммой и Подбор синусоид методом наименьших квадратов известен давно. Однако большинство разработок ограничиваются полными наборами данных, состоящими из равномерных выборок. В 1963 году Фрик Дж. М. Барнинг из Mathematisch Centrum, Амстердам, обработал неравномерно разнесенные данные с помощью аналогичных методов, включая как анализ периодограммы, эквивалентный тому, что сейчас называют методом Ломба, так и аппроксимацию выбранных частот методом наименьших квадратов. синусоид, определенных на основе таких периодограмм, связанных процедурой, которая теперь известна как поиск совпадений с последующей коррекцией или поиском ортогонального совпадения.

Петр Ваничек, канадский геодезист из Университета Нью-Брансуика, в 1969 году также предложил подход согласованного преследования, который он назвал «последовательным спектральным анализом», и в результате получил «периодограмму наименьших квадратов» с одинаковыми и неравномерно разнесенными данными. Он обобщил этот метод для учета систематических компонентов, выходящих за рамки простого среднего, таких как «предсказанный линейный (квадратичный, экспоненциальный,...) вековой тренд неизвестной величины», и применил его к множеству выборок в 1971 г.

Затем метод Ваничека был упрощен в 1976 году Николасом Р. Ломбом из Сиднейского университета, который указал на его тесную связь с анализом периодограммы. Определение периодограммы неравномерно расположенных данных было впоследствии модифицировано и проанализировано Джеффри Д. Скарглом из Исследовательского центра Эймса НАСА, который показал, что с небольшими изменениями его можно сделать идентичным формуле наименьших квадратов Ломба для подгонка индивидуальных синусоидальных частот.

Скаргл заявляет, что его статья «не вводит новый метод обнаружения, а вместо этого изучает надежность и эффективность обнаружения с помощью наиболее часто используемого метода, периодограммы, в случае, когда время наблюдения составляет неравномерно разнесены "и далее указывает в отношении подбора синусоид методом наименьших квадратов по сравнению с анализом периодограммы, что его статья", по-видимому, впервые устанавливает, что (с предложенными модификациями) эти два метода точно эквивалентны. "

Press резюмирует развитие следующим образом:

Совершенно другой метод спектрального анализа для неравномерно отобранных данных, который смягчает эти трудности и имеет некоторые другие очень желательные свойства, был разработан Ломбом, основанным в часть более ранней работы Барнинга и Ваничека, дополнительно разработанная Скарглом.

Майкл Коренберг из Королевского университета в 1989 году разработал метод «быстрого ортогонального поиска», позволяющий быстрее находить почти оптимальную декомпозицию. Позиционирование спектров или другие проблемы, аналогичные методике, которая позже стала известна как поиск ортогонального согласования. В 1994 году Скотт Чен и Дэвид Донохо из Стэнфордского университета разработали метод «базового поиска» с использованием минимизации нормы L1 коэффициентов, чтобы преобразовать задачу в задачу линейного программирования для какие эффективные решения доступны.

Метод Ваничека

В методе Ваничека дискретный набор данных аппроксимируется взвешенной суммой синусоид прогрессивно определяемых частот с использованием стандартного линейного регрессия или метод наименьших квадратов. Частоты выбираются с использованием метода, аналогичного методу Барнинга, но идя дальше в оптимизации выбора каждой последующей новой частоты, выбирая частоту, которая минимизирует остаток после аппроксимации методом наименьших квадратов (эквивалентно методу подгонки, теперь известному как поиск соответствия с дооборудованием). Количество синусоид должно быть меньше или равно количеству выборок данных (считая синусы и косинусы той же частоты, что и отдельные синусоиды).

Вектор данных Φ представлен как взвешенная сумма синусоидальных базисных функций, табулированных в матрице A путем оценки каждой функции во время выборки, с вектором весов x:

ϕ ≈ A x {\ displaystyle \ phi \ приблизительно {\ textbf {A}} x}\ phi \ приблизительно {\ textbf {A}} x

, где весовой вектор x выбран так, чтобы минимизировать сумму квадратов ошибок при аппроксимации Φ. Решение для x представляет собой замкнутую форму с использованием стандартной линейной регрессии :

x = (A T A) - 1 A T ϕ. {\ displaystyle x = ({\ textbf {A}} ^ {\ mathrm {T}} {\ textbf {A}}) ^ {- 1} {\ textbf {A}} ^ {\ mathrm {T}} \ phi.}x = ({\ textbf {A}} ^ {{{\ mathrm {T}}}} {\ textbf {A}}) ^ {{- 1 }} {\ textbf {A}} ^ {{{\ mathrm {T}}}} \ phi.

Здесь матрица A может быть основана на любом наборе функций, которые являются взаимно независимыми (не обязательно ортогональными) при оценке во время выборки; для спектрального анализа обычно используются функции синусов и косинусов, равномерно распределенных по интересующему диапазону частот. Если слишком много частот выбрано в слишком узком частотном диапазоне, функции не будут достаточно независимыми, матрица будет плохо обусловлена, и результирующий спектр не будет иметь смысла.

Когда базисные функции в A ортогональны (то есть не коррелированы, что означает, что столбцы имеют нулевые парные скалярные произведения ), матрица AA является диагональной матрицей; когда все столбцы имеют одинаковую мощность (сумму квадратов элементов), тогда эта матрица представляет собой единичную матрицу, умноженную на константу, поэтому инверсия тривиальна. Последний случай имеет место, когда времена выборки равномерно разнесены, а синусоиды выбраны так, чтобы быть синусами и косинусами, равномерно распределенными попарно в частотном интервале от 0 до полупериода на выборку (с интервалом 1 / N цикла на выборку, опуская синус фазы на 0 и максимальной частоте, где они идентичны нулю). Этот частный случай известен как дискретное преобразование Фурье, слегка переписанное с точки зрения реальных данных и коэффициентов.

x = AT ϕ {\ displaystyle x = {\ textbf {A}} ^ {\ mathrm {T}} \ phi}x = {\ textbf {A}} ^ {{{\ mathrm {T}}}} \ phi (случай ДПФ для N равноотстоящих отсчетов и частот в пределах скалярного множителя)

Ломб предложил использовать это упрощение в целом, за исключением парных корреляций между синусом и косинусом основания одной и той же частоты, поскольку корреляции между парами синусоид часто невелики, по крайней мере, когда они не слишком близко расположены. По сути, это традиционная формулировка периодограммы, но теперь она принята для использования с неравномерно расположенными образцами. Вектор x является хорошей оценкой основного спектра, но поскольку корреляции игнорируются, A x больше не является хорошим приближением к сигналу, и метод больше не является методом наименьших квадратов - но он продолжает называться таковым.

Периодограмма Ломба – Скаргла

Вместо того, чтобы напрямую брать скалярные произведения данных с синусоидальными и косинусоидальными сигналами, Скаргл модифицировал стандартную формулу периодограммы, чтобы сначала найти временную задержку τ, такую, что эта пара синусоид были бы взаимно ортогональными во время выборки t j, а также с поправкой на потенциально неравные мощности этих двух базисных функций, чтобы получить лучшую оценку мощности на частоте, что сделало его модифицированный метод периодограммы в точности эквивалентен методу наименьших квадратов Ломба. Временная задержка τ определяется формулой

tan ⁡ 2 ω τ = j sin ⁡ 2 ω t j ∑ j cos ⁡ 2 ω t j. {\ displaystyle \ tan {2 \ omega \ tau} = {\ frac {\ sum _ {j} \ sin 2 \ omega t_ {j}} {\ sum _ {j} \ cos 2 \ omega t_ {j}} }.}\ tan {2 \ omega \ tau} = {\ frac {\ sum _ {j} \ sin 2 \ omega t_ {j}} {\ sum _ {j} \ cos 2 \ omega t_ {j}}}.

Периодограмма на частоте ω затем оценивается как:

P x (ω) = 1 2 ([∑ j X j cos ⁡ ω (tj - τ)] 2 ∑ j cos 2 ⁡ ω ( tj - τ) + [∑ J X J грех ⁡ ω (tj - τ)] 2 ∑ J грех 2 ⁡ ω (tj - τ)) {\ displaystyle P_ {x} (\ omega) = {\ frac {1} {2}} \ left ({\ frac {\ left [\ sum _ {j} X_ {j} \ cos \ omega (t_ {j} - \ tau) \ right] ^ {2}} {\ sum _ { j} \ cos ^ {2} \ omega (t_ {j} - \ tau)}} + {\ frac {\ left [\ sum _ {j} X_ {j} \ sin \ omega (t_ {j} - \ tau) \ right] ^ {2}} {\ sum _ {j} \ sin ^ {2} \ omega (t_ {j} - \ tau)}} \ right)}P_ {x} (\ omega) = {\ frac {1} {2}} \ left ({\ frac {\ left [\ sum _ {j} X_ {j} \ cos \ omega (t_ {j} - \ tau) \ right] ^ {2}} {\ sum _ { j} \ cos ^ {2} \ omega (t_ {j} - \ tau)}} + {\ frac {\ left [\ sum _ {j} X_ {j} \ sin \ omega (t_ {j} - \ tau) \ right] ^ {2}} {\ sum _ {j} \ sin ^ {2} \ omega (t_ {j} - \ tau)}} \ right)

в котором отчеты Scargle затем содержат то же статистическое распределение в виде периодограммы в случае равномерной выборки.

На любой отдельной частоте ω этот метод дает такую ​​же мощность, как и метод наименьших квадратов для синусоид этой частоты, вида

ϕ ( t) = A sin ⁡ ω t + B cos ⁡ ω t. {\ displaystyle \ phi (t) = A \ sin \ omega t + B \ cos \ omega t.}{\ displaystyle \ phi (t) = A \ sin \ omega t + B \ cos \ omega t.}
Обобщенная периодограмма Ломба – Скаргла

Стандартная периодограмма Ломба – Скаргла действительна для модели с нулевым средним. Обычно это приближается путем вычитания среднего значения данных перед вычислением периодограммы. Однако это неверное предположение, когда среднее значение модели (подогнанные синусоиды) не равно нулю. Обобщенная периодограмма Ломба – Скаргла устраняет это предположение и явно решает для среднего. В этом случае аппроксимируемая функция имеет вид

ϕ (t) = A sin ⁡ ω t + B cos ⁡ ω t + C. {\ displaystyle \ phi (t) = A \ sin \ omega t + B \ cos \ omega t + C.}{\ displaystyle \ phi (t) = A \ sin \ omega t + B \ cos \ o мега t ​​+ C.}

Обобщенная периодограмма Ломба – Скаргла также называется периодограммой с плавающим средним.

Метод «быстрого ортогонального поиска» Коренберга

Майкл Коренберг из Королевского университета в Кингстоне, Онтарио, разработал метод выбора разреженного набора компонентов из более чем -полный набор, например синусоидальные компоненты для спектрального анализа, называется быстрым ортогональным поиском (FOS). Математически FOS использует слегка модифицированное разложение Холецкого в процессе уменьшения среднеквадратичной ошибки (MSER), реализованном как инверсия разреженной матрицы. Как и другие методы LSSA, FOS позволяет избежать главного недостатка дискретного анализа Фурье и может обеспечить высокоточную идентификацию встроенных периодичностей и превосходит данные с неравномерными интервалами; Метод быстрого ортогонального поиска также применялся для решения других задач, таких как идентификация нелинейных систем.

Метод «базового поиска» Чена и Донохо

Чен и Донохо разработали процедуру под названием базисное преследование для подбора разреженного набора синусоид или других функций из чрезмерного полный комплект. Метод определяет оптимальное решение как решение, которое минимизирует L1 norm коэффициентов, так что проблема может быть представлена ​​как задача линейного программирования, для которой доступны эффективные методы решения.

Метод хи-квадрат Палмера

Палмер разработал метод нахождения функции наилучшего соответствия для любого выбранного числа гармоник, что дает большую свободу поиска несинусоидальных гармонических функций. Этот метод представляет собой быстрый метод (на основе БПФ ) для выполнения взвешенного анализа методом наименьших квадратов произвольно разнесенных данных с неоднородными стандартными ошибками. Исходный код, реализующий эту технику, доступен. Поскольку данные часто не отбираются в равномерно распределенные дискретные моменты времени, этот метод «объединяет» данные в виде сетки, разреженно заполняя массив временных рядов во время выборки. Все промежуточные точки сетки получают нулевой статистический вес, что эквивалентно бесконечным полосам погрешностей между выборками.

Приложения

Самая полезная функция метода LSSA - это возможность спектрального анализа неполных записей без необходимости манипулировать записью или изобретать иным образом несуществующие данные.

Величины в спектре LSSA отображают вклад частоты или периода в дисперсию временного ряда . Как правило, спектральные величины, определенные вышеописанным способом, обеспечивают прямой режим уровня значимости выходных данных. В качестве альтернативы, величины в спектре Ваничека также могут быть выражены в дБ. Обратите внимание, что величины в спектре Ваничека следуют β-распределению.

возможно LSSA Ваничека, что легче всего увидеть, записав прямое преобразование в виде матрицы; обратная матрица (когда матрица не является сингулярной) или псевдообратная будет тогда обратным преобразованием; обратное будет точно соответствовать исходным данным, если выбранные синусоиды взаимно независимы в точках выборки и их количество равно количеству точек данных. Подобная обратная процедура для метода периодограммы неизвестна.

Реализация

LSSA может быть реализован менее чем за страницу кода MATLAB. По сути:

«для вычисления спектра наименьших квадратов мы должны вычислить m спектральных значений... что включает в себя выполнение аппроксимации методом наименьших квадратов m раз, каждый раз, чтобы получить [спектральную мощность] для другой частоты»

Т.е. для каждой частоты в желаемом наборе частот функции синус и косинус оцениваются в моменты времени, соответствующие выборкам данных, и скалярные произведения берутся данные вектор с векторами синусоиды и соответствующим образом нормализуют; следуя методу, известному как периодограмма Ломба / Скаргла, временной сдвиг вычисляется для каждой частоты, чтобы ортогонализировать компоненты синуса и косинуса перед скалярным произведением, как описано Креймером; наконец, мощность вычисляется из этих двух составляющих амплитуды. Этот же процесс реализует дискретное преобразование Фурье, когда данные равномерно распределены во времени, а выбранные частоты соответствуют целому числу циклов в конечной записи данных.

Этот метод обрабатывает каждый синусоидальный компонент независимо или вне контекста, даже если они могут быть не ортогональными в точках данных; это оригинальный метод Ваничека. Напротив, как объясняет Креймер, также возможно выполнить полную одновременную или контекстную аппроксимацию методом наименьших квадратов, решив матричное уравнение, разделив общую дисперсию данных между указанными частотами синусоид. Такое матричное решение методом наименьших квадратов изначально доступно в MATLAB как оператор обратная косая черта.

Креймер объясняет, что одновременный или контекстный метод, в отличие от независимого или вне- версия контекста (а также версия периодограммы из-за Ломба) не может вместить больше компонентов (синусов и косинусов), чем имеется выборок данных, и, кроме того, что:

"... серьезные последствия могут также возникнуть, если выбранные частоты приводят к в некоторых компонентах Фурье (триггерные функции) становятся почти линейно зависимыми друг от друга, тем самым создавая плохо обусловленную или почти сингулярную N. Чтобы избежать такой плохой обусловленности, необходимо либо выбрать другой набор частот для оценки (например,, равноотстоящие частоты) или просто пренебречь корреляциями в N (т.е. недиагональными блоками) и оценить обратное преобразование методом наименьших квадратов отдельно для отдельных частот... "

Метод периодограммы Ломба, с другой стороны, может использовать произвольный y большое количество или плотность частотных компонентов, как в стандартной периодограмме ; то есть частотная область может быть передискретизирована на произвольный коэффициент.

В анализе Фурье, таком как преобразование Фурье или дискретное преобразование Фурье, синусоиды, подгоняемые к данным, все взаимно ортогональны, поэтому нет различий между простой проекцией на основе скалярного произведения вне контекста на базисные функции и одновременной подгонкой методом наименьших квадратов в контексте; то есть не требуется обращения матрицы для разделения дисперсии между ортогональными синусоидами различных частот методом наименьших квадратов. Этот метод обычно предпочтительнее из-за его эффективной реализации быстрого преобразования Фурье, когда доступны полные записи данных с равноотстоящими выборками.

См. Также
Ссылки
Внешние ссылки
Последняя правка сделана 2021-05-26 04:23:46
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте