Обратная задача

редактировать

Обратная задача в науке - это процесс вычисления на основе набора наблюдений факторов, которые их породили: например, расчет изображения в рентгеновской компьютерной томографии, реконструкция источника в акустике или расчетной плотности Земли по измерениям ее гравитационное поле. Это называется обратной, потому что она начинается с последствий, а затем вычисляет причины. Это обратная задача прямой, которая начинается с причин и затем вычисляется последствия.

Обратные задачи - одни из самых важных математических задач в науке и математике, потому что они говорят нам о параметрах, которые мы можем вести напрямую. Они имеют широкое применение в идентификации систем, оптике, радарах, акустике, теории связи, обработка сигналов, медицинская визуализация, компьютерное зрение, геофизика, океанография, астрономия, дистанционное зондирование, обработка естественного языка, машинное обучение, неразрушающий контроль и многие другие области.

Содержание
  • 1 История
  • 2 Концептуальное понимание
  • 3 Общая постановка обратной задачи
  • 4 Линейные обратные задачи
    • 4.1 Элементарный пример: гравитационное поле Земли
      • 4.1.1 Инструменты для преодоления первой трудности
      • 4.1. 2 Инструменты для преодоления второй трудности
      • 4.1.3 Байесовский подход
      • 4.1.4 Численное решение нашего простейшего примера
    • 4.2 Математические и вычислительные аспекты
      • 4.2.1 Численное решение задачи оптимизации
      • 4.2.2 Устойчивость, регуляризация и дискретизация модели в бесконечности Размерность
    • 4.3 Некоторые классические линейные обратные задачи для восстановления распределенных параметров
      • 4.3.1 Деконволюция
      • 4.3.2 Томографические методы
        • 4.3.2.1 Компьютерная томография
        • 4.3.2.2 Дифракционная томография
        • 4.3.2.3 Доплеровская томография (астрофизика)
  • 5 Нелинейные обратные задачи
    • 5.1 Некоторые классические нелинейные обратные задачи
      • 5.1.1 Обратные задачи рассеяния
      • 5.1.2 Согласование проницаемости в нефти и газе резервуары
      • 5.1.3 Обратные задачи в волновых уравнениях
      • 5.1.4 Томография времени пробега
    • 5.2 Математические аспекты: вопросы Адамара
    • 5.3 Вычислительные аспекты
      • 5.3.1 Невыпуклые несоответ ствия данных функция
      • 5.3.2 Вычисление градиента задачи функции
  • 6 Приложения
  • 7 См. также
    • 7.1 Академические журналы
  • 8 Ссылки
  • 9 Ссылки
  • 10 Дополнительная литература
  • 11ние ссылки
История

История со следствием, чтобы причины, на протяжении веков занимались физиками. Исторический пример - это вычисления Адамса и Леверье, которые приводят к открытию Нептуна по нарушенной траектории Урана. Однако формальное изучение обратных задач началось только в 20 веке.

Один из самых ранних решений обратной задачи был обнаружен Германом Вейлем и опубликован в 1911 году, описывая асимптотическое поведение собственных значений оператора Лапласа - Бельтрами. Сегодня известный как закон Вейля, его, пожалуй, легче понять как ответ на вопрос о том, можно ли услышать форму барабана. Вейль предположил, что собственные частоты барабана будут связаны с площадью и периметром барабана определенным уравнением, и этот результат улучшили более поздние математики.

Сфера обратных задач позже была затронута советским - армянским физиком, Виктором Амбарцумян.

Еще будучи студентом, Амбарцумян досконально изучил теорию атомной структуры, уровней образования энергии, и уравнение Шредингера и его свойства, и когда он овладел теорией собственные значения дифференциальных уравнений, он указал на очевидную аналогию между дискретными уровнями энергии и собственными значениями разных значений формул. Затем он спросил: можно ли, данное семейство собственных значений, найти формулы, собственными значениями, которые они являются? По сути, Амбарцумян исследовал обратную задачу Штурма - Лиувилля, которая касалась определения уравнений колеблющейся струны. Эта статья была опубликована в 1929 году в немецком физическом журнале Zeitschrift für Physik и долгое время оставалась в безвестности. Описывая эту ситуацию по прошествии многих десятилетий, Амбарцумян сказал: «Если астроном опубликует в физической журнале статью с математическим анализом, то, скорее всего, с ним случится забвение».

Тем не менее, ближе к концу Второй мировой войны статья, написанная 20-летним Амбарцумяном, была найдена шведскими математиками и стала отправной точкой для целой области исследований обратных задач. становясь агентством всей дисциплины.

Затем важные усилия были использованы на «прямом решении» обратной рассеяния, особенно Гельфандом и Левитаном в Советском Союзе. Они предложили аналитический конструктивный метод определения решения. Когда стали доступны компьютеры, некоторые исследовали возможность применения своего подхода к аналогичным задачам. Но быстро экранилось, что инверсия - нестабильный процесс: шум и ошибки могут быть усилены, что делает прямое решение практически невозможным. Затем примерно в семидесятых годах появились методы наименьших квадратов и вероятностный подход, которые оказались очень полезными для определения параметров задействованных в различных системах. Этот подход имел большой успех. В настоящее время обратные задачи исследуются в областях, не относящихся к физике, таких как химия, экономика и информатика. В конце концов, когда числовые модели будут преобладать во многих частях общества, мы ожидаем обратную проблему, связанную с каждой из этих числовых моделей.

Концептуальное понимание

Со времен Ньютона ученые активно пытались моделировать мир. В частности, когда доступна математическая модель (например, закон тяготения Ньютона или уравнение Кулона для электростатики), мы можем предвидеть, определенные параметры, описывающие физическую систему (например, распределение массы или распределение электрических зарядов), поведение системы. Этот подход известен как математическое моделирование, и вышеупомянутые физические параметры называются модели или просто моделью . Точнее, введем понятие состояния физической системы : это решение уравнения математической модели. В теории оптимального управления эти уравнения встречаются как уравнения состояния. Во многих ситуациях нас действительно интересует не физическое состояние, а просто его влияние на некоторые объекты (например, влияние гравитационного поля на конкретную планету). Следовательно, мы хотим другой оператор, называемый оператором наблюдения, который преобразует состояние физической системы (здесь предсказанное гравитационное поле) в то, что мы хотим наблюдать (здесь движение рассматриваемой планеты). Теперь мы можем представить так называемую прямую задачу, которая состоит из двух шагов:

  • определение системы по физическим параметрам, которые ее описывают
  • применение наблюдения для оценки состояний системы, чтобы предсказать поведение того, что мы хотим вести.

Это приводит к введению еще одного оператора F {\ displaystyle F}F (Fозначает «вперед»), который отображает параметры модели p {\ displaystyle p}p в F (p) {\ displaystyle F (p)}F (p) , данные модели p {\ displaystyle p}p предсказывает, что это результат этой двухэтапной процедуры. Оператор F {\ displaystyle F}F называется оператором пересылки или прямой картой . В этом подходе мы в основном пытаемся сообщить последствия, зные причины.

В таблице ниже показано, что рассматривается различные физические явления, параметры модели, которые описывают систему, физическую величину, которая является состоянием физической системы, и наблюдения, обычно производимые на состояние системы.

Управляющие уравненияПараметры моделиСостояние физической системыОбщие наблюдения за системой
Закон всемирного тяготения Ньютона Распределение массГравитационное поле Измерения, выполненные гравиметрами в разных точках поверхности
Уравнения Максвелла Распределение магнитной восприимчивости Магнитное поле Магнитное поле, измеренное в разных точках поверхности с помощью магнитометров (случай установившегося состояния)
Волновое уравнение Распределение волновых скоростей и плотностейВолновое поле, вызванное искусственными или естественными сейсмическими источниками Скорость частиц измеряется сейсмометрами, расположенными в разных местах на поверхности
Уравнение диффузии Распределение коэффициента диффузии Концентрация диффузионного как функция пространства и времениМониторинг этой плотности, измеренной в разл материале иных мест

В подходе обратных задач мы, грубо говоря, пытаемся узнать причины этого следствия.

Общая постановка обратной задачи

Обратная прямая задача - это «обратная» задача: мы хотим определить параметры модели, которые производят данные dobs {\ displaystyle d_ {obs}}{\ displaystyle d_ {obs}} то есть наблюдение, которое мы записали (нижний индекс obs ожидаемое). Итак, мы ищем параметры модели p {\ displaystyle p}p такие, что (по крайней мере приблизительно)

dobs = F (p) {\ displaystyle \ d_ {obs} = F ( p)}{\ displaystyle \ d_ {obs} = F (p)}

, где F {\ displaystyle F}F - прямая карта. Мы обозначаем M {\ displaystyle M}M количество (возможно, бесконечное) параметров модели, а N {\ displaystyle N}N количество записанных данных..

  • Пространство моделей, обозначенное P {\ displaystyle P}P : векторное пространство, охватываемое регулируемое модели; он имеет M {\ displaystyle M}M размеров;
  • пространство данных, обозначенное D {\ displaystyle D}D : D = RN {\ displaystyle D = \ mathbb {R} ^ {N}}{\ displaystyle D = \ mathbb {R} ^ {N}} , если мы организуем измеренные образцы в вектор с N {\ displaystyle N}N компонентами (если наши измерения состоят из функций, D {\ displaystyle D}D - новое пространство с бесконечными размерами);
  • F (p) {\ displaystyle F (p)}F (p) : ответ модели p {\ displaystyle p}p ; он состоит из данных, предсказанных моделей p {\ displaystyle p}p ;
  • F (P) {\ displaystyle F (P)}{\ displaystyle F (P)} : изображение P { \ displaystyle P}P по прямой карте, это подмножество D {\ displaystyle D}D (но не подпространство, если F {\ displaystyle F}F является линейным), состоящим из ответов всех моделей;
  • dobs - F (p) {\ displaystyle d_ {obs} -F (p)}{\ displaystyle d_ {obs} -F (p)} : несоответствия данных (или остатки), связанные с моделью p { \ displaystyle p}p : они могут быть защищены как вектор, элемент D {\ displaystyle D}D .

Концепция остатков очень важна: в рамках поиска моделей, наличия данных, их анализ показывает, можно ли рассматривать рассматриваемую модель как реалистичную или нет . Систематические нереалистичные расхождения между данными и ответами модели также показывают, что прямая карта неадекватна и может дать об улучшенной прямой карте.

Когда оператор F {\ displaystyle F}F является линейным, обратная задача является линейной. В противном случае обратная задача чаще всего является нелинейной. Кроме того, модели не всегда могут быть конечным номером. Это тот тот, когда мы ищем распределенные параметры (например, распределение волновых скоростей): в таких случаях обратной задачи является получение одной или нескольких функций. Такие обратные задачи являются обратными задачами бесконечной размерности.

Линейные обратные задачи

В случае линейного прямого отображения и когда мы имеем дело с конечным числом параметров модели, прямое отображение может быть записано как линейная система

d = F p { \ displaystyle \ d = Fp}{\ displaystyle \ d = Fp}

, где F {\ displaystyle F}F - матрица , которая характеризует прямую карту.

Элементарный пример: гравитационное поле Земли

Лишь несколько физических систем действительно линейны по отношению к параметрам модели. Одна из таких геофизических систем - это система гравитационного поля Земли. Гравитационное поле Земли определяется распределением плотности Земли в недрах. Время литология Земли меняется довольно значительно, мы можем вести наблюдение в гравитационном поле Земли на поверхности Земли. Из нашего понимания гравитации (всемирного тяготения Ньютона) мы знаем, что математическое выражение для гравитации:

d = G p r 2; {\ displaystyle d = {\ frac {Gp} {r ^ {2}}};}{\ displaystyle d = {\ frac {Gp} {r ^ {2}}};}

здесь d {\ displaystyle d}d - мера местного ускорения свободного падения, G {\ displaystyle G}G - универсальная гравитационная постоянная, p {\ displaystyle p}p - локальная масса (которая связана с плотностью) породы в недрах, а r {\ displaystyle r}г - расстояние от массы до точки наблюдения.

Мы хотим узнать больше, используя дискретные данные наблюдений на поверхности Земли. Например, рассмотрим случай, когда у нас есть измерения, проводимые в 5 точках на поверхности Земли. В этом случае наш вектор данных d {\ displaystyle d}d является вектор-столбцом размерности (5x1): его i {\ displaystyle i}ith компонент связан с i {\ displaystyle i}i-м местом наблюдения. Мы также знаем, что у нас есть только пять неизвестных масс pj {\ displaystyle p_ {j}}p_ {j} в недрах (нереально, но используется для демонстрации концепции) с известным местоположением: мы обозначаем rij {\ displaystyle r_ {ij}}r_ { ij} между i {\ displaystyle i}iточка наблюдения и j {\ displaystyle j}j -я масс. Таким образом мы можем построить линейную систему, связывающую пять неизвестных масс с пятью точками данных следующим образом:

d = F p, {\ displaystyle d = Fp, \,}{\ displaystyle d = Fp, \,}
d = [d 1 d 2 d 3 d 4 d 5], {\ displaystyle d = {\ begin {bmatrix} d_ {1} \\ d_ {2} \ d_ {3} \ d_ {4} \ d_ {5} \ end {bmatrix}}, }{\ displaystyle d = {\ begin {bmatrix} d_ {1} \\ d_ { 2} \\ d_ {3} \\ d_ {4} \\ d_ {5} \ end {bmatrix}},}
p = [p 1 p 2 p 3 p 4 p 5], {\ displaystyle p = {\ begin {bmatrix} p_ {1} \\ p_ {2} \\ p_ {3} \ \ p_ { 4} \\ p_ {5} \ end {bmatrix}},}{\ displaystyle p = {\ begin {bmatrix} p_ {1} \\ p_ {2} \\ p_ {3} \\ p_ {4} \\ p_ {5} \ end {bmatrix}},}
F = [G r 11 2 G r 12 2 G r 13 2 G r 14 2 G r 15 2 G r 21 2 G r 22 2 G r 23 2 G r 24 2 G r 25 2 G r 31 2 G r 32 2 G r 33 2 G r 34 2 G r 35 2 G r 41 2 G r 42 2 G r 43 2 G r 44 2 г р 45 2 г р 51 2 г р 52 2 г р 53 2 г р 54 2 г р 55 2] {\ displaystyle F = {\ begin {bmatrix} {\ frac {G} {r_ {11} ^ {2}} } {\ frac {G} {r_ {12} ^ {2}}} {\ frac {G} {r_ {13} ^ {2}}} и {\ frac {G} {r_ {14} ^ {2}}} {\ frac {G} {r_ {15} ^ {2}}} \\ {\ frac {G} {r_ {21} ^ {2}}} и {\ frac {G} { r_ {22} ^ {2}}} и {\ frac {G} {r_ {23} ^ {2}}} и {\ frac {G} {r_ {24} ^ {2}}} и {\ frac {G} {r_ {25} ^ {2}}} \\ {\ frac {G} {r_ {31} ^ {2}}} и {\ frac {G} {r_ {32} ^ {2}}} {\ frac {G} {r_ {33} ^ {2}}} {\ frac {G} {r_ {34} ^ {2}}} и {\ frac {G} {r_ {35} ^ {2}}} \\ {\ frac {G} {r_ {41} ^ {2}}} и {\ frac {G} {r_ {42} ^ {2}}} и {\ frac {G} {r_ {43} ^ {2}}} и {\ frac {G} {r_ {44} ^ {2}}} и {\ frac {G} {r_ {45} ^ {2}}} \\ {\ frac {G} {r_ {51} ^ {2}}} и {\ frac {G} {r_ {52} ^ {2}}} и {\ frac {G} {r_ {53} ^ {2}}} и {\ frac {G} {r_ {54} ^ {2}}} и {\ frac {G} {r_ {55} ^ {2}}} \ end {bmatrix}}}{\ displaystyle F = {\ begin {bmatrix} {\ frac {G} {r_ {11} ^ {2}}} и {\ frac {G} {r_ {12} ^ {2}}} и {\ frac {G} {r_ {13} ^ {2}}} и {\ frac {G} {r_ {14} ^ {2}}} {\ frac {G} {r_ {15} ^ {2}}} \\ {\ frac {G} {r_ {21} ^ {2}}} и {\ frac {G} {r_ {22} ^ {2}}} и {\ frac {G} {r_ {23} ^ {2}}} и {\ frac {G} {r_ {24} ^ {2}}} и {\ frac {G} {r_ {25} ^ {2}}} \\ {\ frac {G} {r_ {31} ^ {2}}} и {\ frac {G} {r_ {32} ^ {2}}} и {\ frac {G} {r_ {33} ^ {2}}} и {\ frac {G} {r_ {34} ^ {2}}} {\ frac {G} {r_ {35} ^ {2}}} \\ {\ frac {G} {r_ {41} ^ {2}}} и {\ frac {G} {r_ {42} ^ {2}}} и {\ frac {G} { r_ {43} ^ {2}}} {\ frac {G} {r_ {44} ^ {2}}} и {\ frac {G} {r_ {45} ^ {2}}} \\ {\ гидроразрыв {G} {r_ {51} ^ {2}}} и {\ frac {G} {r_ {52} ^ {2}}} и {\ frac {G} {r_ {53} ^ {2}} } {\ frac {G} {r_ {54} ^ {2}}} {\ frac {G} {r_ {55} ^ {2}}} \ end {bmatrix}}}

Чтобы найти параметры, которые соответствуют нашим данным, мы можем инвертировать матрицу F {\ displaystyle F}F , чтобы напрямую преобразовать измерения в параметры нашей модели. Например:

p = F - 1 dobs {\ displaystyle p = F ^ {- 1} d_ {obs} \,}{\ displaystyle p = F ^ {- 1} d_ {obs} \,}

Система с пятью уравнениями и пятью неизвестными - очень специфическая ситуация: наш пример был разработан с учетом этой специфики. Как правило, количество данных и неизвестных различается, поэтому матрица F {\ displaystyle F}F не является квадратной.

Однако даже квадратная матрица не может иметь обратного: матрица F {\ displaystyle F}F может иметь ранг неполноценную (т.е. иметь нулевые собственные значения)) и решение системы p = F - 1 dobs {\ displaystyle p = F ^ {- 1} d_ {obs} \,}{\ displaystyle p = F ^ {- 1} d_ {obs} \,} не является уникальным. Тогда решение обратной задачи будет неопределенным. Это первая трудность. У чрезмерно определенных систем (больше уравнений, чем неизвестных) есть другие проблемы. Также шум может искажать наши наблюдения, например d {\ displaystyle d}d , возможно, за пределами пространства F (P) {\ displaystyle F (P)}{\ displaystyle F (P)} чтобы ответить на модели параметров так, чтобы решение системы p = F - 1 добс {\ displaystyle p = F ^ {- 1} d_ {obs} \,}{\ displaystyle p = F ^ {- 1} d_ {obs} \,} могло не существовать. Это еще одна трудность.

Инструменты для преодоления первой проблемы

Первая трудность требует: наши исследования не содержат информацию, требуются дополнительные данные. Дополнительные данные поступать из физической априорной информации о значениях параметров, об их пространственном распределении или, в более общем смысле, об их взаимной зависимости. Это также может происходить из других экспериментов: например, мы можем подумать об объединении данных, записанных гравиметрами и сейсмографами для лучшей плотности плотности. Интеграция этой дополнительной информации в основном является проблемой статистики. Эта дисциплина - та, которая может ответить на вопрос: как смешивать количество различных природы? Мы будем более точными в разделе «Байесовский подход» ниже.

Что касается распределенных параметров, априорная информация об их пространственном распределении часто из информации о некоторых производных этих распределенных параметрах. Кроме того, обычной практикой, хотя и несколько искусственной, является поиск «простейшей» модели, которая разумно соответствует данным. Обычно это достигается штрафом за L 1 {\ displaystyle L ^ {1}}L ^ {1} norm градиента (или всего изменение ) параметров (этот подход также называют максимизацией энтропии). Можно также упростить модель с помощью параметров, которая вводит степень свободы только при необходимости.

Дополнительная информация также может быть интегрирована посредством ограничений для параметров модели или некоторых их функций. Такие ограничения важны, чтобы избежать нереалистичных значений параметров (например, отрицательных значений). В этом случае пространство, охватываемое регулируемым объектом, будет подмножеством допустимых моделей, обозначенным P adm {\ displaystyle P_ {adm}}{\ displaystyle P_ {adm}} расшир.

Инструменты для преодоления второй трудности

Как включить вышеупомянутое устройство, которое может использоваться таким, каким-либо модели, поэтому мы не можем искать модель, которая производит данные, но скорее ищите лучшую (или оптимальную) модель : то есть ту, которая лучше всего соответствует данным. Это приводит к минимизации целевых функций , именно функционала, который количественно определяет, насколько велики остатки или прогнозируемые данные далеко прогнозируемых данных от наблюдаемых данных. Конечно, когда у нас есть идеальные данные (то есть без шума), восстановленная модель должна идеально соответствовать наблюдаемым данным. Стандартная целевая функция φ {\ displaystyle \ varphi}\ varphi имеет вид:

φ (p) = ‖ F p - dobs ‖ 2 {\ displaystyle \ varphi (p) = \ | Fp-d_ {obs} \ | ^ {2} \,}{\ displaystyle \ varphi (p) = \ | Fp-d_ {obs} \ | ^ {2} \,}

где ‖ ‖ {\ displaystyle \ | \ | \,}{\ displaystyle \ | \ | \,} - евклидова норма (это будет бытьL 2 {\ displaystyle L ^ {2}}L ^ {2} norm, когда используются функции, а не выборками) остатков. Этот подход сводится к использованию обычных наименьших квадратов, подход, широко используемого в статистике. Однако известно, что мы можем подумать об использовании других расстояний, например, L 1 {\ displaystyle L ^ {1}}L ^ {1} norm, вместо L 2 {\ displaystyle L ^ {2} }L ^ {2} норм.

Байесовский подход

Вероятный подход очень похож на метод наименьших квадратов: если мы знаем статистику шума, загрязняющих данных, мы можем подумать о поиске вероятной модели m, которая соответствует критерию качества правдоподобия. Если шум равен гауссову, критерий максимального правдоподобия появляется как критерий наименьших квадратов, евклидов скалярный продукт в пространстве заменяется скалярным произведением, включающим ковариацию шум. Кроме того, если доступна априорная информация о параметрах модели, можно было бы подумать об использовании байесовского вывода для формулирования решения обратной задачи. Этот подход подробно описан в книге Тарантолы.

Численное решение нашего элементарного примера

Здесь мы используем евклидовуму для количественной оценки несоответствия данных. Мы имеем дело с линейной согласованной функцией. Для его минимизации классом считается вычисление его градиента с использованием того же логического обоснования (как если бы мы минимизировали функцию только одной логической логики). В оптимальной модели popt {\ displaystyle p_ {opt}}{\ displaystyle p_ {opt}} этот градиент исчезает, что можно записать как:

∇ p φ = 2 (FTF popt - FT dobs) = 0 {\ displaystyle \ nabla _ {p} \ varphi = 2 (F ^ {\ mathrm {T}} Fp_ {opt} -F ^ {\ mathrm {T}} d_ {obs}) = 0 \,}{\ displaystyle \ nabla _ {p} \ varphi = 2 (F ^ {\ mathrm {T}} Fp_ {opt} -F ^ {\ mathrm {T} } d_ {obs}) = 0 \,}

где F обозначает транспонирование матрицы F. Это уравнение упрощается до:

FTF popt = FT dobs {\ displaystyle F ^ {\ mathrm {T}} Fp_ {opt} = F ^ {\ mathrm {T}} d_ {obs} \,}{\ displaystyle F ^ {\ mathrm {T}} Fp_ {opt} = F ^ {\ mathrm {T}} d_ {obs} \,}

Это выражение известно как нормальное уравнение и дает нам возможное решение обратной задачи. В нашем примере матрица FTF {\ displaystyle F ^ {\ mathrm {T}} F}{\ displaystyle F ^ {\ mathrm {T}} F} оказывается, как правило, с полным рангом, так что приведенное выше уравнение имеет смысл и однозначно определяет параметры модели: Мы не хотим интегрировать дополнительную информацию для уникального решения.

Математические и вычислительные аспекты

Обратные задачи обычно некорректны, в отличие от хорошо поставленных задач, которые обычно встречаются при математическом моделировании. Из трех условий для правильно поставленной задачи, предложенных Жаком Адамаром (существование, единственность и устойчивость решений или решений), условие чаще всего нарушается. В смысле функционального анализа обратная задача представляет собой представление между метрическими пространствами. Хотя обратные задачи часто формулируются в бесконечном числе измерений пространства, ограничения на конечное число измерений и практическое восстановление только конечного числа неизвестных параметров. В этом случае обратная задача обычно будет плохо обусловлена ​​. В этих случаях регуляризация другая установка для введения мягких допущений в решение и предотвращение переобучения. Многие примеры регуляризованных обратных задач можно интерпретировать как частные случаи байесовского вывода.

Численное решение задачи оптимизации

Некоторые обратные задачи имеют очень простое решение, например, когда имеется набор из нерастворимых функций, что означает набор n {\ displaystyle n}n функций, которые оценивают их в n {\ displaystyle n}n различных точек дает набор линейно независимых векторов. Это означает, что при линейной комбинации функций этих функций можно вычислить расположение как матрица матрицы и затем инвертируя эту матрицу. Простейшим примером неизольвентных функций являются многочленные, построенные с использованием теоремы о неразрывности, чтобы быть неизольвентными. Конкретно это делается путем инвертирования матрицы Вандермонда. Но это очень специфическая ситуация.

В общем, решение обратной задачи требует сложных алгоритмов оптимизации. Когда модель описывается большими параметрами (количество неизвестных, используемых в некоторых приложениях дифракционной томографии, может достигать одного миллиарда), решение линейной системы, используется с норм уравнениями, может быть обременительным. Численный метод, который предложит решение для решения задачи, зависит, в частности, от затрат, необходимых для вычислений F p {\ displaystyle Fp}{\ displaystyle Fp} прямые задачи. После выбора подходящего алгоритма для решения прямые задачи (простое умножение матрицы на вектор может быть неадекватным, если матрица F {\ displaystyle F}F огромна) соответствующий алгоритм для выполнения минимизации можно найти в учебниках, посвященных численным методам решения линейных систем и минимизации квадратичных функций (см., например, Ciarlet или Nocedal).

Кроме того, пользователь может пожелать добавить ограничения к моделям: в этом случае они должны быть знакомы с методами оптимизации с ограничениями, что само по себе по себе предметом. Во всех случаях вычисления решения градиента функции часто используются функции оптимизации. Как упоминалось выше, информация о пространственном распределении распределенного параметра может быть введена посредством параметров. Можно также подумать об адаптации этой параметра во время оптимизации.

Если целевая функция основана на норме, отличной от евклидовой нормы, мы должны выйти из области квадратичной оптимизации. В результате задачи оптимизации усложняется. В частности, когда норма L 1 {\ displaystyle L ^ {1}}L ^ {1} используется для количественной оценки несоответствия данных, целевая функция больше не дифференцируема: ее градиент больше не имеет смысла. На помощь приходят специальные методы (см. Например, Lemaréchal) недифференцируемой оптимизации.

После того, как оптимальная модель рассчитана, мы должны ответить на вопрос: «Можем ли мы доверять эту модель?» Вопрос можно следующим образом: насколько великим набор моделей, которые соответствуют данным «почти так же хорошо», как эта модель? В случаератиратичных целевых функций этот набор в гиперэллипсоиде, подмножестве RM {\ displaystyle {R} ^ {M}}{\ displaystyle {R} ^ {M}} (M {\ displaystyle M}M - количество неизвестных), размер которых зависит от того, что мы подразумеваем под «почти так же хорошо», то есть от уровня шума. Направление наибольшей оси эллипсоида (собственный вектор, связанный с наименьшим собственным значением матрицы FTF {\ displaystyle F ^ {T} F}{\ displaystyle F ^ {T} F} ) - это направление плохо детерминированные компоненты: если Мы будем следовать в этом направлении, мы сможем выполнить сильное возмущение в этом направлении. Мы ясно видим, что ответ на вопрос «мы можем доверять эту модель» определяет уровень шума и собственными значениями гессиана целевые функции или, что эквивалентно, в случае, когда регуляризация не проводилась. интегрированы по сингулярным значениям матрицы F {\ displaystyle F}F . Конечно, использование других видов априорной информации увеличивает размер почти оптимальных решений.

Стабильность, регуляризация и дискретизация модели в бесконечном измерении

Здесь мы сосредотачиваемся на восстановленном распределенном параметре. При поиске распределенных параметров мы должны дискретизировать эти неизвестные функции. Поступая так, мы уменьшаем размер проблемы до чего-то конечного. Но теперь возникает вопрос: есть ли какая-либо связь между решением, которое мы вычисляем, и решением исходной проблемы? Тогда еще вопрос: что мы подразумеваем под решением исходной задачи? Конечное число данных не позволяет определить бесконечное количество неизвестных исходный функционал несоответствия данных должен быть регуляризован, чтобы уникальность решения была. Краткое сокращение до конечного пространства обеспечивает адекватную регуляризацию: вычисленное решение будет выглядеть как дискретная версия решения, которое мы искали. Например, наивная дискретизация часто срабатывает для решения проблемы деконволюции : она будет работать до тех пор, пока мы не позволим пропущенным частотам в численном решении. Регляризация должна быть явно интегрирована в целевую функцию.

Чтобы понять, что может произойти, мы должны помнить, что решение такое линейной обратной задачи сводится к решению интегрального уравнения Фредгольма первого рода:

d (x) = ∫ Ω K (x, y) p ( y) dy {\ displaystyle d (x) = \ int _ {\ Omega} K (x, y) p (y) dy}{\ displaystyle d (x) = \ int _ {\ Omega} К (x, y) p (y) dy}

где K {\ displaystyle K}K - ядро, x {\ displaystyle x}x и y {\ displaystyle y}y - горизонт R 2 {\ displaystyle {R} ^ {2} }{\ displaystyle {R} ^ {2}} и Ω {\ displaystyle {\ Omega}}{\ Omega} - это домен в R 2 {\ displaystyle {R} ^ {2}}{\ displaystyle {R} ^ {2}} . Это справедливо для 2D-приложения. Для 3D-приложения мы рассматриваем x, y ∈ R 3 {\ displaystyle x, y \ in {R} ^ {3}}{\ displaystyle x, y \ in {R} ^ {3}} . Обратите внимание, что здесь параметры модели p {\ displaystyle p}состоят p состоят из функций, а ответ модели также из функций, обозначенной d (x) {\ displaystyle d (x)}d (x) . Это уравнение является расширением до бесконечности матричного уравнения d = F p {\ displaystyle d = Fp}{\ дис playstyle d = Fp} , данного в случае дискретных задач.

Для достаточно гладких K {\ displaystyle K}K оператор, определенный выше, компактный в разумных банаховых пространствах, таких как L 2 {\ displaystyle L ^ {2}}L ^ {2} . F. Теория Рисса утверждает, что набор сингулярных значений такого оператора содержит ноль (отсюда существование нулевого пространства), конечным или не более чем счетным, и в последнем случае они составляют последовательность, которая идет к нуль. В случае симметричного ядра у нас есть бесконечное количество собственных значений, а соответствующие собственные векторы составляют гильбертов базис L 2 {\ displaystyle L ^ {2}}L ^ {2} . Таким образом, любое решение этого уравнения определяется с точностью до аддитивной функции в нулевом пространстве, и в случае бесконечности сингулярных значений решение (которое включает обратную величину произвольных малых собственных значений) является нестабильным: два ингредиента, которые делают решение этого интегрального уравнения - типичная некорректная задача! Однако мы можем определить решение через псевдообратное прямого отображения (опять же с точностью до произвольной аддитивной функции). Когда прямая карта компактна, классическая регуляризация Тихонова будет работать, если мы будем использовать ее для интеграции априорной информации, утверждающей, что L 2 {\ displaystyle L ^ {2}}L ^ {2} Норма решения должна быть как можно меньше: это сделает обратную задачу корректной. Тем не менее, мы должны подвергнуться сомнению нашу уверенность в вычисленном решении. Опять же, в основном информация заключается в собственных значениях оператора Гессе. Если для вычисления решения исследовать подпространства, содержащие собственные векторы, связанные с небольшими собственными значениями, то этому решению вряд ли можно будет доверять: некоторые из его компонентов будут плохо определены. Наименьшее собственное значение равно весу, введенному в регуляризации Тихонова.

Неправильные ядра могут дать прямую карту, которая не является компактной и даже неограниченной, если мы наивно снабдим пространство моделей L 2 {\ displaystyle L ^ {2}}L ^ {2} норм. В таких случаях гессиан не является ограниченным оператором, и понятие собственного значения теряет смысл. Требуется математический анализ, чтобы сделать его ограниченным оператором и разработать хорошо поставленную задачу: иллюстрацию можно найти в. Опять же, мы должны подвергнуть сомнению нашу уверенность в вычисленном решении, и у нас есть чтобы обобщить понятие собственного значения, чтобы получить ответ.

Анализ спектра оператора Гессе, таким образом, является ключевым элементом для определения надежности вычисленного решения. Однако такой анализ обычно является очень сложной задачей. Это побудило некоторых авторов исследовать альтернативные подходы в случае, когда нас интересуют не все компоненты неизвестной функции, а только под-неизвестные, которые являются образами неизвестной функции линейным оператором. Эти подходы упоминаются как «метод Бэкуса и Гилберта», подход «часовых» Лайонса и метод SOLA: эти подходы оказались тесно связаны друг с другом, как объясняется в Chavent. Наконец, концепция с ограниченным разрешением, часто применяемый физиками, является не чем иным, как особым взглядом на то, что некоторые плохо определенные компоненты могут испортить решение. Но, вообще говоря, эти плохо определенные компоненты модели не обязательно связаны с высокими частотами.

Некоторые классические линейные обратные задачи для восстановления распределенных параметров

Упомянутые ниже задачи соответствуют различным версиям интеграла Фредгольма: каждая из них связана с определенным ядром K { \ displaystyle K}K .

Деконволюция

Цель деконволюции - восстановить исходное изображение или сигнал p (x) {\ displaystyle p (x)}p (x) который выглядит зашумленным и размытым на данных d (x) {\ displaystyle d (x)}d (x) . С математической точки зрения ядро ​​K (x, y) {\ displaystyle K (x, y)}K (x, y) здесь зависит только от разницы между x {\ displaystyle x}x и y {\ displaystyle y}y .

Томографические методы

В этих методах мы пытаемся восстановить распределенный параметр, наблюдая в измерении интегралов этого механизма, выполняемого по семейству линий. Обозначим через Γ x {\ displaystyle {\ Gamma _ {x}}}{\ displaystyle {\ Gamma _ {x}}} линию в этом семействе, точку с точкой измерения x {\ displaystyle x}x . Наблюдение в x {\ displaystyle x}x , таким образом, можно записать как:

d (x) = ∫ Γ xw (x, y) p (y) ds {\ displaystyle d (x) = \ int _ {\ Gamma _ {x}} w (x, y) p (y) \, ds}{\ displaystyle d (x) = \ int _ {\ Gamma _ {x}} w (x, y) p (y) \, ds}

где s {\ displaystyle s}s - длина дуги вдоль Γ x {\ displaystyle {\ Gamma _ {x}}}{\ displaystyle {\ Gamma _ {x}}} и w (x, y) {\ displaystyle w (x, y)}w (x, y) известная весовая функция. Сравнивая это уравнение с интегралом Фредгольма выше, мы замечаем, что ядро ​​K (x, y) {\ displaystyle K (x, y)}K (x, y) является своего рода дельта-функция, который достигает пика на линии Γ x {\ displaystyle {\ Gamma _ {x}}}{\ displaystyle {\ Gamma _ {x}}} . С таким ядром прямое отображение не компактно.

Компьютерная томография

В рентгеновской компьютерной томографии линии, на которых интегрируется параметр, являющиеся прямыми линиями: томографическая реконструкция распределение основано на инверсии преобразования Радона. Многие линейные обратные задачи хорошо изучены, связанные с преобразованием Радона и его обобщениями, по-прежнему совокупность теоретических проблем, а вопросы достаточности данных все еще не решены. Проблемы, связанные с проблемой пространственного рентгеновского преобразования, связаны с обобщением рентгеновского преобразования на тензорные поля. Исследуемые решения включают метод алгебраической реконструкции, обратную проекцию с фильтром, а по мере увеличения вычислительной мощности методы итерационной реконструкции, такие как .

Дифракционная томография

Дифракционная томография - это классическая линейная обратная задача в разведочной сейсмологии: амплитуда, модель за один раз для данной пары источник-приемник, представляет собой сумму вкладов, определяющих от таких точек, что сумма расстояний, измеренное во времени пробега от источник и приемника, соответствующего времени записи. В 3D параметр интегрируется не по линиям, а по поверхностям. Если скорость распространения постоянна, такие точки располагаются на эллипсоиде. Обратные задачи заключаются в восстановлении распределения точек дифрагирования по сейсмограмм, записанным вдоль съемки, при известном распределении скоростей. Прямое решение было применено Бейлкиным и Ламбаре и др.: Эти работы были отправлены точками подходами, известными как миграция с сохранением амплитуды амплитуды (см. Бейлкин и Блейстейн). Если для решения волнового уравнения использовать методы геометрической оптики (т.е. лучи ), эти методы используя методы наименьших квадратов, полученными на основе подходящих наименьших квадратов (см. Лайи, Тттола).

Доплеровская томография (астрофизика)

Если мы рассмотрим вращающийся звездный объект, спектральные линии, которые мы наблюдаем на спектральном профиле, будут смещены из-за эффекта Доплера. Доплеровская томография направлена ​​на преобразование информации, содержащейся в спектральном мониторинге объекта, в двумерное изображение (функции лучевой скорости и фазы в периодическом вращательном движении) звездной атмосферы. Как объяснил Марш, эта линейная обратная задача похожа на томографию: мы должны восстановить распределенный параметр, который интегрирован по линиям.

Нелинейные обратные задачи

Нелинейные обратные задачи предоставить собой более сложное семейство обратных задач. Здесь прямая карта F {\ displaystyle F}F является нелинейным оператором. Моделирование физических явлений часто основывается на уравнениях в частных производных (см. Таблицу выше, за исключением законов гравитации): эти уравнения в частных производных уравнениях, параметры, которые появляются в этих уравнениях частных производных систем, следовательно, наши наблюдения за ней.

Некоторые классические нелинейные обратные задачи

Обратные задачи рассеяния

В то время как линейные обратные задачи были полностью решены с теоретической точки зрения в конце девятнадцатого века, только один класс нелинейных обратных задач Задач был таковым до 1970 года, класс обратных спектральных задач и (одномерного пространственного измерения) обратных задач рассеяния, после основополагающей работы русской математической школы (Крейн, Гельфанд, Левитан, Марченко ). Большой обзор результатов был дан Чаданом и Сабатье в их книге «Обратные задачи квантовой теории рассеяния» (два издания на английском языке, одно на русском).

В задаче такого типа данные - это свойства линейного оператора, описывающие рассеяние. Спектр состоит из собственных значений и собственных функций, образующих вместе «дискретный спектр», и обобщений, называемых непрерывным спектром. Очень примеченный физический момент в том, что эксперименты по рассеянию дают только непрерывный спектре. Следовательно, у нас есть невидимые параметры, более интересные, чем нулевое пространство, способным свойством в линейных обратных задачах. Кроме того, существуют физические движения, в которых наблюдается спектр такого движения как следствие такого движения. Это явление регулируется специальными нелинейными уравнениями эволюции в частных производных, например уравнением Кортевега - де Фриза. Текущее движение представляет собой движение одиночного выступа, распространяемого с помощью общей скорости и без деформации, уединенная волна, называемая «солитоном ».

Совершенный сигнал и его обобщения для уравнений Кортевега - де Фриза или других интегрируемых нелинейных уравнений в частных производных представленных большой интерес и имеют множество приложений. Эта область изучается как раздел математической физики с 1970-х годов. Нелинейные обратные задачи в области прикладной науки (акустика, механика, квантовая механика, электромагнитное рассеяние - в частности, радиолокационное зондирование, сейсмическое зондирование и все методы построения изображений).

Последний пример, связанный с гипотезой Римана, был дан Ву и Спрунгом, идея в том, что в полуклассической старой квантовой теории инверсия Внутри гамильтониана пропорциональна полупроизводной собственных значений (энергий), считающую функцию n (x).

Согласование проницаемости в нефтяных и газовых коллекторах

Цель состоит в том, чтобы восстановить коэффициент диффузии в параболическом состоянии в частных производственных, которое моделирует однофазные потоки флюида в пористой среде. Эта проблема была проведена многих исследований, начиная с новаторской работы, выполненной в начале семидесятых годов. Что касается двухфазных потоков, информация является относительной проницаемостью и капиллярного давления.

Обратные задачи в волновых уравнениях

Цель состоит в том, чтобы восстановить волновые скорости (P и S волн) и распределения плотности из сейсмограмм. Такие обратные задачи включают первостепенный интерес в сейсмологии. В основном мы можем рассмотреть две математические модели:

Эти базовые гиперболические уравнения могут быть обновлены путем включения затухания, анизотропия,...

Решение обратной задачи в одномерном волновом уравнении было объектом многих исследований. Это одна из немногих нелинейных обратных задач. Другая проблема был анализ устойчивости решения. Были разработаны практические приложения, использующие метод наименьших квадратов. Попытки расширения на двумерные или трехмерные задачи и на уравнения эластодинамики предпринимались с 80-х годов, но это оказалось очень трудным! Эта проблема, которую часто называют полной инверсией формы (FWI), еще не решена полностью: одна из основных трудностей - хаотическое поведение функции несоответствия данных. Некоторые авторыали возможность переформулирования обратной задачи, чтобы сделать целевую функцию менее хаотичной, чем функция несоответствия данных.

Томография времени пробега

Понимание того, насколько сложна обратная задача в волновое уравнение, сейсмологи исследовали упрощенный подход с использованием геометрической оптики. В частности, они были нацелены на инверсию распределения скорости распространения, зная времена прихода волновых фронтов, наблюдаемых на сейсмограммах. Эти волновые фронты могут быть связаны с прямыми приходами или с отражателями, связанными с отражателями, геометрия которых должна быть определена вместе с распределением скорости.

Распределение времени прибытия τ (x) {\ displaystyle {\ tau} (x)}{\ displaystyle {\ tau} (x)} (x {\ displaystyle x}x - точка в физическом пространстве) волнового фронта, испускаемое точечным способом, удовлетворяет уравнению Эйконала :

‖ ∇ τ (x) ‖ = s (x), {\ displaystyle \ | \ набла {\ тау} (х) \ | = s (x),}{\ displaystyle \ | \ nabla {\ tau} (x) \ | = s (x),}

где s (x) {\ displaystyle s (x)}s ( х) обозначает распределение медленности (обратное скорость). Наличие ‖ ‖ {\ displaystyle \ | \ |}{\ displaystyle \ | \ |} делает это уравнение нелинейным. Классически она решается путем выстрела лучей (траектории, время прихода стационарно) от точечного источника.

Эта проблема похожа на томографию: измеренные времена прихода интегралом вдоль пути луча от медленности. Эта проблема, подобная томографии, является нелинейной, главным образом, потому что неизвестная геометрия траектории луча зависит от распределения скорости (или медленности). Невзирая на свой нелинейный характер, показано, что это последнее определение скорости распространения в пространстве или в недрах, последнее является ключевым элементом для построения функций, в частности, с использованием методов, указанных в разделе «Дифракция». томография ".

Математические аспекты: вопросы Адамара

Вопросы касаются корректности: есть ли у задач наименьших квадратов единственное решение, которое постоянно зависит от данных (проблема стабильности)? Сложен из-увидеть нелинейности F {\ displaystyle F}F . Чтобы, откуда возникают трудности, Чавент использует концептуально разделить функции несоответствия данных на два последовательных шага (P adm {\ displaystyle P_ {adm}}{\ displaystyle P_ {adm}} - это подмножество допустимые модели):

  • шагции: задано dobs {\ displaystyle d_ {obs}}{\ displaystyle d_ {obs}} найти проекцию на F ( P adm) {\ displaystyle F (P_ {adm})}{\ displaystyle F (P_ {adm})} (ближайшая точка на F (P adm) {\ displaystyle F (P_ {adm})}{\ displaystyle F (P_ {adm})} в Определите расстояние с помощью используемого в соответствии с целевым набором функций)
  • с учетом этой проекции выберите один прообраз, который использует модель, изображение которой с помощью оператора F {\ displaystyle F}F является этой проекцией.

Проблемы могут быть - и обычно - возникают на обоих этапах:

  1. оператор F {\ displaystyle F}F вряд ли будет взаимно однозначным, поэтому может быть более одного прообраза,
  2. , даже если F {\ displaystyle F}F является взаимно однозначным, его обратное значение не может быть непрерывным более F (P) {\ displaystyle F (P)}{\ displaystyle F (P)} ,
  3. проекция на F (P adm) {\ displaystyle F (P_ {adm})}{\ displaystyle F (P_ {adm})} может не существовать, если этот набор не должен быть замкнутым,
  4. проекция на F (P adm) {\ displaystyle F (P_ {adm})}{\ displaystyle F (P_ {adm})} может быть неуникальной и не непрерывной, как это может быть невыпуклым из-за нелинейности F {\ displaystyle F}F .

Мы обращаемся к Чавенту за математическим анализом этих точек.

Вычислительные аспекты

Невыпуклая функция несоответствия данных

Прямая карта нелинейна, функция несоответствия данных, вероятно, будет невыпуклой, что делает методы минимизации неэффективными. Несколько подходов были исследованы для преодоления этих трудностей:

  • использование методов глобальной оптимизации, как выбор апостериорной функции плотности и алгоритм Метрополиса в вероятностной структуре обратной задачи, генетические алгоритмы (отдельно или в сочетании с Алгоритм Метрополиса: см Приложение для определения проницаемости, которое соответствует существующим данным о проницаемости, нейронные сети, методы регуляризации, включая многомасштабный анализ;
  • переформулировка функций задачи наименьших квадратов, чтобы сделать ее более гладкой (См. Обратную задачу в волновых уравнениях.)

Вычисление градиента функции функции

Обратные задачи, особенно в бесконечном измерении, могут иметь большой размер, что требует значительного времени вычислений. Когда прямое отображение является нелинейным, сложные трудности возрастают, и минимизация функции может быть сложной. В отличие от линейной ситуации, явное использование матрицы Гессе для решения нормальных соотношений здесь не имеет смысла: матрица Гессе меняется в зависимости от модели. Гораздо более эффективным является оценка градиента функции для некоторых моделей. Значительные вычислительные усилия можно сэкономить, если мы сможем избежать очень сложных вычислений якобиана (часто называемого «производными Фреше »): метод сопряженных состояний, предложенный Чавентом и Лионсом, направлен на то, чтобы избежать этого очень тяжелого вычисления. В настоящее время она очень широко используется.

Приложения

Теория обратных задач широко используется в прогнозировании погоды, океанографии, гидрологии и нефтяной инженерии.

Обратные задачи также встречаются в области теплопередачи, где поверхностный тепловой поток оценивается на основе температурных данных, измеренных внутри твердого тела. Линейная обратная задача также используется спектральной оценки и оценки направления прихода (DOA) в обработке сигналов.

См. Также

Академические журналы

Четыре основных академических журнала освещают обратные задачи в целом:

  • Обратные задачи
  • Журнал обратных и некорректно поставленных задач
  • Обратные задачи в науке и технике
  • Обратные задачи и отображение

Во многих журналах по медицинской визуализации, геофизике, неразрушающему контролю и туберкулезу. д. преобладают обратные задачи в этих областях.

Ссылки
Ссылки
  • Chadan, Khosrow Sabatier, Pierre Célestin (1977). Обратные задачи квантовой теории рассеяния. Springer-Verlag. ISBN 0-387-08092-9
  • Астер, Ричард; Борчерс, Брайан и Тербер, Клиффорд (2018). Оценка параметров и обратные задачи, третье издание, Elsevier. Нажмите ISBN 9780128134238, ISBN 9780128134238
  • , WH; Теукольский С.А.; Феттерлинг, штат Вашингтон; Фланнери, ВР (2007). «Раздел 19.4. Обратные задачи и априорной информации ». Числовые рецепты: искусство научных вычислений (3-е изд.). Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-88068-8.
Дополнительная литература
  • C. В. Гротч (1999). Обратные задачи: занятия для студентов. Издательство Кембриджского университета. ISBN 978-0-88385-716-8.
Внешние ссылки
Последняя правка сделана 2021-05-24 05:41:11
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте