Оптимизация траектории

редактировать

Оптимизация траектории - это процесс проектирования траектории, которая минимизирует ( или максимизирует) некоторую меру производительности при соблюдении набора ограничений. Вообще говоря, оптимизация траектории - это метод вычисления решения без обратной связи для задачи оптимального управления. Он часто используется для систем, где вычисление полного решения с обратной связью не требуется, непрактично или невозможно. Если задача оптимизации траектории может быть решена со скоростью, обратной константе Липшица, то ее можно итеративно использовать для генерации решения с обратной связью в смысле Каратеодори. Если для задачи с бесконечным горизонтом выполняется только первый шаг траектории, то это известно как Model Predictive Control (MPC).

Хотя идея оптимизации траектории существует уже сотни лет (вариационное исчисление, проблема брахистохрона ), оно стало практичным для реальных задач только с появлением компьютера. Многие из первоначальных приложений оптимизации траектории находились в аэрокосмической промышленности, вычисляя траектории запуска ракет. В последнее время оптимизация траектории также использовалась в широком спектре промышленных процессов и робототехники.

Содержание

1 История
2 Области применения
- 2.1 Квадрокоптерные вертолеты
- 2.2 Производство
- 2.3 Шагающие роботы
- 2.4 Аэрокосмическая промышленность
3 Терминология
4 Методы оптимизации траектории
- 4.1 Одиночная съемка
- 4.2 Многократная съемка
- 4.3 Прямое совмещение
- 4.4 Ортогональное сопоставление
- 4.5 Псевдоспектральное сопоставление
- 4.6 Дифференциальное динамическое программирование
5 Сравнение методов
- 5.1 Непрямое и прямое методы
- 5.2 Съемка и коллокация
- 5.3 Уточнение сетки: h и p
6 Программное обеспечение
7 Ссылки

История

Оптимизация траектории впервые появилась в 1697 году, когда введение проблемы Брахистохрона: найти такую форму проволоки, чтобы шарик, скользящий по ней, перемещался между двумя точками за минимальное время. В этой задаче интересно то, что она оптимизирует кривую (форму провода), а не одно число. Наиболее известное из решений было вычислено с использованием вариационного исчисления.

В 1950-х годах цифровые компьютеры начали использовать оптимизацию траектории для решения реальных задач. Первые подходы к оптимальному управлению выросли из вариационного исчисления, основанного на исследованиях Гилберта Эймса Блисса и Брайсона в Америке и Понтрягина в России. Следует особо отметить принцип максимума Понтрягина. Эти первые исследователи заложили основу того, что мы сейчас называем косвенными методами оптимизации траектории.

Большая часть ранних работ по оптимизации траектории была сосредоточена на вычислении профилей тяги ракет как в вакууме, так и в атмосфере. Это раннее исследование обнаружило многие основные принципы, которые используются до сих пор. Еще одним успешным применением был набор высотных траекторий для первых реактивных самолетов. Из-за высокого лобового сопротивления, связанного с околозвуковой областью лобового сопротивления и низкой тягой первых реактивных самолетов, оптимизация траектории была ключом к максимальному увеличению набора высоты до высотных характеристик. Траектории, основанные на оптимальном управлении, установили некоторые мировые рекорды. В этих ситуациях пилот следовал графику зависимости числа оборотов от высоты, основанному на оптимальных решениях управления.

Одной из важных ранних проблем оптимизации траектории была проблема особой дуги, где принцип максимума Понтрягина не дает полного решения. Примером задачи с единичным управлением является оптимизация тяги ракеты, летящей на постоянной высоте и запускаемой с малой скоростью. Здесь проблема заключается в управлении взрывом при максимально возможной тяге до тех пор, пока не будет достигнута особая дуга. Тогда решение сингулярного управления обеспечивает более низкую регулируемую тягу до полного сгорания. В этот момент управление взрывом обеспечивает, что управление или тяга достигают минимального значения, равного нулю. Это решение лежит в основе широко используемого сегодня профиля ракетного двигателя с форсированным двигателем для максимального увеличения характеристик ракет.

Приложения

Существует множество приложений для оптимизации траектории, в первую очередь в робототехнике: промышленность, манипуляции, ходьба, планирование пути и аэрокосмическая промышленность. Его также можно использовать для моделирования и оценки.

Вертолеты с квадрокоптером

Оптимизация траектории часто используется для расчета траекторий для вертолетов с квадрокоптером. Эти приложения обычно использовали узкоспециализированные алгоритмы. Одно интересное приложение, показанное U.Penn GRASP Lab, вычисляет траекторию, которая позволяет квадрокоптеру пролетать через обруч при его бросании. Другой, на этот раз на ETH Zurich Flying Machine Arena, включает в себя два квадрокоптера, которые бросают между собой шест взад и вперед, балансируя его как перевернутый маятник. Недавно была изучена проблема расчета траекторий с минимальной энергией для квадрокоптера.

Производство

Оптимизация траектории используется в производстве, в частности, для управления химическими процессами (например, в) или вычисления желаемого пути для роботов-манипуляторов (например, в).

Шагающие роботы

Есть множество различных приложений для оптимизации траектории в области шагающей робототехники. Например, в одной статье использовалась оптимизация траектории двуногой походки на простой модели, чтобы показать, что ходьба энергетически выгодна для движения с низкой скоростью, а бег энергетически выгоден для движения с высокой скоростью. Как и во многих других приложениях, оптимизация траектории может использоваться для вычисления номинальной траектории, вокруг которой построен стабилизирующий контроллер. Оптимизация траектории может применяться при детальном планировании движения сложных гуманоидных роботов, таких как Atlas. Наконец, оптимизация траектории может использоваться для планирования пути роботов со сложными динамическими ограничениями с использованием моделей пониженной сложности.

Aerospace

Для тактических ракет профили полета определяются историей тяги и подъемной силы. Этими историями можно управлять с помощью ряда средств, включая такие методы, как использование истории команд угла атаки или графика высоты / дальности, которому должна следовать ракета. Каждая комбинация факторов конструкции ракеты, желаемых характеристик ракеты и ограничений системы приводит к новому набору оптимальных параметров управления.

Терминология

Переменные решения: Набор неизвестных, которые необходимо найти с помощью оптимизация.

Задача оптимизации траектории: Особый тип задачи оптимизации, в которой переменные решения являются функциями, а не действительными числами.

Оптимизация параметров: Любая задача оптимизации, в которой переменные решения являются действительными числами.

Нелинейная программа: Класс оптимизации параметров с ограничениями, в котором либо целевая функция, либо ограничения являются нелинейными.

Косвенный метод: Косвенный метод решения задачи оптимизации траектории состоит из трех этапов: 1) Аналитически построить необходимые и достаточные условия для оптимальности, 2) Дискретизировать эти условия, построив задачу оптимизации с ограниченными параметрами, 3) Решить эту задачу оптимизации.

Прямой метод: Директория Метод ect для решения задачи оптимизации траектории состоит из двух шагов: 1) непосредственно дискретизировать задачу оптимизации траектории, преобразовав ее в задачу оптимизации с ограниченными параметрами, 2) Решить эту задачу оптимизации.

Транскрипция: Процесс при котором задача оптимизации траектории преобразуется в задачу оптимизации параметров. Иногда это называют дискретизацией. Методы транскрипции обычно делятся на две категории: методы стрельбы и методы коллокации.

Метод стрельбы: Метод транскрипции, основанный на моделировании, обычно с использованием явных схем Рунге-Кутты.

Метод коллокации (одновременный Method): Метод транскрипции, основанный на аппроксимации функции, обычно с использованием неявных схем Рунге-Кутты.

Псевдоспектральный метод (глобальное коллокация): Метод транскрипции, представляющий вся траектория как единый ортогональный полином высокого порядка.

Сетка (сетка): После транскрипции ранее непрерывная траектория теперь представлена дискретным набором точек, известных как точки сетки или точки сетки.

Уточнение сетки: Процесс, посредством которого сетка дискретизации улучшается путем решения последовательности задач оптимизации траектории. Уточнение сетки выполняется либо путем разделения сегмента траектории, либо путем увеличения порядка полинома, представляющего этот сегмент.

Задача оптимизации многофазной траектории: Оптимизация траектории в системе с гибридной динамикой может быть достигнута путем постановки задачи оптимизации многофазной траектории. Это достигается путем составления последовательности стандартных задач оптимизации траектории, которые связаны с помощью ограничений.

Методы оптимизации траектории

Методы решения любых задач оптимизации можно разделить на две категории: косвенные и прямой. Косвенный метод работает путем аналитического построения необходимых и достаточных условий оптимальности, которые затем решаются численно. Прямой метод пытается получить прямое численное решение путем построения последовательности непрерывно улучшающихся приближений к оптимальному решению. Прямые и косвенные методы могут быть смешаны путем применения принципа сопоставления ковекторов из Росс и Фахру.

Задача оптимального управления - это бесконечномерная задача оптимизации, поскольку переменные решения - это функции, а не действительные числа. Все методы решения выполняют транскрипцию - процесс, с помощью которого задача оптимизации траектории (оптимизация по функциям) преобразуется в задачу оптимизации с ограниченными параметрами (оптимизация по действительным числам). Как правило, эта задача оптимизации с ограниченными параметрами представляет собой нелинейную программу, хотя в особых случаях ее можно свести к квадратичной программе или линейной программе.

одиночной съемке

одиночной стрельба - это простейший метод оптимизации траектории. Основная идея похожа на то, как вы прицелились бы из пушки: выберите набор параметров для траектории, смоделируйте все, а затем проверьте, попали ли вы в цель. Вся траектория представлена в виде одного сегмента с одним ограничением, известным как ограничение дефекта, требующим, чтобы конечное состояние моделирования соответствовало желаемому конечному состоянию системы. Покадровая съемка эффективна для решения простых задач или задач с очень хорошей инициализацией. Как при непрямой, так и при прямой постановке, как правило, возникают трудности в противном случае.

Многократная съемка

Многократная съемка - это простое расширение одиночной съемки, которое делает ее гораздо более эффективной. Вместо того, чтобы представлять всю траекторию как единое моделирование (сегмент), алгоритм разбивает траекторию на множество более коротких сегментов, и между ними добавляется ограничение дефекта. В результате получается большая разреженная нелинейная программа, которую, как правило, легче решить, чем небольшие плотные программы, созданные одиночной съемкой.

Прямое сопоставление

Методы прямого сопоставления работают путем аппроксимации состояния и управлять траекториями с помощью полиномиальных сплайнов. Эти методы иногда называют прямой транскрипцией. Трапециевидное совмещение - широко используемый метод прямого сопоставления низкого порядка. Динамика, цель траектории и управление представлены с помощью линейных шлицев, а динамика удовлетворяется с помощью трапециевидной квадратуры. Коллокация Эрмита-Симпсона - это распространенный метод прямого сопоставления среднего порядка. Состояние представлено кубическим сплайном Эрмита, а динамика удовлетворяется с помощью квадратур Симпсона.

Ортогональное сопоставление

Ортогональное сопоставление технически является подмножеством прямого сопоставления, но детали реализации настолько различны, что его можно с полным основанием считать собственным набором методов. Ортогональное совмещение отличается от прямого сочетания тем, что оно обычно использует сплайны высокого порядка, и каждый сегмент траектории может быть представлен сплайном другого порядка. Название происходит от использования ортогональных многочленов в сплайнах состояния и управления.

Псевдоспектральное сопоставление

Псевдоспектральное сопоставление, также известное как глобальное сопоставление, является подмножеством ортогонального сопоставления, в котором вся траектория представлен одним ортогональным многочленом высокого порядка. В качестве примечания: некоторые авторы используют ортогональное сочетание и псевдоспектральное сочетание как синонимы. При использовании для решения задачи оптимизации траектории, решение которой является плавным, псевдоспектральный метод обеспечивает спектральную (экспоненциальную) сходимость.

Дифференциальное динамическое программирование

Дифференциальное динамическое программирование, является немного отличается от других описанных здесь методов. В частности, в нем нет четкого разделения транскрипции и оптимизации. Вместо этого он выполняет последовательность итеративных проходов вперед и назад по траектории. Каждый прямой проход удовлетворяет динамике системы, а каждый обратный проход удовлетворяет условиям оптимальности для управления. В конце концов, эта итерация сходится к траектории, которая является одновременно достижимой и оптимальной.

Сравнение методов

Есть много методов, из которых можно выбирать при решении задачи оптимизации траектории. Лучшего метода не существует, но некоторые методы могут лучше справиться с конкретными проблемами. В этом разделе дается общее представление о компромиссах между методами.

Непрямые и прямые методы

При решении задачи оптимизации траектории косвенным методом вы должны явно построить сопряженные уравнения и их градиенты. Часто это сложно сделать, но это дает отличную метрику точности решения. Прямые методы намного проще настроить и решить, но они не имеют встроенной метрики точности. В результате более широко используются прямые методы, особенно в некритических приложениях. Косвенные методы все еще используются в специализированных приложениях, особенно в аэрокосмической сфере, где точность имеет решающее значение.

Одно место, где косвенные методы вызывают особые трудности, - это проблемы с ограничениями неравенства путей. Эти проблемы обычно имеют решения, для которых ограничение частично активно. При построении сопряженных уравнений для косвенного метода пользователь должен явно записать, когда ограничение активно в решении, что трудно знать априори. Одним из решений является использование прямого метода для вычисления начального предположения, которое затем используется для построения многоэтапной задачи, в которой задано ограничение. Результирующая проблема может быть затем решена с высокой точностью косвенным методом.

Съемка против коллокации

Методы одиночной съемки лучше всего использовать для задач, где управление очень простое (или есть очень хорошее первоначальное предположение). Например, задача планирования миссии спутника, где единственным контролем является величина и направление начального импульса от двигателей.

Многократная стрельба обычно хороша для задач с относительно простым управлением, но сложной динамикой. Хотя ограничения пути могут использоваться, они делают результирующую нелинейную программу относительно трудной для решения.

Прямые методы совместного размещения хороши для задач, в которых точность управления и состояния схожи. Эти методы имеют тенденцию быть менее точными, чем другие (из-за их низкого порядка), но особенно устойчивы для задач со сложными ограничениями пути.

Методы ортогональной коллокации лучше всего подходят для получения высокоточных решений проблем, где важна точность траектории управления. Некоторые реализации имеют проблемы с ограничениями пути. Эти методы особенно хороши, когда раствор гладкий.

Уточнение сетки: h по сравнению с p

Обычно задачу оптимизации траектории решают итеративно, каждый раз используя дискретизацию с большим количеством точек. h-метод для уточнения сетки работает за счет увеличения количества сегментов траектории вдоль траектории, в то время как p-метод увеличивает порядок метода транскрипции в каждом сегменте.

В методах прямого сопоставления обычно используется уточнение типа h-метода, поскольку каждый метод имеет фиксированный порядок. Как в методах съемки, так и в методах ортогонального коллокации можно использовать h-метод и p-метод уточнения сетки, а в некоторых используется комбинация, известная как адаптивная сетка hp. Лучше всего использовать h-метод, когда решение негладкое, тогда как p-метод лучше всего подходит для гладких решений.

Программное обеспечение

Примеры программ оптимизации траектории включают:

APMonitor : программное обеспечение для крупномасштабной оптимизации, основанное на ортогональном совмещении.
ASTOS : программное обеспечение для анализа, моделирования и оптимизации траектории для космических приложений. Программное обеспечение ASTOS - это многоцелевой инструмент для космических приложений. Первоначально разработанный для оптимизации траектории, теперь он предоставляет модули для различных возможностей анализа, моделирования и проектирования
Bocop - Оптимальный решатель управления : набор инструментов с открытым исходным кодом для оптимального управления (удобный и расширенный графический интерфейс для эффективного использования).
PyKEP, PyGMO (с открытым исходным кодом, от Европейского космического агентства для оптимизации межпланетных траекторий)
Система проектирования и оптимизации траектории Коперника [1]
DIDO
QuickShot : универсальный многопоточный инструмент моделирования траектории 3-DOF / 4-DOF для надежной глобальной оптимизации от SpaceWorks Enterprises, Inc.
DIRCOL : A универсальное программное обеспечение оптимизации траектории на основе прямого сочетания.
Drake : набор инструментов для планирования, управления и анализа нелинейных динамических систем.
FALCON.m : FSD Optimal Control Tool для Matlab, разработан в Институте динамики систем полета Мюнхенского технического университета.
Gekko (оптимизация программного ware) : пакет оптимизации Python с приложениями оптимизации траектории для HALE Aircraft и воздушных буксируемых кабельных систем.
Инструмент анализа общих задач
GPOPS-II (Gобщий P urpose OP timal Control S oftware) Решает многофазные задачи оптимизации траектории. (Matlab)
HamPath : Решение задач оптимального управления косвенными методами и методами отслеживания пути (интерфейсы Matlab и Python).
JModelica.org (платформа с открытым исходным кодом на основе Modelica для динамической оптимизации)
LOTOS (программа оптимизации траектории перехода на орбиту с малой тягой) от Astos Solutions
MIDACO Программа оптимизации, специально разработанная для траекторий межпланетного пространства. (Доступно в Matlab, Octave, Python, C / C ++, R и Fortran)
OpenOCL Открытая библиотека оптимального управления, библиотека моделирования оптимального управления, автоматическое дифференцирование, нелинейная оптимизация, Matlab / Octave.
OTIS (Оптимальные траектории с помощью неявного моделирования) [2]
POST (Программа для оптимизации смоделированных траекторий) [3], [4]
OptimTraj : Библиотека оптимизации траектории с открытым исходным кодом для Matlab
ZOOM, концептуальное проектирование и анализ конфигураций и траекторий ракет) [5]
PSOPT, программный пакет оптимального управления с открытым исходным кодом, написанный на C ++ который использует методы прямого сопоставления [6]
OpenGoddard Программный пакет оптимального управления с открытым исходным кодом, написанный на Python, который использует псевдоспектральные методы.
Systems Tool Kit Astrogator (STK Astrogator) : специализированный модуль анализа орбитального маневра и построения космических траекторий. Astrogator предлагает оптимизацию траектории на основе ортогональных коллокаций с использованием высокоточных моделей сил.
beluga : пакет Python с открытым исходным кодом для оптимизации траектории с использованием косвенных методов.

Набор инструментов оптимизации траектории с малой тягой, включая элементы набора инструментов Low Thrust Trajectory Tool (LTTT) можно найти здесь: Инструменты оптимизации LTTT Suite.

Ссылки

^ Росс, И.М. Учебник по принципу Понтрягина в оптимальном управлении, Collegiate Publishers, Сан-Франциско, 2009.
^Росс, И. Майкл; Сехават, Пуйя; Флеминг, Эндрю; Гун, Ци (март 2008 г.). «Оптимальное управление с обратной связью: основы, примеры и экспериментальные результаты для нового подхода». Журнал наведения, управления и динамики. 31 (2): 307–321. doi : 10,2514 / 1,29532. ISSN 0731-5090.
^300 лет оптимального контроля: от брахистохрона к принципу максимума, Гектор Дж. Суссманн и Ян К. Виллемс. IEEE Control Systems Magazine, 1997.
^Брайсон, Хо, Applied Optimal Control, Blaisdell Publishing Company, 1969, стр. 246.
^Л.С. Понтырагин, Математическая теория оптимальных процессов, Нью-Йорк, Интерсайенс, 1962
^Дэниел Меллингер и Виджай Кумар, «Создание минимальной траектории и управление ими для квадрокоптеров» Международная конференция по робототехнике и автоматизации, IEEE 2011
^Маркус Хен и Рафаэлло Д'Андреа, «Построение траектории в реальном времени для квадрокоптеров» IEEE Transactions on Robotics, 2015.
^Фабио Морбиди, Роэль Кано, Дэвид Лара, «Создание траектории с минимальной энергией для квадрокоптера» в Proc. Международная конференция IEEE по робототехнике и автоматизации, стр. 1492-1498, 2016.
^Джон У. Итон и Джеймс Б. Роулингс. «Модельно-прогнозирующее управление химическими процессами» Химическая инженерия, Том 47, № 4. 1992.
^Т. Четтиби, Х. Лехтихет, М. Хаддад, С. Ханчи, «Планирование траектории с минимальными затратами для промышленных роботов» Европейский журнал механики, 2004.
^Манодж Сринивасан и Энди Руина. «Компьютерная оптимизация минимальной двуногой модели открывает путь к ходьбе и бегу» Nature, 2006.
^E.R. Вестервельт, Дж. Гриззл, Д. Кодичек. «Гибридная нулевая динамика плоских двуногих ходунков» IEEE Transactions по автоматическому управлению, 2003.
^Майкл Поза, Скотт Куиндерсма и Расс Тедрейк. «Оптимизация и стабилизация траекторий для динамических систем со связями». Международная конференция по робототехнике и автоматизации, IEEE 2016.
^Хонгкай Дай, Андрес Валенсуэла и Расс Тедрейк. «Планирование движения всего тела с помощью центроидной динамики и полной кинематики» Международная конференция по роботам-гуманоидам, IEEE 2014.
^Филипс, Калифорния, «Управление энергией для многоимпульсной ракеты», AIAA Paper 88-0334, январь 1988 г.
^ Джон Т. Беттс «Практические методы оптимального управления и оценки с использованием нелинейного программирования» SIAM: достижения в области проектирования и управления, 2010 г.
^Кристофер Л. Дарби, Уильям В. Хагер и Анил В. Рао. «HP-адаптивный псевдоспектральный метод решения задач оптимального управления». Приложения и методы оптимального управления, 2010.
^ Росс, И. Майкл; Д'Суза, Кристофер Н. (июль 2005 г.). «Гибридная оптимальная система управления для планирования миссии». Журнал наведения, управления и динамики. 28 (4): 686–697. doi : 10,2514 / 1,8285. ISSN 0731-5090.
^ Patterson, Michael A.; Рао, Анил В. (2014-10-01). «GPOPS-II: программное обеспечение MATLAB для решения многофазных задач оптимального управления с использованием адаптивных гауссовских квадратурных методов коллокации и разреженного нелинейного программирования». ACM Trans. Математика. Софтв. 41 (1): 1: 1–1: 37. doi : 10.1145 / 2558904. ISSN 0098-3500.
^I. М. Росс и М. Карпенко, "Обзор псевдоспектрального оптимального управления: от теории к полету", Annual Reviews in Control, Vol. 36, стр. 182-197, 2012.
^ Обзор численных методов оптимизации траектории; Журнал Джона Т. Беттса по руководству, контролю и динамике, 1998 г.; 0731-5090 vol.21 No. 2 (193-207)
^ Анил В. Рао "Обзор численных методов оптимального управления" Успехи в астронавтике, 2009.
^Камила К. Франколин, Дэвид А. Бенсон, Уильям В. Хагер, Анил В. Рао. "Оценка стоимости в оптимальном управлении с использованием методов интегральной гауссовской квадратурной ортогональной коллокации" Приложения и методы оптимального управления, 2014.
^Ллойд Н. Трефетен. «Теория приближений и практика приближений», SIAM 2013
^Дэвид Х. Якобсон, Дэвид К. Мэйн. «Дифференциальное динамическое программирование», Эльзевир, 1970.
^«Инновационная авиационная технология для военных активов будущего | SBIR.gov». www.sbir.gov. Проверено 4 апреля 2017 г.
^«Анализ и параметрическая оценка эталонных миссий по проектированию гиперзвуковых исследовательских аппаратов с использованием QuickShot | Phoenix Integration». www.phoenix-int.com. Проверено 4 апреля 2017 г.
^«SpaceWorks Enterprises Inc. получила награду SBIR фазы 2 от AFRL для дальнейшего развития инструмента QuickShot Trajectory Tool». SpaceWorks. 2015-08-24. Проверено 4 апреля 2017 г.
^Бил, Л. (2018). "Пакет оптимизации GEKKO". Процессы. 6 (8): 106. doi : 10.3390 / pr6080106.
^Гейтс, Н. (2019). «Комбинированная оптимизация траектории, силовой установки и массы аккумуляторной батареи для высотных беспилотных летательных аппаратов с солнечной регенерацией и длительным сроком службы». Форум науки и технологий AIAA (SciTech). AIAA 2019-1221. doi : 10.2514 / 6.2019-1221.
^Sun, L. (2014). «Построение оптимальной траектории с использованием прогнозирующего управления моделью для буксируемых по воздуху кабельных систем» (PDF). Журнал наведения, управления и динамики. 37 (2): 525–539. Bibcode : 2014JGCD... 37..525S. CiteSeerX 10.1.1.700.5468. doi : 10.2514 / 1.60820.
^Sun, L. (2015). «Оценка параметров буксируемых кабельных систем с использованием оценки движущегося горизонта» (PDF). IEEE Transactions по аэрокосмическим и электронным системам. 51 (2): 1432–1446. Bibcode : 2015ITAES..51.1432S. CiteSeerX 10.1.1.700.2174. doi :10.1109/TAES.2014.130642.