Оптимизация траектории - это процесс проектирования траектории, которая минимизирует ( или максимизирует) некоторую меру производительности при соблюдении набора ограничений. Вообще говоря, оптимизация траектории - это метод вычисления решения без обратной связи для задачи оптимального управления. Он часто используется для систем, где вычисление полного решения с обратной связью не требуется, непрактично или невозможно. Если задача оптимизации траектории может быть решена со скоростью, обратной константе Липшица, то ее можно итеративно использовать для генерации решения с обратной связью в смысле Каратеодори. Если для задачи с бесконечным горизонтом выполняется только первый шаг траектории, то это известно как Model Predictive Control (MPC).
Хотя идея оптимизации траектории существует уже сотни лет (вариационное исчисление, проблема брахистохрона ), оно стало практичным для реальных задач только с появлением компьютера. Многие из первоначальных приложений оптимизации траектории находились в аэрокосмической промышленности, вычисляя траектории запуска ракет. В последнее время оптимизация траектории также использовалась в широком спектре промышленных процессов и робототехники.
Оптимизация траектории впервые появилась в 1697 году, когда введение проблемы Брахистохрона: найти такую форму проволоки, чтобы шарик, скользящий по ней, перемещался между двумя точками за минимальное время. В этой задаче интересно то, что она оптимизирует кривую (форму провода), а не одно число. Наиболее известное из решений было вычислено с использованием вариационного исчисления.
В 1950-х годах цифровые компьютеры начали использовать оптимизацию траектории для решения реальных задач. Первые подходы к оптимальному управлению выросли из вариационного исчисления, основанного на исследованиях Гилберта Эймса Блисса и Брайсона в Америке и Понтрягина в России. Следует особо отметить принцип максимума Понтрягина. Эти первые исследователи заложили основу того, что мы сейчас называем косвенными методами оптимизации траектории.
Большая часть ранних работ по оптимизации траектории была сосредоточена на вычислении профилей тяги ракет как в вакууме, так и в атмосфере. Это раннее исследование обнаружило многие основные принципы, которые используются до сих пор. Еще одним успешным применением был набор высотных траекторий для первых реактивных самолетов. Из-за высокого лобового сопротивления, связанного с околозвуковой областью лобового сопротивления и низкой тягой первых реактивных самолетов, оптимизация траектории была ключом к максимальному увеличению набора высоты до высотных характеристик. Траектории, основанные на оптимальном управлении, установили некоторые мировые рекорды. В этих ситуациях пилот следовал графику зависимости числа оборотов от высоты, основанному на оптимальных решениях управления.
Одной из важных ранних проблем оптимизации траектории была проблема особой дуги, где принцип максимума Понтрягина не дает полного решения. Примером задачи с единичным управлением является оптимизация тяги ракеты, летящей на постоянной высоте и запускаемой с малой скоростью. Здесь проблема заключается в управлении взрывом при максимально возможной тяге до тех пор, пока не будет достигнута особая дуга. Тогда решение сингулярного управления обеспечивает более низкую регулируемую тягу до полного сгорания. В этот момент управление взрывом обеспечивает, что управление или тяга достигают минимального значения, равного нулю. Это решение лежит в основе широко используемого сегодня профиля ракетного двигателя с форсированным двигателем для максимального увеличения характеристик ракет.
Существует множество приложений для оптимизации траектории, в первую очередь в робототехнике: промышленность, манипуляции, ходьба, планирование пути и аэрокосмическая промышленность. Его также можно использовать для моделирования и оценки.
Оптимизация траектории часто используется для расчета траекторий для вертолетов с квадрокоптером. Эти приложения обычно использовали узкоспециализированные алгоритмы. Одно интересное приложение, показанное U.Penn GRASP Lab, вычисляет траекторию, которая позволяет квадрокоптеру пролетать через обруч при его бросании. Другой, на этот раз на ETH Zurich Flying Machine Arena, включает в себя два квадрокоптера, которые бросают между собой шест взад и вперед, балансируя его как перевернутый маятник. Недавно была изучена проблема расчета траекторий с минимальной энергией для квадрокоптера.
Оптимизация траектории используется в производстве, в частности, для управления химическими процессами (например, в) или вычисления желаемого пути для роботов-манипуляторов (например, в).
Есть множество различных приложений для оптимизации траектории в области шагающей робототехники. Например, в одной статье использовалась оптимизация траектории двуногой походки на простой модели, чтобы показать, что ходьба энергетически выгодна для движения с низкой скоростью, а бег энергетически выгоден для движения с высокой скоростью. Как и во многих других приложениях, оптимизация траектории может использоваться для вычисления номинальной траектории, вокруг которой построен стабилизирующий контроллер. Оптимизация траектории может применяться при детальном планировании движения сложных гуманоидных роботов, таких как Atlas. Наконец, оптимизация траектории может использоваться для планирования пути роботов со сложными динамическими ограничениями с использованием моделей пониженной сложности.
Для тактических ракет профили полета определяются историей тяги и подъемной силы. Этими историями можно управлять с помощью ряда средств, включая такие методы, как использование истории команд угла атаки или графика высоты / дальности, которому должна следовать ракета. Каждая комбинация факторов конструкции ракеты, желаемых характеристик ракеты и ограничений системы приводит к новому набору оптимальных параметров управления.
Методы решения любых задач оптимизации можно разделить на две категории: косвенные и прямой. Косвенный метод работает путем аналитического построения необходимых и достаточных условий оптимальности, которые затем решаются численно. Прямой метод пытается получить прямое численное решение путем построения последовательности непрерывно улучшающихся приближений к оптимальному решению. Прямые и косвенные методы могут быть смешаны путем применения принципа сопоставления ковекторов из Росс и Фахру.
Задача оптимального управления - это бесконечномерная задача оптимизации, поскольку переменные решения - это функции, а не действительные числа. Все методы решения выполняют транскрипцию - процесс, с помощью которого задача оптимизации траектории (оптимизация по функциям) преобразуется в задачу оптимизации с ограниченными параметрами (оптимизация по действительным числам). Как правило, эта задача оптимизации с ограниченными параметрами представляет собой нелинейную программу, хотя в особых случаях ее можно свести к квадратичной программе или линейной программе.
одиночной стрельба - это простейший метод оптимизации траектории. Основная идея похожа на то, как вы прицелились бы из пушки: выберите набор параметров для траектории, смоделируйте все, а затем проверьте, попали ли вы в цель. Вся траектория представлена в виде одного сегмента с одним ограничением, известным как ограничение дефекта, требующим, чтобы конечное состояние моделирования соответствовало желаемому конечному состоянию системы. Покадровая съемка эффективна для решения простых задач или задач с очень хорошей инициализацией. Как при непрямой, так и при прямой постановке, как правило, возникают трудности в противном случае.
Многократная съемка - это простое расширение одиночной съемки, которое делает ее гораздо более эффективной. Вместо того, чтобы представлять всю траекторию как единое моделирование (сегмент), алгоритм разбивает траекторию на множество более коротких сегментов, и между ними добавляется ограничение дефекта. В результате получается большая разреженная нелинейная программа, которую, как правило, легче решить, чем небольшие плотные программы, созданные одиночной съемкой.
Методы прямого сопоставления работают путем аппроксимации состояния и управлять траекториями с помощью полиномиальных сплайнов. Эти методы иногда называют прямой транскрипцией. Трапециевидное совмещение - широко используемый метод прямого сопоставления низкого порядка. Динамика, цель траектории и управление представлены с помощью линейных шлицев, а динамика удовлетворяется с помощью трапециевидной квадратуры. Коллокация Эрмита-Симпсона - это распространенный метод прямого сопоставления среднего порядка. Состояние представлено кубическим сплайном Эрмита, а динамика удовлетворяется с помощью квадратур Симпсона.
Ортогональное сопоставление технически является подмножеством прямого сопоставления, но детали реализации настолько различны, что его можно с полным основанием считать собственным набором методов. Ортогональное совмещение отличается от прямого сочетания тем, что оно обычно использует сплайны высокого порядка, и каждый сегмент траектории может быть представлен сплайном другого порядка. Название происходит от использования ортогональных многочленов в сплайнах состояния и управления.
Псевдоспектральное сопоставление, также известное как глобальное сопоставление, является подмножеством ортогонального сопоставления, в котором вся траектория представлен одним ортогональным многочленом высокого порядка. В качестве примечания: некоторые авторы используют ортогональное сочетание и псевдоспектральное сочетание как синонимы. При использовании для решения задачи оптимизации траектории, решение которой является плавным, псевдоспектральный метод обеспечивает спектральную (экспоненциальную) сходимость.
Дифференциальное динамическое программирование, является немного отличается от других описанных здесь методов. В частности, в нем нет четкого разделения транскрипции и оптимизации. Вместо этого он выполняет последовательность итеративных проходов вперед и назад по траектории. Каждый прямой проход удовлетворяет динамике системы, а каждый обратный проход удовлетворяет условиям оптимальности для управления. В конце концов, эта итерация сходится к траектории, которая является одновременно достижимой и оптимальной.
Есть много методов, из которых можно выбирать при решении задачи оптимизации траектории. Лучшего метода не существует, но некоторые методы могут лучше справиться с конкретными проблемами. В этом разделе дается общее представление о компромиссах между методами.
При решении задачи оптимизации траектории косвенным методом вы должны явно построить сопряженные уравнения и их градиенты. Часто это сложно сделать, но это дает отличную метрику точности решения. Прямые методы намного проще настроить и решить, но они не имеют встроенной метрики точности. В результате более широко используются прямые методы, особенно в некритических приложениях. Косвенные методы все еще используются в специализированных приложениях, особенно в аэрокосмической сфере, где точность имеет решающее значение.
Одно место, где косвенные методы вызывают особые трудности, - это проблемы с ограничениями неравенства путей. Эти проблемы обычно имеют решения, для которых ограничение частично активно. При построении сопряженных уравнений для косвенного метода пользователь должен явно записать, когда ограничение активно в решении, что трудно знать априори. Одним из решений является использование прямого метода для вычисления начального предположения, которое затем используется для построения многоэтапной задачи, в которой задано ограничение. Результирующая проблема может быть затем решена с высокой точностью косвенным методом.
Методы одиночной съемки лучше всего использовать для задач, где управление очень простое (или есть очень хорошее первоначальное предположение). Например, задача планирования миссии спутника, где единственным контролем является величина и направление начального импульса от двигателей.
Многократная стрельба обычно хороша для задач с относительно простым управлением, но сложной динамикой. Хотя ограничения пути могут использоваться, они делают результирующую нелинейную программу относительно трудной для решения.
Прямые методы совместного размещения хороши для задач, в которых точность управления и состояния схожи. Эти методы имеют тенденцию быть менее точными, чем другие (из-за их низкого порядка), но особенно устойчивы для задач со сложными ограничениями пути.
Методы ортогональной коллокации лучше всего подходят для получения высокоточных решений проблем, где важна точность траектории управления. Некоторые реализации имеют проблемы с ограничениями пути. Эти методы особенно хороши, когда раствор гладкий.
Обычно задачу оптимизации траектории решают итеративно, каждый раз используя дискретизацию с большим количеством точек. h-метод для уточнения сетки работает за счет увеличения количества сегментов траектории вдоль траектории, в то время как p-метод увеличивает порядок метода транскрипции в каждом сегменте.
В методах прямого сопоставления обычно используется уточнение типа h-метода, поскольку каждый метод имеет фиксированный порядок. Как в методах съемки, так и в методах ортогонального коллокации можно использовать h-метод и p-метод уточнения сетки, а в некоторых используется комбинация, известная как адаптивная сетка hp. Лучше всего использовать h-метод, когда решение негладкое, тогда как p-метод лучше всего подходит для гладких решений.
Примеры программ оптимизации траектории включают:
Набор инструментов оптимизации траектории с малой тягой, включая элементы набора инструментов Low Thrust Trajectory Tool (LTTT) можно найти здесь: Инструменты оптимизации LTTT Suite.