Техника нелинейной теории управления
В теории управления отступление - это метод, разработанный около 1990 г., автор Петар В. Кокотович и другие за разработку стабилизирующих элементов управления для специального класса нелинейных динамических систем. Эти системы построены из подсистем, исходящих из несводимой подсистемы, которую можно стабилизировать каким-либо другим методом. Благодаря этой рекурсивной структуре разработчик может начать процесс проектирования в заведомо стабильной системе и «откатить» новые контроллеры, которые постепенно стабилизируют каждую внешнюю подсистему. Процесс завершается, когда достигается окончательное внешнее управление. Следовательно, этот процесс известен как обратный шаг.
Содержание
- 1 Обратный шаг
- 2 Обзор конструкции рекурсивного управления
- 3 Обратный шаг интегратора
- 3.1 Равновесие одного интегратора
- 3.2 Обратный шаг одного интегратора
- 3.3 Пример мотивации: обратный шаг с двумя интеграторами
- 3.4 Обратный шаг с несколькими интеграторами
- 4 Общий шаг назад
- 4.1 Одношаговая процедура
- 4.2 Многоступенчатая процедура
- 5 См. Также
- 6 Ссылки
Подход с обратным шагом
Подход с обратным шагом предоставляет рекурсивный метод для стабилизации источника системы в строгом- форма обратной связи. То есть рассмотрим систему вида
, где
- с ,
- являются скаляры,
- u - скаляр, входящий в систему,
- исчезают в исходной точке (например, ),
- отличны от нуля в области inte остальное (т. е. для ).
Также предположим, что подсистема
стабилизировано до исходной точки (т. е. ) некоторым известным элементом управления таким, что . Также предполагается, что известна функция Ляпунова для этой стабильной подсистемы. То есть эта подсистема x стабилизируется каким-либо другим методом, а обратный шаг расширяет ее стабильность до оболочки вокруг нее.
В системах этой формы строгой обратной связи вокруг стабильной подсистемы x,
- управляющий вход u, спроектированный в обратном направлении, оказывает самое непосредственное стабилизирующее воздействие на состояние .
- Состояние затем действует как стабилизирующий элемент управления для состояния перед ним.
- Этот процесс продолжается, так что каждое состояние стабилизируется фиктивным " control ".
Подход с обратным шагом определяет, как стабилизировать подсистему x с помощью , а затем переходит к определению, как сделать следующее состояние drive к элементу управления, необходимому для стабилизации x . Следовательно, процесс «отступает» от x из системы форм строгой обратной связи до тех пор, пока не будет разработан окончательный элемент управления u.
Обзор структуры рекурсивного управления
- Принято, что меньшая (то есть более низкая подсистема)
- - это уже стабилизирован относительно начала координат некоторым элементом управления где . То есть выбор для стабилизации этой системы должен происходить с использованием какого-либо другого метода. Также предполагается, что известна функция Ляпунова для этой стабильной подсистемы. Обратный шаг позволяет расширить контролируемую стабильность этой подсистемы на более крупную систему.
- Элемент управления спроектирована так, что система
- стабилизируется так, что следует желаемому элемент управления. Дизайн элемента управления основан на кандидате в расширенную функцию Ляпунова
- Элемент управления можно выбрать для привязки от нуля.
- Элемент управления спроектирована так, что система
- стабилизируется так, что следует за желаемым элементом . Схема управления основана на кандидате в расширенную функцию Ляпунова
- Элемент управления можно выбрать для привязки от нуля.
- Этот процесс продолжается до фактического u известно, и
- реальное управление u стабилизирует до фиктивного управления .
- Фиктивный элемент управления стабилизирует к фиктивному элементу управления .
- фиктивный элемент управления стабилизирует до фиктивного управления .
- ...
- Фиктивный элемент управления стабилизирует в фиктивный элемент управления .
- фиктивный элемент управления стабилизирует до фиктивного элемента управления .
- фиктивного элемента управления стабилизирует x относительно начала координат.
Этот процесс известен как backstepping, потому что он начинается с требований к некоторой внутренней подсистеме для стабильность и постепенно выходит из системы, сохраняя стабильность на каждом шаге. Поскольку
- исчезает в начале координат для ,
- отличны от нуля для ,
- данного элемента управления имеет ,
, тогда результирующая система имеет равновесие в начале (например, где , , ,..., и ), что глобально асимптотически стабильно.
Обратный шаг интегратора
Перед описанием процедуры обратного шага для общей формы строгой обратной связи динамических систем удобно обсудить подход для меньшего класса систем строгой обратной связи. Эти системы подключают ряд интеграторов к входу системы с известным законом управления, стабилизирующим обратную связь, и поэтому подход стабилизации известен как обратный шаг интегратора. С небольшой модификацией подход обратной связи интегратора может быть расширен для обработки всех систем форм строгой обратной связи.
Равновесие с одним интегратором
Рассмотрим динамическую систему
| | (1) |
где и - скаляр. Эта система представляет собой каскадное соединение интегратора с подсистемой x (т. Е. Вход u входит в интегратор, а интеграл входит в подсистему x ).
Мы предполагаем, что , и поэтому, если , и , тогда
Итак, origin является равновесием ( т. е. стационарная точка ) системы. Если система когда-либо достигнет источника, она останется там навсегда.
Обратный шаг с одним интегратором
В этом примере обратный шаг используется для стабилизации системы с одним интегратором в уравнении (1) вокруг ее равновесия в начале координат. Чтобы быть менее точным, мы хотим разработать закон управления , который гарантирует, что состояния вернутся к после запуска системы из произвольного начального состояния.
- Во-первых, по предположению, подсистема
- с имеет функцию Ляпунова таким образом, чтобы
- где - положительно определенная функция. То есть, мы предполагаем, что у нас уже есть sh, что эта существующая более простая xподсистема является стабильной (в смысле Ляпунова). Грубо говоря, это понятие устойчивости означает, что:
- Функция подобна «обобщенной энергии» подсистемы x . Когда состояния системы x удаляются от начала координат, энергия также растет.
- Показав, что со временем энергия распадается до нуля, тогда состояния x должны распадаться в сторону . То есть, начало будет устойчивым равновесием системы - x состояния будут непрерывно приближаться к началу координат с увеличением времени.
- Говоря, что положительно определенный означает, что везде, кроме и .
- Утверждение, что означает, что отделен от нуля для всех точек, кроме тех, где . То есть до тех пор, пока система не находится в равновесии в начале координат, его "энергия" будет уменьшаться.
- Поскольку энергия всегда уменьшается, система должна быть стабильной; его траектории должны приближаться к началу координат.
- Наша задача - найти элемент управления u, который делает наш каскадный система также стабильна. Таким образом, мы должны найти новую функцию Ляпунова кандидата для этой новой системы. Этот кандидат будет зависеть от элемента управления u, и, правильно выбрав элемент управления, мы можем гарантировать, что он также везде распадается.
- Затем, добавляя и, вычитая (т.е. мы никоим образом не меняем систему, потому что мы не влияют) на часть большего система, она становится
- которые мы можем перегруппировать, чтобы получить
- Итак, наша каскадная суперсистема инкапсулирует известный стабильный подсистема плюс некоторое возмущение ошибки, генерируемое интегратором.
- Теперь мы можем изменять переменные из до , позволяя . Итак,
- Кроме того, мы позволяем так что и
- Мы стремимся стабилизировать эту систему ошибок путем обратной связи через новый элемент управления . За счет стабилизации системы на состояние будет отслеживать желаемый элемент управления , что приведет к стабилизации внутренней подсистемы x .
- Из нашей существующей функции Ляпунова , мы определяем кандидата в расширенную функцию Ляпунова
- So
- Распределяя , мы видим, что
- Чтобы гарантировать, что (т.е. для обеспечения устойчивости надсистемы) мы выбираем закон управления
- с и поэтому
- После распределения через,
- Итак, наш кандидат в функцию Ляпунова isистинная функция Ляпунова, и наша система устойчива в соответствии с этим законом управления (что соответствует управлению закон потому что ). Используя переменные из исходной системы координат, эквивалентная функция Ляпунова
| | (2) |
- Как обсуждается ниже, эта функция Ляпунова будет использоваться снова, когда эта процедура применяется итеративно к задаче с несколькими интеграторами.
- Наш выбор управления в конечном итоге зависит от всех наших исходных переменных состояния. В частности, фактический закон управления, стабилизирующий обратную связь
| | (3) |
- Состояния x и и функции и поступают из системы. Функция происходит от нашего известного стабильного подсистема. Параметр gain влияет на скорость сходимости или нашу систему. В соответствии с этим законом контроля наша система стабильна в исходной точке. .
- Напомним, что в уравнении (3) управляет входом интегратора, подключенного к подсистеме, стабилизированной по закону управления . Неудивительно, что элемент управления имеет член, который будет интегрирован в соответствии с законом стабилизирующего управления плюс некоторое смещение. Другие члены обеспечивают демпфирование, чтобы удалить это смещение и любые другие эффекты возмущения. эффекты, которые будут увеличиваться интегратором.
Итак, поскольку эта система стабилизирована с помощью обратной связи и имеет функцию Ляпунова с , он может использоваться как верхняя подсистема в другой каскадной системе с одним интегратором.
Мотивационный пример: обратный шаг с двумя интеграторами
Прежде чем обсуждать рекурсивную процедуру для общего случая с несколькими интеграторами, поучительно изучить рекурсию, имеющуюся в случае с двумя интеграторами. Таким образом, рассмотрим динамическую систему
| | (4) |
где и и - скаляры. Эта система представляет собой каскадное соединение системы с одним интегратором в уравнении (1) с другим интегратором (то есть вход поступает через интегратор, и выходной сигнал этого интегратора входит в систему в уравнении (1) с помощью входного сигнала ).
Позволяя
- ,
- ,
затем система с двумя интеграторами в уравнении (4) становится системой с одним интегратором
| | (5) |
По процедуре с одним интегратором закон управления стабилизирует верхнюю подсистему -to- y с помощью функции Ляпунова , и поэтому Equation (5) представляет собой новую систему с одним интегратором, которая структурно эквивалентна системе с одним -интегратор в уравнении (1). Таким образом, стабилизирующее управление можно найти с помощью той же процедуры с одним интегратором, которая использовалась для поиска .
Обратный шаг с несколькими интеграторами
В случае с двумя интеграторами верхняя подсистема с одним интегратором была стабилизирована, давая новую систему с одним интегратором, которую можно стабилизировать аналогичным образом. Эта рекурсивная процедура может быть расширена для обработки любого конечного числа интеграторов. Это утверждение можно формально доказать с помощью математической индукции. Здесь стабилизированная система с несколькими интеграторами построена из подсистем уже стабилизированных подсистем с несколькими интеграторами.
- со скалярным вводом и состояниями вывода . Предположим, что
- , так что нулевой ввод (т. Е. ) система стационарна в начале координат . В этом случае начало координат называется равновесием системы.
- Закон управления с обратной связью стабилизирует систему в точке равновесия в начале координат.
- A Функция Ляпунова, соответствующая этой системе, описывается как .
- То есть, если выходные состояния x передаются обратно на вход по закону управления , то выходные состояния (и функция Ляпунова) возвращаются в начало координат после одного возмущения (например, после ненулевого начального условия или резкое возмущение). Эта подсистема стабилизирована законом управления с обратной связью .
- Затем подключите интегратор к входу , чтобы расширенная система имела входные (для интегратора) и выходные состояния x . Полученная расширенная динамическая система имеет вид
- Эта «каскадная» система соответствует форме в уравнении (1), и поэтому процедура обратного шага с одним интегратором приводит к стабилизирующему закону управления в уравнении (3). То есть, если мы возвращаем состояния и x для ввода по закону управления
- с усилением , затем состояния и x вернутся к и после одного возмущение. Эта подсистема стабилизирована f eedback control law , and the corresponding Lyapunov function from Equation (2) is
- That is, under feedback control law , the Lyapunov function decays to zero as the states return to the origin.
- Connect a new integrator to input so that the augmented system has input and output states x. The resulting augmented dynamical system is
- which is equivalent to the single-integrator system
- Using these definitions of , , and , this system can also be expressed as
- This system matches the single-integrator structure of Equation (1), and so the single-integrator backstepping procedure can be applied again. That is, if we feed back states , , and xto input according to the control law
- with gain , then the states , , and xwill return to , , and after a single perturbation. This subsystem is stabilizedby feedback control law , and the corresponding Lyapunov function is
- That is, under feedback control law , the Lyapunov function decays to zero as the states return to the origin.
- Connect an integrator to input so that the augmented system has input and output states x. The resulting augmented dynamical system is
- который может быть перегруппирована как система с одним интегратором
- По определениям , и из предыдущего шага эта система также представлена как
- Далее, используя эти определения , , и , эту систему также можно выразить как
- Таким образом, перегруппированная система имеет структуру уравнения с одним интегратором (1), и процедура обратного шага с одним интегратором может быть применена снова. То есть, если мы возвращаем состояния , , и x для ввода в соответствии с законом управления
- с усилением , затем состояния , , , а x вернется к , , и после одного возмущения. Эта подсистема стабилизирована законом управления с обратной связью , и соответствующая функция Ляпунова
- То есть при законе управления с обратной связью функция Ляпунова затухает до нуля, когда состояния возвращаются в исходное состояние.
- Этот процесс может продолжаться для каждого интегратора, добавленного в систему, и, следовательно, для любой системы вида
- имеет рекурсивную структуру
- и может быть стабилизирован по обратной связи путем нахождения управления, стабилизирующего обратную связь, и функции Ляпунова для одиночного интегратора подсистема (т. е. со входом и выходом x ) и повторяется из этой внутренней подсистемы до тех пор, пока не будет известна конечная стабилизирующая обратная связь управление u. На итерации i эквивалентная система имеет вид
- Соответствующий закон управления, стабилизирующий обратную связь:
- с усилением . Соответствующая функция Ляпунова:
- Согласно этой конструкции конечный контроль (т. Е. Конечный контроль находится на последней итерации ).
Следовательно, любая система в этой специальной форме строгой обратной связи с множеством интеграторов может быть стабилизирована с помощью простой процедура, которая может быть даже автоматизирована (например, как часть алгоритма адаптивного управления ).
Общий обратный шаг
Системы в специальной форме строгой обратной связи имеют рекурсивную структуру, аналогичную структуре системы со многими интеграторами. Точно так же они стабилизируются путем стабилизации самой маленькой каскадной системы с последующим обратным шагом t o следующую каскадную систему и повторение процедуры. Поэтому очень важно разработать пошаговую процедуру; эта процедура может быть применена рекурсивно для покрытия многоступенчатого случая. К счастью, из-за требований к функциям в форме строгой обратной связи, каждая одношаговая система может быть преобразована с помощью обратной связи в систему с одним интегратором, и эта система с одним интегратором может быть стабилизирована с использованием методов, описанных выше.
Пошаговая процедура
Рассмотрим простую строгую обратную связь систему
| | (6) |
где
- ,
- и равны скаляры,
- Для всех x и , .
Вместо непосредственного проектирования элемента управления со стабилизацией обратной связи , введите новый элемент управления (будет разработан позже) и использовать закон управления
что возможно, потому что . Таким образом, система в уравнении (6):
, что упрощается до
Эта новая система -to- x соответствует одно- каскадная система интегратора в уравнении (1). Предполагая, что закон управления, стабилизирующий обратную связь, и функция Ляпунова для верхней подсистемы известен закон управления, стабилизирующий обратную связь, из уравнения (3):
с усилением . Итак, окончательный отзыв- стабилизирующий закон управления:
| | (7) |
с усиление . Соответствующая функция Ляпунова из уравнения (2) равна
| | (8) |
Поскольку эта система строгой обратной связи имеет управление, стабилизирующее обратную связь, и соответствующую функцию Ляпунова, ее можно каскадировать как часть более крупной системы строгой обратной связи, и это Процедуру можно повторить, чтобы найти окружающее управление, стабилизирующее обратную связь.
Многоступенчатая процедура
Как и при обратном шаге с несколькими интеграторами, одношаговая процедура может выполняться итеративно для стабилизации всей системы строгой обратной связи. На каждом этапе
- выделяется наименьшая «нестабилизированная» одноступенчатая система строгой обратной связи.
- Обратная связь используется для преобразования системы в систему с одним интегратором.
- В результате система с одним интегратором стабилизирована.
- Стабилизированная система используется в качестве верхней системы на следующем этапе.
То есть любая система со строгой обратной связью
имеет рекурсивную структуру
и может быть стабилизирован по обратной связи путем нахождения управления, стабилизирующего обратную связь, и функции Ляпунова для единственного интегратора подсистема (т.е. с входом и выходом x ) и итерация из этой внутренней подсистемы до окончательной стабилизации обратной связи контроль u известен. На итерации i эквивалентная система имеет вид
Согласно уравнению (7) соответствующий стабилизирующий обратную связь закон управления равен
wi коэффициент усиления . По уравнению (8) соответствующая функция Ляпунова равна
По этой конструкции конечный контроль (т.е. конечный контроль находится на последней итерации ). Следовательно, любую систему строгой обратной связи можно стабилизировать с помощью простой процедуры, которую можно даже автоматизировать (например, как часть алгоритма адаптивного управления ).
См. Также
Ссылки