Управление в скользящем режиме

редактировать
Метод в теории нелинейного управления

В системах управления, скользящий режим control (SMC ) - это метод нелинейного управления, который изменяет динамику нелинейной системы путем применения прерывистый управляющий сигнал (или, точнее, установленный управляющий сигнал), который заставляет систему «скользить» по поперечному сечению нормального поведения системы. Закон управления состояния - обратной связи не является непрерывной функцией времени. Вместо этого он может переключаться с одной непрерывной структуры на другую в зависимости от текущего положения в пространстве состояний. Следовательно, управление скользящим режимом является способом управления структурой переменных. Множественные управляющие структуры спроектированы таким образом, что траектории всегда движутся к соседнему региону с другой управляющей структурой, и поэтому конечная траектория не будет полностью существовать внутри одной управляющей структуры. Вместо этого он будет скользить по границам управляющих структур. Движение системы при скольжении по этим границам называется режимом скольжения, а геометрический участок , состоящий из границ, называется скользящей (гипер) поверхностью. В контексте современной теории управления любая система с переменной структурой, как и система в SMC, может рассматриваться как частный случай гибридной динамической системы, поскольку обе системы проходят через непрерывное пространство состояний, но также проходит через различные дискретные режимы управления.

Содержание

  • 1 Введение
  • 2 Схема управления
    • 2.1 Существование замкнутых решений
  • 3 Теоретические основы
    • 3.1 Теорема 1: Существование скользящего режима
      • 3.1.1 Доступность: Получение скользящего многообразия за конечное время
        • 3.1.1.1 Объяснение с помощью леммы сравнения
        • 3.1.1.2 Последствия для управления скользящим режимом
    • 3.2 Теорема 2: Область притяжения
    • 3.3 Теорема 3: Скользящее движение
  • 4 Примеры схем управления
    • 4.1 Решения для автоматизированного проектирования
  • 5 Наблюдатель скользящего режима
  • 6 См. Также
  • 7 Примечания
  • 8 Ссылки
  • 9 Дополнительная литература

Введение

Рисунок 1: Фазовая плоскость траектория системы, стабилизируемой регулятором скользящего режима. После начальной фазы достижения система состояния "скользит" по линии s = 0 {\ displaystyle s = 0}s = 0 . Конкретная поверхность s = 0 {\ displaystyle s = 0}s = 0 выбрана, потому что она имеет желаемую динамику пониженного порядка, когда она ограничена. В этом случае поверхность s = x 1 + x ˙ 1 = 0 {\ displaystyle s = x_ {1} + {\ dot {x}} _ {1} = 0}s = x_ {1} + {\ dot {x}} _ {1} = 0 соответствует в систему LTI первого порядка x ˙ 1 = - x 1 {\ displaystyle {\ dot {x}} _ {1} = - x_ {1}}{\ dot {x}} _ {1} = - x_ {1} , который имеет экспоненциально устойчивое начало координат.

На рисунке 1 показан пример траектории системы при управлении скользящим режимом. Поверхность скольжения описывается как s = 0 {\ displaystyle s = 0}s = 0 , и режим скольжения по поверхности начинается после конечного времени, когда траектории системы достигли поверхности. В теоретическом описании режимов скольжения система остается ограниченной скользящей поверхностью, и ее нужно рассматривать только как скользящую по поверхности. Однако реальные реализации управления скользящим режимом аппроксимируют это теоретическое поведение высокочастотным и, как правило, недетерминированным сигналом управления переключением, который заставляет систему «дребезжать» в тесной близости к скользящей поверхности. Дребезжание можно уменьшить за счет использования зоны нечувствительности или пограничных слоев вокруг скользящей поверхности, или других методов компенсации. Хотя система в целом нелинейна, идеализированное (т. Е. Без вибрации) поведение системы на рисунке 1, когда она ограничена поверхностью s = 0 {\ displaystyle s = 0}s = 0 , является Система LTI с экспоненциально стабильным происхождением.

Интуитивно понятно, что управление скользящим режимом использует практически бесконечное усиление, чтобы заставить траектории динамической системы скользить по подпространству ограниченного скользящего режима. Траектории из этого режима скольжения пониженного порядка имеют желаемые свойства (например, система естественным образом скользит по нему, пока не остановится в желаемом равновесии ). Основным преимуществом управления скользящим режимом является его надежность. Поскольку управление может быть таким простым, как переключение между двумя состояниями (например, «включено» / «выключено» или «вперед» / «назад»), оно не обязательно должно быть точным и не будет чувствительным к изменениям параметров, которые входят в канал управления. Кроме того, поскольку закон управления не является непрерывной функцией, скользящий режим может быть достигнут за конечное время (то есть лучше, чем асимптотическое поведение). При определенных общих условиях оптимальность требует использования управления взрывом ; следовательно, управление в скользящем режиме описывает оптимальный контроллер для широкого набора динамических систем.

Одним из применений контроллера скользящего режима является управление электроприводами, управляемыми импульсными преобразователями энергии. Из-за прерывистого режима работы этих преобразователей контроллер прерывистого скользящего режима является естественным вариантом реализации по сравнению с контроллерами непрерывного действия, которые могут потребоваться с помощью широтно-импульсной модуляции или аналогичной техники применения непрерывного сигнал на выход, который может принимать только дискретные состояния. Управление в скользящем режиме имеет множество применений в робототехнике. В частности, этот алгоритм управления использовался для отслеживания управления беспилотными надводными судами в смоделированном бурном море с высокой степенью успеха.

Управление в скользящем режиме должно применяться с большей осторожностью, чем другие формы нелинейного управления с более умеренным управляющим действием. В частности, поскольку исполнительные механизмы имеют задержки и другие недостатки, жесткое управление скользящим режимом может привести к вибрации, потере энергии, повреждению оборудования и возбуждению немоделированной динамики. Методы проектирования непрерывного управления не так подвержены этим проблемам и могут имитировать контроллеры скользящего режима.

Схема управления

Рассмотрим нелинейную динамическую систему, описанную

Икс ˙ (T) знак равно е (Икс, T) + В (Икс, T) U (T) {\ Displaystyle {\ dot {\ mathbf {x}}} (т) = F (\ mathbf {x}, t) + B (\ mathbf {x}, t) \, \ mathbf {u} (t)}{\ dot {\ mathbf {x}}} (t) = f (\ mathbf {x}, t) + B (\ mathbf {x}, t) \, \ mathbf {u} (t)

(1)

где

x (t) ≜ [x 1 (t) x 2 (t) ⋮ xn - 1 (t) xn (t)] ∈ R n {\ displaystyle \ mathbf {x} (t) \ треугольник {\ begin {bmatrix} x_ {1} (t) \\ x_ {2 } (t) \\\ vdots \\ x_ {n-1} (t) \\ x_ {n} (t) \ end {bmatrix}} \ in \ mathbb {R} ^ {n}}\ mathbf {x} (t) \ треугольникq {\ begin {bmatrix} x_ {1} (t) \\ x_ {2} (t) \\\ vdots \\ x_ {n-1} (t) \\ x_ {n} (t) \ end {bmatrix}} \ in \ mathbb { R} ^ {n}

- это n-мерное состояние вектор и

u (t) ≜ [u 1 (t) u 2 (t) ⋮ um - 1 (t) um (t)] ∈ р м {\ Displaystyle \ mathbf {и} (т) \ треугольник {\ begin {bmatrix} и_ {1} (т) \\ и_ {2} (т) \\\ vdots \\ и_ {м-1} (t) \\ u_ {m} (t) \ end {bmatrix}} \ in \ mathbb {R} ^ {m}}\ mathbf {u} (t) \ треугольникq {\ begin {bmatrix} u_ {1} (t) \\ u_ {2} (t) \ \\ vdots \\ u_ {m-1} (t) \\ u_ {m} (t) \ end {bmatrix}} \ in \ mathbb {R} ^ {m}

- это m-мерный входной вектор, который будет использоваться для обратной связи состояния . функции f: R n × R → R n {\ displaystyle f: \ mathbb {R} ^ {n} \ times \ mathbb {R} \ to \ mathbb {R} ^ { n}}{\ displaystyle f: \ mathbb {R} ^ {n} \ times \ mathbb {R} \ to \ mathbb {R} ^ {n}} и B: R n × R → R n × m {\ displaystyle B: \ mathbb {R} ^ {n} \ times \ mathbb {R} \ to \ mathbb { R} ^ {n \ times m}}{\ displaystyle B: \ mathbb {R} ^ {n} \ times \ mathbb {R} \ to \ mathbb {R} ^ {n \ times m}} предполагается непрерывным и достаточно гладким, так что теорема Пикара – Линделёфа может использоваться, чтобы гарантировать, что решение x (t) {\ displaystyle \ mathbf {x} (t)}\ mathbf {x} (t) для уравнения (1) существует и является уникальным.

Распространенной задачей является разработка закона управления с обратной связью u (x (t)) {\ displaystyle \ mathbf {u} (\ mathbf {x} (t))}\ mathbf {u} (\ mathbf {x} (t)) (т. Е. Отображение текущего состояния x (t) {\ displaystyle \ mathbf {x} (t)}\ mathbf {x} (t) в момент времени t на вход u {\ displaystyle \ mathbf {u}}\ mathbf {u} ) для стабилизации динамической системы в уравнении (1) вокруг происхождения x = [0, 0,…, 0] ⊺ {\ displaystyle \ mathbf {x} = [0,0, \ ldots, 0] ^ {\ intercal }}{\ displaystyle \ mathbf {x} = [0,0, \ ldots, 0] ^ {\ intercal}} . То есть, согласно закону управления, всякий раз, когда система запускается вдали от источника, она возвращается к нему. Например, компонент x 1 {\ displaystyle x_ {1}}x_ {1} вектора состояния x {\ displaystyle \ mathbf {x}}\ mathbf {x} может представлять отличие некоторого выхода от известного сигнала (например, желаемого синусоидального сигнала); если элемент управления u {\ displaystyle \ mathbf {u}}\ mathbf {u} может гарантировать, что x 1 {\ displaystyle x_ {1}}x_ {1} быстро вернется к x 1 = 0 {\ displaystyle x_ {1} = 0}x_ {1} = 0 , тогда на выходе будет отслеживаться желаемая синусоида. При управлении в скользящем режиме разработчик знает, что система ведет себя желательно (например, она имеет устойчивое равновесие ) при условии, что она ограничена подпространством своего конфигурационного пространства. Управление скользящим режимом перемещает траектории системы в это подпространство, а затем удерживает их там, чтобы они скользили по нему. Это подпространство пониженного порядка называется скользящей (гипер) поверхностью, и когда обратная связь с замкнутым контуром заставляет траектории скользить по нему, это называется скользящим режимом замкнутой системы. Траектории вдоль этого подпространства можно сравнить с траекториями вдоль собственных векторов (т. Е. Мод) систем LTI ; однако скользящий режим усиливается за счет увеличения векторного поля с помощью обратной связи с высоким коэффициентом усиления. Как мрамор, катящийся по трещине, траектории ограничены режимом скольжения.

Схема управления в скользящем режиме включает в себя

  1. Выбор гиперповерхности или коллектора (то есть поверхности скольжения) таким образом, чтобы траектория системы демонстрировала желаемое поведение, когда она ограничена этим коллектором.
  2. Обнаружение усиления обратной связи, чтобы траектория системы пересекалась и оставалась на коллекторе.

Поскольку законы управления скользящим режимом не непрерывны, у него есть возможность переводить траектории в скользящий режим за конечное время (т. е. устойчивость скользящей поверхности лучше асимптотической). Однако как только траектории достигают поверхности скольжения, система принимает характер режима скольжения (например, начало координат x = 0 {\ displaystyle \ mathbf {x} = \ mathbf {0}}\ mathbf {x} = \ mathbf {0} может иметь асимптотическую устойчивость только на этой поверхности).

Разработчик скользящего режима выбирает функцию переключения σ: R n → R m {\ displaystyle \ sigma: \ mathbb {R} ^ {n} \ to \ mathbb {R} ^ {m }}{\ displaystyle \ sigma: \ mathbb {R} ^ {n} \ to \ mathbb {R} ^ {m}} , который представляет своего рода «расстояние», на котором состояния x {\ displaystyle \ mathbf {x}}\ mathbf {x} находятся от скользящей поверхности.

  • Состояние x {\ displaystyle \ mathbf {x}}\ mathbf {x} , которое находится за пределами этой скользящей поверхности, имеет σ (x) ≠ 0 {\ displaystyle \ sigma (\ mathbf { x}) \ neq 0}\ sigma (\ mathbf {x}) \ neq 0 .
  • Состояние, которое находится на этой скользящей поверхности, имеет σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = 0}\ sigma (\ mathbf {x}) = 0 .

скользящий режим -закон управления переключается из одного состояния в другое в зависимости от знака этого расстояния. Таким образом, управление скользящим режимом действует как жесткое давление, всегда толкающее в направлении скользящего режима, где σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = 0}\ sigma (\ mathbf {x}) = 0 . Желательно, чтобы траектории x (t) {\ displaystyle \ mathbf {x} (t)}\ mathbf {x} (t) приближались к поверхности скольжения, и поскольку закон управления не непрерывный (т. Е. он переключается из одного состояния в другое по мере движения траекторий по этой поверхности), поверхность достигается за конечное время. Как только траектория достигает поверхности, она будет скользить по ней и, например, может двигаться к исходной точке x = 0 {\ displaystyle \ mathbf {x} = \ mathbf {0}}\ mathbf {x} = \ mathbf {0} . Таким образом, функция переключения похожа на топографическую карту с контуром постоянной высоты, по которому вынуждены перемещаться траектории.

Скользящая (гипер) поверхность имеет размер n × m {\ displaystyle n \ times m}n \ times m , где n - количество состояний в x {\ displaystyle \ mathbf {x}}\ mathbf {x} , а m - количество входных сигналов (т. е. управляющих сигналов) в u {\ displaystyle \ mathbf {u}}\ mathbf {u} . Для каждого контрольного индекса 1 ≤ k ≤ m {\ displaystyle 1 \ leq k \ leq m}1 \ leq k \ leq m существует n × 1 {\ displaystyle n \ times 1}n \ times 1 скользящая поверхность, заданная как

{x ∈ R n: σ k (x) = 0} {\ displaystyle \ left \ {\ mathbf {x} \ in \ mathbb {R} ^ {n}: \ sigma _ {k} (\ mathbf {x}) = 0 \ right \}}\ left \ {\ mathbf {x} \ in \ mathbb {R} ^ {n}: \ sigma _ {k} (\ mathbf {x}) = 0 \ right \}

(2)

Жизненно важной частью проектирования SMC является выбор закона управления так, чтобы режим скольжения (т.е. по σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = \ mathbf {0}}\ sigma (\ mathbf {x}) = \ mathbf {0} ) существует и достижимо по системным траекториям. Принцип управления скользящим режимом состоит в том, чтобы принудительно ограничить систему подходящей стратегией управления, чтобы она оставалась на скользящей поверхности, на которой система будет проявлять желаемые характеристики. Когда система удерживается посредством управления скольжением, чтобы оставаться на поверхности скольжения, динамикой системы управляет система пониженного порядка, полученная из уравнения (2).

Чтобы заставить состояния системы x {\ displaystyle \ mathbf {x}}\ mathbf {x} удовлетворять σ (x) = 0 {\ displaystyle \ sigma (\ mathbf { x}) = \ mathbf {0}}\ sigma (\ mathbf {x}) = \ mathbf {0} , необходимо:

  1. Убедитесь, что система способна достичь σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x }) = \ mathbf {0}}\ sigma (\ mathbf {x}) = \ mathbf {0} из любого начального состояния
  2. , достигнув σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = \ mathbf {0}}\ sigma (\ mathbf {x}) = \ mathbf {0} , управляющее действие может поддерживать систему на уровне σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = \ mathbf {0}}\ sigma (\ mathbf {x}) = \ mathbf {0}

Существование замкнутых решений

Обратите внимание, что, поскольку закон управления не непрерывный, он определенно не является локально непрерывным по Липшицу, и поэтому существование и уникальность решений замкнутой системы не гарантируется теоремой Пикара – Линделёфа. Таким образом, решения следует понимать в смысле Филиппова. Грубо говоря, получившаяся замкнутая система, движущаяся вдоль σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = \ mathbf {0}}\ sigma (\ mathbf {x}) = \ mathbf {0} , аппроксимируется гладким динамика σ ˙ (x) = 0; {\ displaystyle {\ dot {\ sigma}} (\ mathbf {x}) = \ mathbf {0};}{\ displaystyle {\ dot {\ sigma}} (\ mathbf {x}) = \ mathbf {0};} однако такое плавное поведение может быть нереализуемым. Точно так же высокоскоростная широтно-импульсная модуляция или дельта-сигма модуляция вырабатывает выходные сигналы, которые принимают только два состояния, но эффективный выходной сигнал колеблется в непрерывном диапазоне движения. Этих сложностей можно избежать, используя другой метод проектирования нелинейного управления, который создает непрерывный контроллер. В некоторых случаях схемы управления со скользящим режимом могут быть аппроксимированы другими схемами непрерывного управления.

Теоретическая основа

Следующие теоремы составляют основу управления переменной структурой.

Теорема 1: Существование скользящего режима

Рассмотрим функцию Ляпунова кандидата

V (σ (x)) = 1 2 σ ⊺ (x) σ ( Икс) знак равно 1 2 ‖ σ (Икс) ‖ 2 2 {\ Displaystyle V (\ sigma (\ mathbf {x})) = {\ frac {1} {2}} \ sigma ^ {\ intercal} (\ mathbf { x}) \ sigma (\ mathbf {x}) = {\ frac {1} {2}} \ | \ sigma (\ mathbf {x}) \ | _ {2} ^ {2}}{\ Displaystyle V (\ sigma (\ mathbf {x})) = {\ frac {1} {2}} \ sigma ^ {\ intercal} (\ mathbf {x}) \ sigma (\ mathbf {x}) = {\ frac {1} {2}} \ | \ sigma (\ mathbf {x}) \ | _ {2} ^ {2}}

(3)

где ‖ ⋅ ‖ {\ displaystyle \ | {\ mathord {\ cdot}} \ |}\ | {\ mathord {\ cdot}} \ | - евклидова норма (т. Е. ‖ σ (x) ‖ 2 {\ displaystyle \ | \ sigma (\ mathbf {x}) \ | _ {2}}\ | \ sigma (\ mathbf {x}) \ | _ {2} - расстояние от скользящего коллектора, где σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = \ mathbf {0}}\ sigma (\ mathbf {x}) = \ mathbf {0} ). Для системы, заданной уравнением (1), и поверхности скольжения, заданной уравнением (2), достаточным условием существования режима скольжения является то, что

σ ⊺ ⏞ ∂ V ∂ σ σ ˙ ⏞ d ⁡ σ d ⁡ T ⏟ d ⁡ V d ⁡ t < 0 (i.e., d ⁡ V d ⁡ t < 0) {\displaystyle \underbrace {\overbrace {\sigma ^{\intercal }} ^{\tfrac {\partial V}{\partial \sigma }}\overbrace {\dot {\sigma }} ^{\tfrac {\operatorname {d} \sigma }{\operatorname {d} t}}} _{\tfrac {\operatorname {d} V}{\operatorname {d} t}}<0\qquad {\text{(i.e., }}{\tfrac {\operatorname {d} V}{\operatorname {d} t}}<0{\text{)}}}{\ displaystyle \ underbrace {\ overbrace {\ sigma ^ {\ intercal}} ^ {\ tfrac {\ partial V} {\ partial \ sigma}} \ overbrace {\ dot {\ sigma}} ^ {\ tfrac {\ operatorname {d} \ sigma} {\ operatorname { d } t}}} _ {\ tfrac {\ operatorname {d} V} {\ operatorname {d} t}} <0 \ qquad {\ text {(т.е.}} {\ tfrac {\ operatorname {d} V} {\ operatorname {d} t}} <0 {\ text {)}}}

в окрестности поверхности, заданной как σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = 0}\ sigma (\ mathbf {x}) = 0 .

Грубо говоря (т. Е. Для скалярного контрольного случая, когда m = 1 {\ displaystyle m = 1}m = 1 ), чтобы получить σ ⊺ σ ˙ < 0 {\displaystyle \sigma ^{\intercal }{\dot {\sigma }}<0}{\ displaystyle \ sigma ^ {\ intercal} {\ dot {\ sigma}} <0} , закон управления с обратной связью u (x) {\ displaystyle u (\ mathbf {x})}u (\ mathbf {x}) выбирается так, чтобы σ {\ displaystyle \ sigma}\ sigma и σ ˙ {\ displaystyle {\ dot {\ sigma}}}{\ dot {\ sigma}} имеют противоположные знаки. То есть

  • u (x) {\ displaystyle u (\ mathbf {x})}u (\ mathbf {x}) составляет σ ˙ (x) {\ displaystyle {\ dot {\ sigma}} (\ mathbf {x})}{\ dot {\ sigma}} (\ mathbf {x}) отрицательное, когда σ (x) {\ displaystyle \ sigma (\ mathbf {x})}\ sigma (\ mathbf {x}) положительно.
  • u (x) {\ displaystyle u (\ mathbf {x})}u (\ mathbf {x}) делает σ ˙ (x) {\ displaystyle {\ dot {\ sigma}} (\ mathbf {x})}{\ dot {\ sigma}} (\ mathbf {x}) положительный, когда σ (x) {\ displaystyle \ sigma (\ mathbf {x})}\ sigma (\ mathbf {x}) отрицательно.

Обратите внимание, что

σ ˙ = ∂ σ ∂ xx ˙ ⏞ d ⁡ xd ⁡ T знак равно ∂ σ ∂ Икс (е (x, t) + B (x, t) u) ⏞ x ˙ {\ displaystyle {\ dot {\ sigma}} = {\ frac {\ partial \ sigma} {\ partial \ mathbf {x}}} \ overbrace {\ dot {\ mathbf {x}}} ^ {\ tfrac {\ operatorname {d} \ mathbf {x}} {\ operatorname {d} t}} = { \ frac {\ partial \ sigma} {\ partial \ mathbf {x}}} \ overbrace {\ left (f (\ mathbf {x}, t) + B (\ mathbf {x}, t) \ mathbf {u} \ right)} ^ {\ dot {\ mathbf {x}}}}{\ dot {\ sigma}} = {\ frac {\ partial \ sigma} {\ partial \ mathbf {x}}} \ overbrace {\ dot {\ mathbf { x}}} ^ {\ tfrac {\ operatorname {d} \ mathbf {x}} {\ operatorname {d} t}} = {\ frac {\ partial \ sigma} {\ partial \ mathbf {x}}} \ overbrace {\ left (f (\ mathbf {x}, t) + B (\ mathbf {x}, t) \ mathbf {u} \ right)} ^ {\ dot {\ mathbf {x}}}

и поэтому закон управления обратной связью u (x) {\ displaystyle \ mathbf {u} (\ mathbf {x})}\ mathbf {u} (\ mathbf {x}) оказывает прямое влияние на σ ˙ {\ displaystyle {\ dot {\ sigma}}}{\ dot {\ sigma}} .

Достижимость: достижение скользящего коллектора за конечное время

Чтобы обеспечить скользящий режим σ (x) = 0 { \ displaystyle \ sigma (\ mathbf {x}) = \ mathbf {0}}\ sigma (\ mathbf {x}) = \ mathbf {0} достигается за конечное время, d ⁡ V / d ⁡ t {\ displaystyle \ operatorname {d} V / {\ operatorname {d} t}}\ operatorname {d} V / {\ operatorname {d} t } должен быть более сильно отделен от нуля. То есть, если он исчезает слишком быстро, притяжение к скользящему режиму будет только асимптотическим. Чтобы обеспечить переход в скользящий режим за конечное время,

d ⁡ V d ⁡ t ≤ - μ (V) α {\ displaystyle {\ frac {\ operatorname {d} V} {\ operatorname {d} t} } \ leq - \ mu ({\ sqrt {V}}) ^ {\ alpha}}{\ frac {\ operatorname {d} V} {\ operatorname {d} t}} \ leq - \ mu ({\ sqrt {V}}) ^ {\ alpha}

где μ>0 {\ displaystyle \ mu>0}\mu>0 и 0 < α ≤ 1 {\displaystyle 0<\alpha \leq 1}0 <\ alpha \ leq 1 - константы.

Объяснение с помощью леммы сравнения

Это условие гарантирует, что для окрестности скользящего режима V ∈ [0, 1] {\ displaystyle V \ in [0,1]}V \ in [0,1] ,

d ⁡ V d ⁡ T ≤ - μ (V) α ≤ - μ V. {\ Displaystyle {\ frac {\ operatorname {d} V} {\ operatorname {d} t}} \ leq - \ mu ({\ sqrt {V}}) ^ {\ alpha} \ leq - \ mu {\ sqrt {V}}.}{\ frac {\ operatorname {d} V} {\ operatorname {d} t}} \ leq - \ mu ({\ sqrt {V}}) ^ {\ alpha} \ leq - \ mu {\ sqrt {V}}.

Итак, для V ∈ (0, 1] {\ displaystyle V \ in (0,1]}V \ in (0,1] ,

1 В d ⁡ В d ⁡ t ≤ - μ, {\ displaystyle {\ frac {1} {\ sqrt {V}}} {\ frac {\ operatorname {d} V} {\ operatorname {d} t}} \ leq - \ mu,}{\ frac {1} {\ sqrt {V}}} {\ frac {\ operatorname {d} V} {\ operatorname {d} t}} \ leq - \ mu,

который, согласно правилу цепочки (т.е. d ⁡ W / d ⁡ t {\ di splaystyle \ operatorname {d} W / {\ operatorname {d} t}}\ operatorname {d} W / {\ operatorname {d} t} с W ≜ 2 V {\ displaystyle W \ Triangleq 2 {\ sqrt {V}}}W \ треугольникq 2 {\ sqrt {V}} ), означает

D + (2 V ⏞ ∝ ‖ σ ‖ 2 ⏟ W) ⏟ D + W ≜ Верхний правый W ˙ = 1 V d ⁡ V d ⁡ t ≤ - μ {\ displaystyle {\ mathord {\ underbrace {D ^ {+} {\ Bigl (} {\ mathord {\ underbrace {2 {\ mathord {\ overbrace {\ sqrt {V}} ^ {{} \ propto \ | \ sigma \ | _ {) 2}}}}} _ {W}}} {\ Bigr)}} _ {D ^ {+} W \, \ triangleq \, {\ mathord {{\ text {Верхний правый угол}} {\ dot { W}}}}}}} = {\ frac {1} {\ sqrt {V}}} {\ frac {\ operatorname {d} V} {\ operatorname {d} t}} \ leq - \ mu}{\ mathord {\ underbrace {D ^ {+} {\ Bigl (} {\ mathord {\ underbrace {2 {\ mathord {\ overbrace {\ sqrt {) V}} ^ {{} \ propto \ | \ sigma \ | _ {2}}}}} _ {W}}} {\ Bigr)}} _ {D ^ {+} W \, \ triangleq \, { \ mathord {{\ text {Верхний правый}} {\ dot {W}}}}}}} = {\ frac {1} {\ sqrt {V}}} {\ frac {\ operatorname {d} V } {\ operatorname {d} t}} \ leq - \ mu

где D + {\ displaystyle D ^ {+}}D ^ {+} - верхняя правая производная от 2 V {\ displaystyle 2 {\ sqrt { V}}}2 {\ sqrt {V}} , а символ ∝ {\ displaystyle \ propto}\ propto обозначает пропорциональность. Итак, по сравнению с кривой z (t) = z 0 - μ t {\ displaystyle z (t) = z_ {0} - \ mu t}z (t) = z_ { 0} - \ mu t , которая представлена ​​дифференциальным уравнением z ˙ = - μ {\ displaystyle {\ dot {z}} = - \ mu}{\ dot { z}} = - \ mu с начальным условием z (0) = z 0 {\ displaystyle z (0) = z_ {0}}z(0)=z_{0}, должно быть так, что 2 V (t) ≤ V 0 - μ t {\ displaystyle 2 {\ sqrt {V (t)}} \ leq V_ {0 } - \ mu t}2 {\ sqrt {V (t)}} \ leq V_ {0} - \ mu t для всех t. Более того, поскольку V ≥ 0 {\ displaystyle {\ sqrt {V}} \ geq 0}{\ sqrt {V}} \ geq 0 , V {\ displaystyle {\ sqrt {V}}}{\ sqrt {V}} должен достигать V = 0 {\ displaystyle {\ sqrt {V}} = 0}{\ sqrt {V}} = 0 за конечное время, что означает, что V должен достичь V = 0 {\ displaystyle V = 0}V = 0 (т.е. система переходит в скользящий режим) за конечное время. Поскольку V {\ displaystyle {\ sqrt {V}}}{\ sqrt {V}} пропорционально евклидовой норме ‖ ⋅ ‖ 2 {\ displaystyle \ | {\ mathord { \ cdot}} \ | _ {2}}\ | {\ mathord {\ cdot}} \ | _ {2} функции переключения σ {\ displaystyle \ sigma}\ sigma , этот результат означает, что скорость приближения к скользящему режиму должна быть жестко отделена от нуля.

Последствия для управления скользящим режимом

В контексте управления скользящим режимом это условие означает, что

σ ⊺ ⏞ ∂ V ∂ σ σ ˙ ⏞ d ⁡ σ d ⁡ t ⏟ d ⁡ В d ⁡ T ≤ - μ (‖ σ ‖ 2 ⏞ V) α {\ Displaystyle \ Underbrace {\ overbrace {\ sigma ^ {\ intercal}} ^ {\ tfrac {\ partial V} {\ partial \ sigma}} \ overbrace {\ dot {\ sigma}} ^ {\ tfrac {\ operatorname {d} \ sigma} {\ operatorname {d} t}}} _ {\ tfrac {\ operatorname {d} V} {\ operatorname {d } t}} \ leq - \ mu ({\ mathord {\ overbrace {\ | \ sigma \ | _ {2}} ^ {\ sqrt {V}}}}) ^ {\ alpha}}{\ displaystyle \ underbrace {\ overbrace {\ sigma ^ { \ intercal}} ^ {\ tfrac {\ partial V} {\ partial \ sigma}} \ overbrace {\ dot {\ sigma}} ^ {\ tfrac {\ operatorname {d} \ sigma} {\ operatorname {d} t }}} _ {\ tfrac {\ operatorname {d} V} {\ operatorname {d} t}} \ leq - \ mu ({\ mathord {\ overbrace {\ | \ sigma \ | _ {2}} ^ { \ sqrt {V}}}}) ^ {\ alpha}}

где ‖ ⋅ ‖ {\ displaystyle \ | {\ mathord {\ cdot}} \ |}\ | {\ mathord {\ cdot}} \ | - это евклидова норма. Для случая, когда функция переключения σ {\ displaystyle \ sigma}\ sigma имеет скалярное значение, достаточным условием становится

σ σ ˙ ≤ - μ | σ | α {\ displaystyle \ sigma {\ dot {\ sigma}} \ leq - \ mu | \ sigma | ^ {\ alpha}}\ sigma {\ dot {\ sigma}} \ leq - \ mu | \ sigma | ^ {\ alpha} .

Принимая α = 1 {\ displaystyle \ alpha = 1}\ alpha = 1 , скалярное достаточное условие становится

sgn ⁡ (σ) σ ˙ ≤ - μ {\ displaystyle \ operatorname {sgn} (\ sigma) {\ dot {\ sigma}} \ leq - \ mu}\ operatorname {sgn} (\ sigma) {\ dot {\ sigma}} \ leq - \ mu

, что эквивалентно условию

sgn ⁡ (σ) ≠ sgn ⁡ (σ ˙) и | σ ˙ | ≥ μ>0 {\ displaystyle \ operatorname {sgn} (\ sigma) \ neq \ operatorname {sgn} ({\ dot {\ sigma}}) \ qquad {\ text {and}} \ qquad | {\ dot {\ sigma}} | \ geq \ mu>0}\operatorname {sgn} (\sigma)\neq \operatorname {sgn} ({\dot {\sigma }})\qquad {\text{and}}\qquad |{\dot {\sigma }}|\geq \mu>0 .

То есть, система всегда должна двигаться к поверхности переключения σ = 0 {\ displaystyle \ sigma = 0}\ sigma = 0 , и ее скорость | σ ˙ | {\ displaystyle | {\ dot {\ sigma}} |}| {\ dot { \ sigma}} | в направлении поверхности переключения должно иметь ненулевую нижнюю границу. Таким образом, даже если σ {\ displaystyle \ sigma}\ sigma может стать исчезающе маленьким, когда x {\ displaystyle \ mathbf {x}}\ mathbf {x} приближается к σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = \ mathbf {0}}\ sigma (\ mathbf {x}) = \ mathbf {0} поверхность, σ ˙ {\ displaystyle {\ dot {\ sigma}}}{\ dot {\ sigma}} всегда должен быть жестко ограничен от нуля. Чтобы гарантировать это условие, контроллеры скользящего режима разрываются на σ = 0 {\ displaystyle \ sigma = 0}\ sigma = 0 коллектор; они переключаются с одного ненулевого значения на другое, когда траектории пересекают многообразие.

Теорема 2: Область притяжения

Для системы, заданной уравнением (1), и поверхности скольжения, заданной уравнением (2), подпространство, для которого { Икс ∈ Р N: σ (Икс) знак равно 0} {\ Displaystyle \ {\ mathbf {x} \ in \ mathbb {R} ^ {n}: \ sigma (\ mathbf {x}) = \ mathbf {0} \ }}\ {\ mathbf { х} \ in \ mathbb {R} ^ {n}: \ sigma (\ mathbf {x}) = \ mathbf {0} \} поверхность достижима определяется как

{x ∈ R n: σ ⊺ (x) σ ˙ (x) < 0 } {\displaystyle \{\mathbf {x} \in \mathbb {R} ^{n}:\sigma ^{\intercal }(\mathbf {x}){\dot {\sigma }}(\mathbf {x})<0\}}{\ displaystyle \ {\ mathbf {x} \ in \ mathbb {R} ^ {n} : \ sigma ^ {\ intercal} (\ mathbf {x}) {\ dot {\ sigma}} (\ mathbf {x}) <0 \}}

То есть, когда начальные условия исходят полностью из этого пространства, Ляпуновский кандидат в функцию V (σ) {\ displaystyle V (\ sigma)}V (\ sigma) - это функция Ляпунова и x {\ displaystyle \ mathbf {x}}\ mathbf {x} траектории обязательно будут двигаться к поверхности скользящего режима, где σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = \ mathbf {0}}\ sigma (\ mathbf {x}) = \ mathbf {0} . Более того, если выполняются условия достижимости из теоремы 1, скользящий режим войдет в область, где V ˙ {\ displaystyle {\ dot {V}}}{\ dot {V}} более сильно отделен от нуля в конечное время. Следовательно, скользящий режим σ = 0 {\ displaystyle \ sigma = 0}\ sigma = 0 будет достигнут за конечное время.

Теорема 3: Скользящее движение

Пусть

∂ σ ∂ x B (x, t) {\ displaystyle {\ frac {\ partial \ sigma} {\ partial {\ mathbf { x}}}} B (\ mathbf {x}, t)}{\ frac {\ partial \ sigma} {\ partial {\ mathbf {x}}}} B (\ mathbf {x}, t)

быть несингулярным. То есть система имеет своего рода управляемость, которая гарантирует, что всегда есть элемент управления, который может перемещать траекторию, чтобы приблизиться к скользящему режиму. Затем, когда будет достигнут скользящий режим, в котором σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = \ mathbf {0}}\ sigma (\ mathbf {x}) = \ mathbf {0} , система останется на этом скользящий режим. Вдоль траекторий скользящего режима σ (x) {\ displaystyle \ sigma (\ mathbf {x})}\ sigma (\ mathbf {x}) является постоянным, и поэтому траектории скользящего режима описываются дифференциальным уравнением

σ ˙ = 0 {\ displaystyle {\ dot {\ sigma}} = \ mathbf {0}}{\ dot {\ sigma}} = \ mathbf {0} .

Если x {\ displaystyle \ mathbf {x}}\ mathbf {x} -равновесие стабильно по отношению к этому дифференциальному уравнению, тогда система будет скользить по поверхности режима скольжения к равновесию.

Эквивалентный закон управления для скользящего режима можно найти, решив

σ ˙ (x) = 0 {\ displaystyle {\ dot {\ sigma}} (\ mathbf {x}) = 0}{\ dot {\ sigma}} (\ mathbf {x}) = 0

для эквивалентного закона управления u (x) {\ displaystyle \ mathbf {u} (\ mathbf {x})}\ mathbf {u} (\ mathbf {x}) . То есть

∂ σ ∂ Икс (е (x, t) + B (x, t) u) ⏞ x ˙ = 0 {\ displaystyle {\ frac {\ partial \ sigma} {\ partial \ mathbf {x }}} \ overbrace {\ left (f (\ mathbf {x}, t) + B (\ mathbf {x}, t) \ mathbf {u} \ right)} ^ {\ dot {\ mathbf {x}} } = \ mathbf {0}}{\ frac {\ partial \ sigma} {\ partial \ mathbf {x}}} \ overbrace {\ left (f (\ mathbf {x}, t) + B ( \ mathbf {x}, t) \ mathbf {u} \ right)} ^ {\ dot {\ mathbf {x}}} = \ mathbf {0}

и поэтому эквивалентный элемент управления

u = - (∂ σ ∂ x B (x, t)) - 1 ∂ σ ∂ xf (x, t) {\ displaystyle \ mathbf {u} = - \ left ({\ frac {\ partial \ sigma} {\ partial \ mathbf {x}}} B (\ mathbf {x}, t) \ right) ^ {- 1} {\ frac {\ partial \ sigma} {\ partial \ mathbf {x}}} f (\ mathbf {x}, t)}\ mathbf {u} = - \ left ({\ frac {\ partial \ sigma} {\ partial \ mathbf {x}}} B (\ mathbf {x }, t) \ right) ^ {- 1} {\ frac {\ partial \ sigma} {\ partial \ mathbf {x}}} f (\ mathbf {x}, t)

То есть, даже если фактический элемент управления u {\ displaystyle \ mathbf {u}}\ mathbf {u} не непрерывный, быстрое переключение между скользящим режимом, где σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = \ mathbf {0} }\ sigma (\ mathbf {x}) = \ mathbf {0} заставляет систему действовать так, как если бы она была управляема этим непрерывным контролем.

Точно так же траектории системы в скользящем режиме ведут себя так, как если бы

x ˙ = f (x, t) - B (x, t) (∂ σ ∂ x B (x, t)) - 1 ∂ σ ∂ xf (x, t) ⏞ f (x, t) + B (x, t) u = f (x, t) (I - B (x, t) (∂ σ ∂ x B (x, t)) - 1 ∂ σ ∂ x) {\ displaystyle {\ dot {\ mathbf {x}}} = \ overbrace {f (\ mathbf {x}, t) -B (\ mathbf {x}, t) \ left ({\ frac {\ partial \ sigma} {\ partial \ mathbf {x}}} B (\ mathbf {x}, t) \ right) ^ {- 1} {\ frac {\ partial \ sigma} {\ частичное \ mathbf {x}}} f (\ mathbf {x}, t)} ^ {f (\ mathbf {x}, t) + B (\ mathbf {x}, t) u} = f (\ mathbf { x}, t) \ left (\ mathbf {I} -B (\ mathbf {x}, t) \ left ({\ frac {\ partial \ sigma} {\ partial \ mathbf {x}}} B (\ mathbf {x}, t) \ right) ^ {- 1} {\ frac {\ partial \ sigma} {\ partial \ mathbf {x}}} \ right)}{\ dot {\ mathbf {x}}} = \ overbrace {f (\ mathbf {x}, t) -B (\ mathbf {x}, t) \ left ({\ frac {\ partial \ sigma} {\ partial \ mathbf {x}}} B (\ mathbf {x}, t) \ right) ^ {- 1} {\ frac {\ partial \ sigma } {\ partial \ mathbf {x}}} f (\ mathbf {x}, t)} ^ {f (\ mathbf {x}, t) + B (\ mathbf {x}, t) u} = f ( \ ма thbf {x}, t) \ left (\ mathbf {I} -B (\ mathbf {x}, t) \ left ({\ frac {\ partial \ sigma} {\ partial \ mathbf {x}}} B ( \ mathbf {x}, t) \ right) ^ {- 1} {\ frac {\ partial \ sigma} {\ partial \ mathbf {x}}} \ right)

Полученная система соответствует дифференциальному уравнению скользящего режима

σ ˙ (x) = 0 {\ displaystyle {\ dot {\ sigma}} (\ mathbf {x}) = \ mathbf {0}}{\ dot {\ sigma}} (\ mathbf {x}) = \ mathbf {0}

, поверхность скользящего режима σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = \ mathbf {0}}\ sigma (\ mathbf {x}) = \ mathbf {0} и теперь условия траектории из фазы достижения сводятся к полученному выше более простому условию. Следовательно, можно предположить, что система следует более простому условию σ ˙ = 0 {\ displaystyle {\ dot {\ sigma}} = 0}{\ dot {\ sigma}} = 0 после некоторого начального переходного процесса в течение периода, пока система находит скользящий режим. Такое же движение приблизительно сохраняется, когда равенство σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = \ mathbf {0}}\ sigma (\ mathbf {x}) = \ mathbf {0} выполняется только приблизительно.

Из этих теорем следует, что скользящее движение инвариантно (т.е. нечувствительно) к достаточно малым возмущениям, поступающим в систему через канал управления. То есть, пока размер элемента управления достаточно велик, чтобы гарантировать, что σ ⊺ σ ˙ < 0 {\displaystyle \sigma ^{\intercal }{\dot {\sigma }}<0}{\ displaystyle \ sigma ^ {\ intercal} {\ dot {\ sigma}} <0} и σ ˙ {\ displaystyle {\ dot {\ sigma}}}{\ dot {\ sigma}} равномерно отделен от нуля, скользящий режим будет поддерживаться, как если бы не было помех. Свойство инвариантности управления скользящим режимом к определенным возмущениям и неопределенностям модели является его наиболее привлекательной особенностью; он сильно устойчивый.

Как обсуждается в примере ниже, закон управления скользящим режимом может сохранять ограничение

x ˙ + x = 0 {\ displaystyle {\ dot {x}} + x = 0}{\ dot {x}} + x = 0

для асимптотической стабилизации любой системы вида

x ¨ = a (t, x, x ˙) + u {\ displaystyle {\ ddot {x}} = a (t, x, {\ dot {x}}) + u}{\ ddot {x}} = a (t, x, {\ dot {x}}) + u

, когда a (⋅) {\ displaystyle a (\ cdot)}а (\ cdot) имеет конечную верхнюю границу. В данном случае скользящий режим - это где

x ˙ = - x {\ displaystyle {\ dot {x}} = - x}{\ dot {x}} = - x

(т.е. где x ˙ + x = 0 {\ displaystyle {\ dot {x}} + x = 0}{\ dot {x}} + x = 0 ). То есть, когда система ограничена таким образом, она ведет себя как простая устойчивая линейная система, и поэтому она имеет глобально экспоненциально стабильное равновесие в (x, x ˙) = (0, 0) {\ displaystyle (x, {\ dot {x}}) = (0,0)}(x, {\ dot {x}}) = (0,0) происхождение.

Примеры разработки элементов управления

  • Рассмотрим объект, описанный уравнением (1) с одним входом u (т. Е. m = 1 {\ displaystyle m = 1}m = 1 ). В качестве функции переключения выбрана линейная комбинация
σ (x) ≜ s 1 x 1 + s 2 x 2 + ⋯ + sn - 1 xn - 1 + snxn {\ displaystyle \ sigma (\ mathbf {x}) \ треугольник s_ {1} x_ {1} + s_ {2} x_ {2} + \ cdots + s_ {n-1} x_ {n-1} + s_ {n} x_ {n}}\ sigma (\ mathbf {x}) \ треугольник s_ {1} x_ {1} + s_ {2} x_ {2} + \ cdots + s_ {n-1} x_ {n-1} + s_ {n} x_ {n}

(4)

где вес si>0 {\ displaystyle s_ {i}>0}s_{i}>0 для всех 1 ≤ i ≤ n {\ displaystyle 1 \ leq i \ leq n}1 \ leq i \ leq n . скользящая поверхность - это симплекс, где σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = 0}\ sigma (\ mathbf {x}) = 0 . Когда траектории вынуждены скользить по эта поверхность,
σ ˙ (x) = 0 {\ displaystyle {\ dot {\ sigma}} (\ mathbf {x}) = 0}{\ dot {\ sigma}} (\ mathbf {x}) = 0
и поэтому
s 1 x ˙ 1 + s 2 Икс ˙ 2 + ⋯ + Sn - 1 Икс ˙ N - 1 + Snx ˙ N = 0 {\ Displaystyle s_ {1} {\ dot {x}} _ {1} + s_ {2} {\ dot {x}} _ {2} + \ cdots + s_ {n-1} {\ dot {x}} _ {n-1} + s_ {n} {\ dot {x}} _ {n} = 0}s_ {1} {\ dot {x}} _ {1} + s_ {2} {\ dot {x}} _ {2} + \ cdots + s_ {n-1} {\ dot {x}} _ {n-1} + s_ {n} {\ dot {x}} _ {n} = 0
который является системой приведенного порядка (т. е. n Система ew имеет порядок n - 1 {\ displaystyle n-1}n-1 , потому что система ограничена этим (n - 1) {\ displaystyle (n-1)}(n-1) -мерный скользящий режим симплекс). Эта поверхность может иметь благоприятные свойства (например, когда динамика растений вынуждена скользить по этой поверхности, они движутся к началу координат x = 0 {\ displaystyle \ mathbf {x} = \ mathbf {0}}\ mathbf {x} = \ mathbf {0} ). Взяв производную от функции Ляпунова в уравнении (3), мы имеем
V ˙ (σ (x)) = σ (x) T ⏞ ∂ σ ∂ x σ ˙ (x) ⏞ d ⁡ σ d ⁡ T {\ displaystyle {\ dot {V}} (\ sigma (\ mathbf {x})) = \ overbrace {\ sigma (\ mathbf {x}) ^ {\ text {T}}} ^{\tfrac {\partial \sigma }{\partial \mathbf {x} }}\overbrace {{\dot {\sigma }}(\mathbf {x})} ^{\tfrac {\operatorname {d} \ sigma }{\operatorname {d} t}}}{\ dot {V}} (\ sigma (\ mathbf {x})) = \ overbrace {\ sigma (\ mathbf {x}) ^ {\ text {T}}} ^ {\ tfrac {\ partial \ sigma} {\ partial \ mathbf {x}}} \ overbrace {{\ dot {\ sigma}} (\ mathbf {x})} ^ {\ tfrac {\ operatorname {d} \ sigma} {\ OperatorName {d} t}}
To ensure V ˙ < 0 {\displaystyle {\dot {V}}<0}{\ dot {V}} <0 , the feedback control law u ( x) {\displaystyle u(\mathbf {x})}u (\ mathbf {x}) must be chosen so that
{ σ ˙ < 0 if σ>0 σ ˙>0 if σ < 0 {\displaystyle {\begin{cases}{\dot {\sigma }}<0{\text{if }}\sigma>0\\{\dot {\sigma }}>0{\text{if }}\sigma <0\end{cases}}}{\ begin {cases} {\ dot {\ sigma}} <0 {\ text {if}} \ sigma>0 \\ {\ dot {\ sigma}}>0 {\ text {if} } \ sigma <0\end{cases}}
Hence, the product σ σ ˙ < 0 {\displaystyle \sigma {\dot {\sigma }}<0}\ sigma {\ dot {\ sigma}} <0 because it is the product of a negative and a positive number. Note that
σ ˙ ( x) = ∂ σ ( x) ∂ x x ˙ ⏞ σ ˙ ( x) = ∂ σ ( x) ∂ x ( f ( x, t) + B ( x, t) u) ⏞ x ˙ = [ s 1, s 2, …, s n ] ⏞ ∂ σ ( x) ∂ x ( f ( x, t) + B ( x, t) u) ⏞ x ˙ ⏟ ( i.e., an n × 1 vector) {\displaystyle {\dot {\sigma }}(\mathbf {x})=\overbrace {{\frac {\partial {\sigma (\mathbf {x})}}{\partial {\mathbf {x} }}}{\dot {\mathbf {x} }}} ^{{\dot {\sigma }}(\mathbf {x})}={\frac {\partial {\sigma (\mathbf {x})}}{\partial {\mathbf {x} }}}\overbrace {\left(f(\mathbf {x},t)+B(\mathbf {x},t)u\right)} ^{\dot {\mathbf {x} }}=\overbrace {[s_{1},s_{2},\ldots,s_{n}]} ^{\frac {\partial {\sigma (\mathbf {x})}}{\partial {\mathbf {x} }}}\underbrace {\overbrace {\left(f(\mathbf {x},t)+B(\mathbf {x},t)u\right)} ^{\dot {\mathbf {x} }}} _{{\text{( i.e., an }}n\times 1{\text{ vector)}}}}{\ dot {\ sigma}} (\ mathbf {x}) = \ overbrace {{\ frac {\ partial { \ sigma (\ mathbf {x})}} {\ partial {\ mathbf {x}}}} {\ dot {\ mathbf {x}}}} ^ {{\ dot {\ sigma}} (\ mathbf {x })} = {\ frac {\ partial {\ sigma (\ mathbf {x})}} {\ partial {\ mathbf {x}}}} \ overbrace {\ left (f (\ mathbf {x}, t) + B (\ mathbf {x}, t) u \ right)} ^ {\ dot {\ mathbf {x}}} = \ overbrace {[s_ {1}, s_ {2}, \ ldots, s_ {n} ]} ^ {\ frac {\ partial {\ sigma (\ mathbf {x})}} {\ partial {\ mathbf {x}}}} \ underbrace {\ overbrace {\ left (f (\ mathbf {x}, t) + B (\ mathbf {x}, t) u \ right)} ^ {\ dot {\ mathbf {x}}}} _ {{\ text {(т.е. an}} n \ умножить на 1 {\ text {vector)}}}

(5)

The control law u ( x) {\displaystyle u(\mathbf {x})}u (\ mathbf {x}) is chosen so that
u ( x) = { u + ( x) if σ ( x)>0 u − ( x) if σ ( x) < 0 {\displaystyle u(\mathbf {x})={\begin{cases}u^{+}(\mathbf {x}){\text{if }}\sigma (\mathbf {x})>0\\u^{-}(\mathbf {x}){\text{if }}\sigma (\mathbf {x})<0\end{cases}}}u (\ mathbf {x}) = {\ begin {cases} u ^ {+} (\ mathbf {x}) {\ text {if}} \ sigma (\ mathbf {x})>0 \\ u ^ {-} (\ mathbf {x}) {\ text {если }} \ sigma (\ mathbf {x}) <0 \ end {cases}}
where
  • u + ( x) {\displaystyle u^{+}(\mathbf {x})}u ^ {+} (\ mathbf {x}) is some control (e.g., possibly extreme, like "on" or "forward") that ensures Equation (5) (i.e., σ ˙ {\displaystyle {\dot {\sigma }}}{\ dot {\ sigma}} ) is negative at x {\displaystyle \mathbf {x} }\ mathbf {x}
  • u − ( x) {\displaystyle u^{-}(\mathbf {x})}u ^ {-} (\ mathbf {x}) is some control (e.g., possibly extreme, like "off" or "reverse") that ensures Equation (5) (i.e., σ ˙ {\displaystyle {\dot {\sigma }}}{\ dot {\ sigma}} ) is positive at x {\displaystyle \mathbf {x} }\ mathbf {x}
The resulting trajectory should move toward the sliding surface where σ ( x) = 0 {\displaystyle \sigma (\mathbf {x})=0}\ sigma (\ mathbf {x}) = 0 . Because real systems have delay, sliding mode trajectories often chatter back and forth along this sliding surface (i.e., the true trajectory may not smoothly follow σ ( x) = 0 {\displaystyle \sigma (\mathbf {x})=0}\ sigma (\ mathbf {x}) = 0 , but it will always return to the sliding mode after leaving it).
x ¨ = a ( t, x, x ˙) + u {\displaystyle {\ddot {x}}=a(t,x,{\dot {x}})+u}{\ ddot {x}} = a (t, x, {\ dot {x}}) + u
which can be expressed in a 2-dimensional state space (with x 1 = x {\displaystyle x_{1}=x}x_{1}=xand x 2 = x ˙ {\displaystyle x_{2}={\dot {x}}}x_ {2} = {\ dot {x}} ) as
{ x ˙ 1 = x 2 x ˙ 2 = a ( t, x 1, x 2) + u {\displaystyle {\begin{cases}{\dot {x}}_{1}=x_{2}\\{\dot {x}}_{2}=a(t,x_{1},x_{2})+u\end{cases}}}{\ begin {cases} {\ dot {x}} _ {1} = x_ {2} \\ {\ dot {x}} _ {2} = a (t, x_ {1}, x_ {2}) + u \ end {cases}}
Also assume that sup { | a ( ⋅) | } ≤ k {\displaystyle \sup\{|a(\cdot)|\}\leq k}\ sup \ {| a (\ cdot) | \} \ leq k (i.e., | a | {\displaystyle |a|}| a | has a finite upper bound k that is known). For this system, choose the switching function
σ ( x 1, x 2) = x 1 + x 2 = x + x ˙ {\displaystyle \sigma (x_{1},x_{2})=x_{1}+x_{2}=x+{\dot {x}}}\ sigma (x_ {1}, x_ {2}) = x_ {1} + x_ {2} = x + {\ dot {x}}
By the previous example, we must choose the feedback control law u ( x, x ˙) {\displaystyle u(x,{\dot {x}})}u (x, {\ dot {x}}) so that σ σ ˙ < 0 {\displaystyle \sigma {\dot {\sigma }}<0}\ sigma {\ dot {\ sigma}} <0 . Here,
σ ˙ = x ˙ 1 + x ˙ 2 = x ˙ + x ¨ = x ˙ + a ( t, x, x ˙) + u ⏞ x ¨ {\displaystyle {\dot {\sigma }}={\dot {x}}_{1}+{\dot {x}}_{2}={\dot {x}}+{\ddot {x}}={\dot {x}}\,+\,\overbrace {a(t,x,{\dot {x}})+u} ^{\ddot {x}}}{\ dot {\ sigma}} = {\ dot {x}} _ {1} + {\ dot {x}} _ {2} = {\ dot {x}} + {\ ddot {x}} = {\ dot {x}} \, + \, \ overbrace {a (t, x, {\ dot {x}}) + u} ^ {\ ddot { x}}
  • When x + x ˙ < 0 {\displaystyle x+{\dot {x}}<0}x + {\ dot {x}} <0 (i.e., when σ < 0 {\displaystyle \sigma <0}\ sigma <0), to make σ ˙>0 {\displaystyle {\dot {\sigma }}>0}{\ dot {\ sigma}}>0 , the control law should be picked so that u>| x ˙ + a ( t, x, x ˙) | {\displaystyle u>|{\dot {x}}+a(t,x,{\dot {x}})|}u>| {\ dot {x}} + a (t, x, {\ dot {x}}) |
  • When x + x ˙>0 {\displaystyle x+{\dot {x}}>0}x + {\ dot {x}}>0 (i.e., when σ> 0 {\ displaystyle \ sigma>0}\sigma>0 ), чтобы получить σ ˙ < 0 {\displaystyle {\dot {\sigma }}<0}{\ dot {\ sigma}} <0 , закон управления должен быть выбран так, чтобы u < − | x ˙ + a ( t, x, x ˙) | {\displaystyle u<-|{\dot {x}}+a(t,x,{\dot {x}})|}u <- | {\ dot {x}} + a (t, x, {\ dot {x}}) |
Однако неравенство треугольника ,
| x ˙ | + | a (t, x, x ˙) | ≥ | x ˙ + a (t, x, x ˙) | {\ displaystyle | {\ dot {x}} | + | a (t, x, {\ dot {x}}) | \ geq | {\ dot {x}} + a (t, x, {\ dot {x}}) |}| {\ dot {x}} | + | a (t, x, {\ dot {x}}) | \ geq | {\ dot {x}} + a (t, x, {\ dot {x}}) |
и предположением о | a | {\ displaystyle | a |}| a | ,
| x ˙ | + k + 1>| x ˙ | + | a (t, x, x ˙) | {\ displaystyle | {\ dot {x}} | + k + 1>| {\ dot {x}} | + | a (t, x, {\ dot {x}}) |}|{\dot {x}}|+k+1>| {\ dot {x}} | + | a (t, x, { \ dot {x}}) |
Таким образом, система может быть стабилизирована с обратной связью (вернуться в скользящий режим) с помощью закона управления
u (x, x ˙) = {| x ˙ | + k + 1, если x + x ˙ ⏟ < 0, − ( | x ˙ | + k + 1) if x + x ˙ ⏞ σ>0 {\ displaystyle u (x, {\ dot {x}}) = {\ begin {cases} | {\ dot {x}} | + k + 1 { \ text {if}} \ underbrace {x + {\ dot {x}}} <0,\\-\left(|{\dot {x}}|+k+1\right){\text{if }}\overbrace {x+{\dot {x}}} ^{\sigma }>0 \ end {cases}}}u(x,{\dot {x}})={\begin{cases}|{\dot {x}}|+k+1{\text{if }}\underbrace {x+{\dot {x}}} <0,\\-\left(|{\dot {x}}|+k+1\right){\text{if }}\overbrace {x+{\dot {x}}} ^{\sigma }>0 \ end {ases}}
который может быть выражен в закрытой форме как
u (x, x ˙) = - (| x ˙ | + k + 1) sgn s (x ˙ + x ⏞ σ) ⏟ (т.е. тесты σ>0) {\ displaystyle u (x, {\ точка {x}}) = - (| {\ dot {x}} | + k + 1) \ underbrace {\ operatorname {sgn} (\ overbrace {{\ dot {x}} + x} ^ {\ sigma})} _ {{\ text {(т.е. тесты}} \ sigma>0 {\ text {)}}}}u(x,{\dot {x}})=-(|{\dot {x}}|+k+1)\underbrace {\operatorname {sgn} (\overbrace {{\dot {x}}+x} ^{\sigma })} _{{\text{(i.e., tests }}\sigma>0 {\ text {)}}}
Предполагая, что системные траектории вынуждены двигаться так, чтобы σ (x) = 0 {\ displaystyle \ sigma (\ mathbf {x}) = 0}\ sigma (\ mathbf {x}) = 0 , тогда
x ˙ = - x (т. е. σ (x, x ˙) = x + х ˙ = 0) {\ display style {\ dot {x}} = - x \ qquad {\ text {(т.е.}} \ sigma (x, {\ dot {x}}) = x + {\ dot {x}} = 0 {\ text {)}}}{\ dot {x}} = - x \ qquad {\ text {(т.е.}} \ sigma (x, {\ dot {x}}) = x + {\ dot {x} } = 0 {\ text {)}}
Итак, как только система переходит в режим скольжения, двумерная динамика системы ведет себя как эта одномерная система, которая имеет глобально экспоненциально устойчивое равновесие в (x, x ˙) = (0, 0) {\ displaystyle (x, {\ dot {x}}) = (0,0)}(x, {\ dot {x}}) = (0,0) .

Решения для автоматизированного проектирования

Хотя существуют различные теории для управления скользящим режимом системного проектирования отсутствует высокоэффективная методология проектирования из-за практических трудностей, возникающих при использовании аналитических и численных методов. Парадигма многократно используемых вычислений, такая как генетический алгоритм, может, однако, использоваться для преобразования «неразрешимой проблемы» оптимального проектирования в практически решаемую «недетерминированную полиномиальную задачу». Это приводит к автоматизированному проектированию для управления скользящей моделью.

Наблюдатель в скользящем режиме

Управление скользящим режимом может использоваться в конструкции наблюдателей состояния. Эти нелинейные наблюдатели с высоким коэффициентом усиления обладают способностью сводить координаты динамики ошибки оценочного устройства к нулю за конечное время. Кроме того, наблюдатели с переключенным режимом обладают привлекательной устойчивостью к шумам при измерениях, аналогичной фильтру Калмана. Для простоты в примере здесь используется модификация традиционного скользящего режима наблюдателя Люенбергера для системы LTI. В этих наблюдателях в скользящем режиме порядок динамики наблюдателя уменьшается на единицу, когда система переходит в скользящий режим. В этом конкретном примере ошибка оценщика для одного оцененного состояния приводится к нулю за конечное время, а после этого времени другие ошибки оценщика экспоненциально спадают до нуля. Однако, как впервые было описано Дракуновым, можно построить наблюдатель скользящего режима для нелинейных систем, который сводит ошибку оценки для всех оцененных состояний к нулю за конечное (и сколь угодно малое) время.

Рассмотрим здесь систему LTI

{x ˙ = A x + B uy = [1 0 0 ⋯] x = x 1 {\ displaystyle {\ begin {cases} {\ dot {\ mathbf {x}}} = A \ mathbf {x} + B \ mathbf {u} \\ y = {\ begin {bmatrix} 1 0 0 \ cdots \ end {bmatrix}} \ mathbf {x} = x_ {1} \ end {cases}}}{\ begin {case} {\ dot {\ mathbf {x}}} = A \ mathbf {x} + B \ mathbf {u} \\ y = {\ begin {bmatrix} 1 0 0 0 \ cdots \ конец {bmatrix}} \ mathbf {x} = x_ {1} \ end {case}}

где вектор состояния x ≜ (x 1, x 2,…, xn) ∈ R n {\ displaystyle \ mathbf {x} \ треугольникq (x_ {1}, x_ {2 }, \ точки, x_ {n}) \ in \ mathbb {R} ^ {n}}\ mathbf {x} \ треугольникq (x_ {1}, x_ {2}, \ dots, x_ {n}) \ in \ mathbb {R } ^ {n} , u ≜ (u 1, u 2,…, ur) ∈ R r {\ displaystyle \ mathbf {u} \ треугольникq (u_ {1}, u_ {2}, \ dots, u_ {r}) \ in \ mathbb {R} ^ {r}}\ mathbf {u} \ треугольникq (u_ {1}, u_ {2}, \ dots, u_ {r}) \ in \ mathbb {R} ^ {r} - вектор входных данных, а выход y - скаляр равно первому состоянию вектора состояния x {\ displaystyle \ mathbf {x}}\ mathbf {x} . Пусть

A ≜ [a 11 A 12 A 21 A 22] {\ displaystyle A \ треугольник {\ begin {bmatrix} a_ {11} A_ {12} \\ A_ {21} A_ {22} \ end {bmatrix }}}A \ треугольник {\ begin {bmatrix} a_ {11} A_ {12} \\ A_ {21} A_ {22} \ end {bmatrix}}

где

  • a 11 {\ displaystyle a_ {11}}a_ {11} - это скаляр, представляющий влияние первого состояния x 1 {\ displaystyle x_ {1}}x_ {1} сам по себе,
  • A 21 ∈ R (n - 1) {\ displaystyle A_ {21} \ in \ mathbb {R} ^ {(n-1)}}A_ {21} \ in \ mathbb {R} ^ {(n-1)} - это вектор-строка, соответствующий влиянию первого состояния на другие состояния,
  • A 22 ∈ R (n - 1) × (n - 1) {\ displaystyle A_ {22} \ in \ mathbb {R} ^ { (n-1) \ times (n-1)}}A_ {22} \ in \ mathbb {R} ^ {(n-1) \ times (n -1)} - матрица, представляющая влияние других состояний на самих себя, и
  • A 12 ∈ R 1 × (n - 1) {\ displaystyle A_ {12} \ in \ mathbb {R} ^ {1 \ times (n-1)}}A_ {12} \ in \ mathbb {R} ^ {1 \ times (n-1)} - вектор-столбец, представляющий влияние других состояний на первое состояние.

цель состоит в том, чтобы разработать наблюдатель состояния с высоким коэффициентом усиления, который оценивает вектор состояния x {\ displaystyle \ mathbf {x}}\ mathbf {x} , используя только информацию из измерения y = x 1 {\ displaystyle y = x_ {1}}y = x_ {1} . Следовательно, пусть вектор x ^ = (x ^ 1, x ^ 2,…, x ^ n) ∈ R n {\ displaystyle {\ hat {\ mathbf {x}}} = ({\ hat {x }} _ {1}, {\ hat {x}} _ {2}, \ dots, {\ hat {x}} _ {n}) \ in \ mathbb {R} ^ {n}}{\ hat {\ mathbf {x}}} = ({\ hat {x}} _ {1}, {\ hat {x}} _ {2}, \ dots, {\ hat {x}} _ {n}) \ in \ mathbb {R} ^ { n} - оценки n состояний. Наблюдатель принимает форму

x ^ ˙ = A x ^ + B u + L v (x ^ 1 - x 1) {\ displaystyle {\ dot {\ hat {\ mathbf {x}}}} = A { \ hat {\ mathbf {x}}} + B \ mathbf {u} + Lv ({\ hat {x}} _ {1} -x_ {1})}{\ dot {\ hat {\ mathbf {x}}}} = A {\ hat {\ mathbf {x}}} + B \ mathbf {u} + Lv ( {\ hat {x}} _ {1} -x_ {1})

где v: R → R {\ displaystyle v: \ mathbb {R} \ to \ mathbb {R}}{\ displaystyle v: \ mathbb {R} \ to \ mathbb {R}} - нелинейная функция ошибки между предполагаемым состоянием x ^ 1 {\ displaystyle {\ hat {x}} _ {1}}{\ hat {x}} _ {1} и вывод y = x 1 {\ displaystyle y = x_ {1}}y = x_ {1} и L ∈ R n {\ displaystyle L \ in \ mathbb {R} ^ {n}}L \ in \ mathbb {R } ^ {n} - вектор усиления наблюдателя, который служит той же цели, что и типичный линейный наблюдатель Люенбергера. Аналогично, пусть

L = [- 1 L 2] {\ displaystyle L = {\ begin {bmatrix} -1 \\ L_ {2} \ end {bmatrix}}}L = {\ begin {bmatrix} -1 \\ L_ {2} \ конец {bmatrix}}

где L 2 ∈ R (n - 1) {\ displaystyle L_ {2} \ in \ mathbb {R} ^ {(n-1)}}L_ {2} \ in \ mathbb {R} ^ {(n-1)} - вектор-столбец. Кроме того, пусть e = (e 1, e 2,…, en) ∈ R n {\ displaystyle \ mathbf {e} = (e_ {1}, e_ {2}, \ dots, e_ {n}) \ in \ mathbb {R} ^ {n}}\ mathbf {e} = (e_ {1}, e_ {2}, \ dots, e_ {n}) \ in \ mathbb {R} ^ {n} - ошибка оценщика состояния. То есть e = x ^ - x {\ displaystyle \ mathbf {e} = {\ hat {\ mathbf {x}}} - \ mathbf {x}}\ mathbf {e} = {\ hat {\ mathbf {x}}} - \ mathbf { x} . Тогда динамика ошибок будет

e ˙ = x ^ ˙ - x ˙ = A x ^ + B u + L v (x ^ 1 - x 1) - A x - B u = A (x ^ - x) + L v (Икс ^ 1 - Икс 1) знак равно A е + L v (е 1) {\ Displaystyle {\ begin {выровнено} {\ dot {\ mathbf {e}}} = {\ dot {\ hat {\ mathbf {x}}}} - {\ dot {\ mathbf {x}}} \\ = A {\ hat {\ mathbf {x}}} + B \ mathbf {u} + Lv ({\ hat {x }} _ {1} -x_ {1}) - A \ mathbf {x} -B \ mathbf {u} \\ = A ({\ hat {\ mathbf {x}}} - \ mathbf {x}) + Lv ({\ hat {x}} _ {1} -x_ {1}) \\ = A \ mathbf {e} + Lv (e_ {1}) \ end {align}}}{\ displaystyle {\ begin {выровнено} {\ dot {\ mathbf {e}}} = {\ dot {\ hat {\ mathbf {x}}}} - {\ dot {\ mathbf {x}} } \\ = A {\ hat {\ mathbf {x}}} + B \ mathbf {u} + Lv ({\ hat {x}} _ {1} -x_ {1}) - A \ mathbf {x } -B \ mathbf {u} \\ = A ({\ hat {\ mathbf {x}}} - \ mathbf {x}) + Lv ({\ hat {x}} _ {1} -x_ {1 }) \\ = A \ mathbf {e} + Lv (e_ {1}) \ end {align}}}

где e 1 = x ^ 1 - x 1 {\ displaystyle e_ {1} = {\ hat {x}} _ {1} -x_ {1}}e_ {1} = { \ hat {x}} _ {1} -x_ {1} - ошибка оценки для первого состояния оценить. Нелинейный закон управления v может быть разработан для применения скользящего коллектора

0 = x ^ 1 - x 1 {\ displaystyle 0 = {\ hat {x}} _ {1} -x_ {1}}0 = {\ hat {x}} _ {1} -x_ {1}

, поэтому эта оценка x ^ 1 {\ displaystyle {\ hat {x}} _ {1}}{\ hat {x}} _ {1} отслеживает реальное состояние x 1 {\ displaystyle x_ {1}}x_ {1} через некоторое конечное время (т. Е. x ^ 1 = x 1 {\ displaystyle {\ hat {x}} _ {1} = x_ {1}}{\ hat {x}} _ {1} = x_ {1} ). Следовательно, функция переключения управления скользящим режимом

σ (x ^ 1, x ^) ≜ e 1 = x ^ 1 - x 1. {\ displaystyle \ sigma ({\ hat {x}} _ {1}, {\ hat {x}}) \ треугольник e_ {1} = {\ hat {x}} _ {1} -x_ {1}. }\ sigma ({\ hat {x}} _ {1}, {\ hat {x }}) \ треугольник e_ {1} = {\ hat {x}} _ {1} -x_ {1}.

Для получения скользящего коллектора σ ˙ {\ displaystyle {\ dot {\ sigma}}}{\ dot {\ sigma}} и σ {\ displaystyle \ sigma}\ sigma всегда должен иметь противоположные знаки (т. е. σ σ ˙ < 0 {\displaystyle \sigma {\dot {\sigma }}<0}\ sigma {\ dot {\ sigma}} <0 для по существу всех x {\ displaystyle \ mathbf {x}}\ mathbf {x} ). Однако

σ ˙ знак равно e ˙ 1 знак равно a 11 e 1 + A 12 e 2 - v (e 1) = a 11 e 1 + A 12 e 2 - v (σ) {\ displaystyle {\ dot {\ sigma}} = {\ dot {e}} _ {1} = a_ {11} e_ {1} + A_ {12} \ mathbf {e} _ {2} -v (e_ {1}) = a_ {11 } e_ {1} + A_ {12} \ mathbf {e} _ {2} -v (\ sigma)}{\ dot {\ sigma}} = {\ dot {e}} _ { 1} = a_ {11} e_ {1} + A_ {12} \ mathbf {e} _ {2} -v (e_ {1}) = a_ {11} e_ {1} + A_ {12} \ mathbf { e} _ {2} -v (\ sigma)

где e 2 ≜ (e 2, e 3,…, en) ∈ R ( п - 1) {\ displaystyle \ mathbf {e} _ {2} \ треугольникq (e_ {2}, e_ {3}, \ ldots, e_ {n}) \ in \ mathbb {R} ^ {(n-1)}}\ mathbf {e} _ {2} \ треугольникq (e_ {2}, e_ {3}, \ ldots, e_ {n}) \ in \ mathbb {R} ^ {(n-1)} - это совокупность ошибок оценки для всех неизмеренных состояний. Чтобы гарантировать, что σ σ ˙ < 0 {\displaystyle \sigma {\dot {\sigma }}<0}\ sigma {\ dot {\ sigma}} <0 , пусть

v (σ) = M sgn ⁡ (σ) {\ displaystyle v (\ sigma) = M \ operatorname {sgn} (\ sigma) }v (\ sigma) = M \ operatorname {sgn} (\ sigma)

где

M>max {| а 11 е 1 + А 12 е 2 | }. {\ Displaystyle M>\ max \ {| a_ {11} e_ {1} + A_ {12} \ mathbf {e} _ {2} | \}.}M>\ max \ {| a_ { 11} e_ {1} + A_ {12} \ mathbf {e} _ {2} | \}.

То есть положительная константа M должна быть больше, чем масштабированная версия максимально возможных ошибок оценки для системы (т. е. начальных ошибок, которые предполагаются быть ограниченным так, чтобы M можно было выбрать достаточно большим; и). Если M достаточно велико, можно предположить, что система достигает e 1 = 0 {\ displaystyle e_ {1} = 0}e_ {1} = 0 (т. Е. x ^ 1 = x 1 {\ displaystyle {\ hat {x}} _ {1} = x_ {1}}{\ hat {x}} _ {1} = x_ {1} ). Поскольку e 1 {\ displaystyle e_ {1}}e_ {1} постоянно (т. е. 0) вдоль этого многообразия, e ˙ 1 = 0 {\ displaystyle {\ dot {e}} _ {1} = 0}{\ dot {e}} _ {1} = 0 . Следовательно, прерывистый контроль v (σ) {\ displaystyle v (\ sigma)}v (\ sigma) может быть заменен эквивалентным непрерывным контролем v eq {\ displ aystyle v _ {\ text {eq}}}v_{{{\text{eq}}}}где

0 = σ ˙ = a 11 e 1 ⏞ = 0 + A 12 e 2 - v eq ⏞ v (σ) = A 12 e 2 - v экв. {\ displaystyle 0 = {\ dot {\ sigma}} = a_ {11} {\ mathord {\ overbrace {e_ {1}} ^ {{} = 0}}} + A_ {12} \ mathbf {e} _ {2} - {\ mathord {\ overbrace {v _ {\ text {eq}}} ^ {v (\ sigma)}}} = A_ {12} \ mathbf {e} _ {2} -v _ {\ text { eq}}.}0 = {\ dot {\ sigma}} = a_ {11} {\ mathord {\ overbrace {e_ {1}} ^ {{} = 0}}} + A_ {12} \ mathbf {e} _ {2} - {\ mathord {\ overbrace {v _ {\ text {eq}}} ^ {v (\ sigma)}}} = A_ {12} \ mathbf {e} _ {2} - v _ {\ text {eq}}.

Итак,

v eq ⏟ scalar = A 12 ⏟ 1 × (n - 1) вектор e 2 ⏟ (n - 1) × 1 вектор. {\ displaystyle {\ mathord {\ underbrace {v _ {\ text {eq}}} _ {\ text {scalar}}}} = {\ mathord {\ underbrace {A_ {12}} _ {1 \ times (n- 1) \ atop {\ text {vector}}}}} {\ mathord {\ underbrace {\ mathbf {e} _ {2}} _ {(n-1) \ times 1 \ atop {\ text {vector}} }}}.}{\ displaystyle {\ mathord {\ underbrace {v _ {\ text {eq}}} _ {\ text {скаляр}}}} = {\ mathord {\ underbrace {A_ {12}} _ {1 \ times (n-1) \ atop {\ text {vector}}}}} {\ mathord {\ underbrace {\ mathbf {e} _ {2}} _ {(n-1) \ times 1 \ поверх {\ text {vector}}}}}.}

Этот эквивалентный элемент управления v eq {\ displaystyle v _ {\ text {eq}}}v_{{{\text{eq}}}}представляет вклад другого (n - 1) {\ displaystyle (n-1)}(n-1) соответствует траектории выходного состояния x 1 {\ displaystyle x_ {1}}x_ {1} . В частности, строка A 12 {\ displaystyle A_ {12}}A_ {12} действует как выходной вектор для подсистемы ошибок

[e ˙ 2 e ˙ 3 ⋮ e ˙ n] ⏞ e ˙ 2 = A 2 [e 2 e 3 ⋮ en] ⏞ e 2 + L 2 v (e 1) = A 2 e 2 + L 2 v eq = A 2 e 2 + L 2 A 12 e 2 = (A 2 + L 2 A 12) e 2. {\ Displaystyle {\ mathord {\ overbrace {\ begin {bmatrix} {\ dot {e}} _ {2} \\ {\ dot {e}} _ {3} \\\ vdots \\ {\ dot {e }} _ {n} \ end {bmatrix}} ^ {{\ dot {\ mathbf {e}}} _ {2}}}} = A_ {2} {\ mathord {\ overbrace {\ begin {bmatrix} e_ {2} \\ e_ {3} \\\ vdots \\ e_ {n} \ end {bmatrix}} ^ {\ mathbf {e} _ {2}}}} + L_ {2} v (e_ {1}) = A_ {2} \ mathbf {e} _ {2} + L_ {2} v _ {\ text {eq}} = A_ {2} \ mathbf {e} _ {2} + L_ {2} A_ {12 } \ mathbf {e} _ {2} = (A_ {2} + L_ {2} A_ {12}) \ mathbf {e} _ {2}.}{\ mathord {\ overbrace {\ begin {bmatrix} {\ dot {e}} _ {2} \\ {\ dot {e}} _ {3} \\\ vdots \\ {\ dot {e}} _ {n} \ end {bmatrix}} ^ {{\ dot { \ mathbf {e}}} _ {2}}}} = A_ {2} {\ mathord {\ overbrace {\ begin {bmatrix} e_ {2} \\ e_ {3} \\\ vdots \\ e_ {n } \ end {bmatrix}} ^ {\ mathbf {e} _ {2}}}} + L_ {2} v (e_ {1}) = A_ {2} \ mathbf {e} _ {2} + L_ { 2} v _ {\ text {eq}} = A_ {2} \ mathbf {e} _ {2} + L_ {2} A_ {12} \ mathbf {e} _ {2} = (A_ {2} + L_ {2} A_ {12}) \ mathbf {e} _ {2}.

Итак, чтобы убедиться в ошибке оценки е 2 {\ displaystyle \ mathbf {e} _ {2}}\ mathbf { e} _ {2} для неизмеренных состояний сходится к нулю, (n - 1) × 1 {\ displaystyle (n-1) \ times 1}(n-1) \ times 1 вектор L 2 {\ displaystyle L_ {2}}L_ {2} должен быть выбран так, чтобы (n - 1) × (n - 1) {\ displaystyle (n-1) \ times (n-1)}(n- 1) \ times (n-1) матрица (A 2 + L 2 A 12) {\ displaystyle (A_ {2} + L_ {2} A_ {12})}(A_ {2} + L_ {2} A_ {12}) равно Hurwitz (т. Е. Действительная часть каждого из его собственных значений должна быть отрицательной). Следовательно, при условии, что она наблюдаема, эта система e 2 {\ displaystyle \ mathbf {e} _ {2}}\ mathbf { e} _ {2} может быть стабилизирована точно так же, как и типичный линейный наблюдатель состояния, когда A 12 {\ displaystyle A_ {12}}A_ {12} рассматривается как выходная матрица (т. е. "C"). То есть, эквивалентный элемент управления v eq {\ displaystyle v _ {\ text {eq}}}v_{{{\text{eq}}}}предоставляет информацию об измерениях неизмеряемых состояний, которые могут непрерывно приближать их оценки к ним асимптотически. Между тем, прерывистый контроль v = M sgn ⁡ (x ^ 1 - x) {\ displaystyle v = M \ operatorname {sgn} ({\ hat {x}} _ {1} -x)}v = M \ operatorname { sgn} ({\ hat {x}} _ {1} -x) заставляет оценку измеренного состояния иметь нулевую ошибку за конечное время. Кроме того, белый симметричный измерительный шум с нулевым средним (например, гауссовский шум ) влияет только на частоту переключения элемента управления v, и, следовательно, шум будет иметь небольшое влияние на эквивалентное управление скользящим режимом v eq {\ displaystyle v _ {\ text {eq}}}v_{{{\text{eq}}}}. Следовательно, наблюдатель в скользящем режиме имеет фильтр Калмана - подобные особенности.

Таким образом, окончательная версия наблюдателя

x ^ ˙ = A x ^ + B u + LM sgn ⁡ (x ^ 1 - x 1) = A x ^ + B u + [- 1 L 2] M sign ⁡ (x ^ 1 - x 1) = A x ^ + B u + [- ML 2 M] sign ⁡ ( x ^ 1 - x 1) знак равно A x ^ + [B [- ML 2 M]] [u sgn ⁡ (x ^ 1 - x 1)] = A obs x ^ + B obs u obs {\ displaystyle {\ begin {выровнено} {\ dot {\ hat {\ mathbf {x}}}} = A {\ hat {\ mathbf {x}}} + B \ mathbf {u} + LM \ operatorname {sgn} ({\ hat {x}} _ {1} -x_ {1}) \\ = A {\ hat {\ mathbf {x}}} + B \ mathbf {u} + {\ begin {bmatrix} -1 \\ L_ { 2} \ end {bmatrix}} M \ operatorname {sgn} ({\ hat {x}} _ {1} -x_ {1}) \\ = A {\ hat {\ mathbf {x}}} + B \ mathbf {u} + {\ begin {bmatrix} -M \\ L_ {2} M \ end {bmatrix}} \ operatorname {sgn} ({\ hat {x}} _ {1} -x_ {1}) \\ = A {\ hat {\ mathbf {x}}} + {\ begin {bmatrix} B {\ begin {bmatrix} -M \\ L_ {2} M \ end {bmatrix}} \ end {bmatrix} } {\ begin {bmatrix} \ mathbf {u} \\\ OperatorName {sgn} ({\ hat {x}} _ {1} -x_ {1}) \ end {bmatrix}} \\ = A _ {\ текст {obs}} {\ hat {\ mathbf {x}}} + B _ {\ text {obs}} \ math bf {u} _ {\ text {obs}} \ end {align}}}{\ displaystyle {\ begin {align} {\ dot { \ hat {\ mathbf {x}}}} = A {\ hat {\ mathbf {x}}} + B \ mathbf {u} + LM \ operatorname {sgn} ({\ hat {x}} _ {1 } -x_ {1}) \\ = A {\ hat {\ mathbf {x}}} + B \ mathbf {u} + {\ begin {bmatrix} -1 \\ L_ {2} \ end {bmatrix} } M \ operatorname {sgn} ({\ hat {x}} _ {1} -x_ {1}) \\ = A {\ hat {\ mathbf {x}}} + B \ mathbf {u} + { \ begin {bmatrix} -M \\ L_ {2} M \ end {bmatrix}} \ operatorname {sgn} ({\ hat {x}} _ {1} -x_ {1}) \\ = A {\ шляпа {\ mathbf {x}}} + {\ begin {bmatrix} B {\ begin {bmatrix} -M \\ L_ {2} M \ end {bmatrix}} \ end {bmatrix}} {\ begin {bmatrix} \ mathbf {u} \\\ operatorname {sgn} ({\ hat {x}} _ {1} -x_ {1}) \ end {bmatrix}} \\ = A _ {\ text {obs}} {\ шляпа {\ mathbf {x}}} + B _ {\ text {obs}} \ mathbf {u} _ {\ text {obs}} \ end {align}}}

где

  • A obs ≜ A, {\ displaystyle A _ {\ text {obs}} \ треугольник A,}{\ displaystyle A _ {\ текст {обс}} \ треугольник А,}
  • B obs ≜ [B [- ML 2 M]], {\ displaystyle B _ {\ text {obs}} \ triggeredq {\ begin {bmatrix} B {\ begin {bmatrix} -M \\ L_ {2} M \ end {bmatrix}} \ end {bmatrix}},}{\ displaystyle B _ {\ text {obs}} \ треугольник {\ begin {bmatrix} B {\ begin {bmatrix} -M \\ L_ {2} M \ end {bmatrix}} \ end {bmatrix}},} и
  • u obs ≜ [u sgn ⁡ (x ^ 1 - x 1)]. {\ displaystyle u _ {\ text {obs}} \ треугольник {\ begin {bmatrix} \ mathbf {u} \\\ имя оператора {sgn} ({\ hat {x}} _ {1} -x_ {1}) \ end {bmatrix}}.}{\ displaystyle u _ {\ text {obs}} \ треугольник {\ begin {bmatrix} \ mathbf {u} \\\ operatorname {sgn} ({\ hat {x}} _ {1} -x_ {1}) \ end {bmatrix}}.}

То есть путем дополнения вектора управления u {\ displaystyle \ mathbf {u}}\ mathbf {u} функцией переключения sgn ⁡ (x ^ 1 - x 1) {\ displaystyle \ operatorname {sgn} ({\ hat {x}} _ {1} -x_ {1})}\ operatorname {sgn} ({\ hat {x}} _ {1} -x_ {1}) , наблюдатель скользящего режима может быть реализован как система LTI. То есть прерывистый сигнал sgn ⁡ (x ^ 1 - x 1) {\ displaystyle \ operatorname {sgn} ({\ hat {x}} _ {1} -x_ {1})}\ operatorname {sgn} ({\ hat {x}} _ {1} -x_ {1}) рассматривается как управляющий вход в систему LTI с двумя входами.

Для простоты в этом примере предполагается, что наблюдатель в скользящем режиме имеет доступ к измерению одного состояния (т. Е. Выход y = x 1 {\ displaystyle y = x_ {1}}y = x_ {1} ). Однако аналогичная процедура может использоваться для разработки наблюдателя скользящего режима для вектора взвешенных комбинаций состояний (т. Е. Когда вывод y = C x {\ displaystyle \ mathbf {y} = C \ mathbf {x}}\ mathbf {y} = C \ mathbf { x} использует общую матрицу C). В каждом случае скользящим режимом будет коллектор, в котором расчетный выход y ^ {\ displaystyle {\ hat {\ mathbf {y}}}}{\ hat {\ mathbf {y}}} соответствует измеренному выходу y { \ Displaystyle \ mathbf {y}}\ mathbf {y} с нулевой ошибкой (т.е. многообразие, где σ (x) ≜ y ^ - y = 0 {\ displaystyle \ sigma (\ mathbf {x}) \ треугольникq {\ hat {\ mathbf {y}}} - \ mathbf {y} = \ mathbf {0}}\ sigma (\ mathbf {x}) \ треугольник {\ hat {\ mathbf {y} }} - \ mathbf {y} = \ mathbf {0} ).

См. Также

Примечания

Ссылки

Дополнительная литература

Последняя правка сделана 2021-06-08 05:52:19
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте