Линеаризация обратной связи

редактировать

Подход, используемый в управлении нелинейными системами

Блок-схема, иллюстрирующая линеаризацию обратной связи нелинейной системы

Линеаризация обратной связи это общий подход, используемый для управления нелинейными системами. Подход включает в себя преобразование нелинейной системы в эквивалентную линейную систему путем замены переменных и подходящего управляющего входа. Линеаризация обратной связи может применяться к нелинейным системам вида

x ˙ = f (x) + g (x) u (1) y = h (x) (2) {\ displaystyle {\ begin {align} {\ точка {x}} = f (x) + g (x) u \ qquad (1) \\ y = h (x) \ qquad \ qquad \ qquad (2) \ end {align}}}

\ begin {align} \ dot {x} = f (x) + g (x) u \ qquad (1) \\ y = h (x) \ qquad \ qquad \ qquad (2) \ end {align}

где $x ∈ R n {\ displaystyle x \ in \ mathbb {R} ^ {n}}$ $x \ in \ mathbb {R} ^ n$ - вектор состояния, $u ∈ R p {\ displaystyle u \ in \ mathbb {R} ^ {p}}$ $u \ in \ mathbb {R} ^ p$ - вектор входных данных, а $y ∈ R m {\ displaystyle y \ in \ mathbb {R} ^ {m}}$ $y \ in \ mathbb {R} ^ m$ - вектор выходов. Цель состоит в том, чтобы разработать управляющий ввод

u = a (x) + b (x) v {\ displaystyle u = a (x) + b (x) v \,}

u = a (x) + b (x) v \,

, который отображает линейный ввод– карта вывода между новым вводом $v {\ displaystyle v}$ $v$ и выводом. Затем может быть применена стратегия управления внешним контуром для полученной линейной системы управления.

Содержание

1 Линеаризация обратной связи систем SISO
- 1.1 Производная Ли
- 1.2 Относительная степень
- 1.3 Линеаризация по обратной связи
- 1.4 Нестабильная динамика нуля
2 См. Также
3 Далее чтение
4 Внешние ссылки

Линеаризация обратной связи систем SISO

Здесь рассмотрим случай линеаризации обратной связи системы с одним входом и одним выходом (SISO). Подобные результаты могут быть распространены на системы с множеством входов и множеством выходов (MIMO). В этом случае $u ∈ R {\ displaystyle u \ in \ mathbb {R}}$ $u \ in \ mathbb {R}$ и $y ∈ R {\ displaystyle y \ in \ mathbb {R}}$ $y \ in \ mathbb {R}$ . Цель состоит в том, чтобы найти преобразование координат $z = T (x) {\ displaystyle z = T (x)}$ $z = T (x)$ , которое преобразует систему (1) в так называемую нормальную форму который покажет закон обратной связи формы

u = a (x) + b (x) v {\ displaystyle u = a (x) + b (x) v \,}

u = a (x) + b (x) v \,

, который будет визуализировать линейную карту ввода-вывода из нового ввода $v ∈ R {\ displaystyle v \ in \ mathbb {R}}$ $v \ in \ mat hbb {R}$ в вывод $y {\ displaystyle y}$ $y$ . Чтобы преобразованная система была эквивалентным представлением исходной системы, преобразование должно быть диффеоморфизмом. То есть преобразование должно быть не только обратимым (т. Е. Биективным), но и преобразование, и его обратное должны быть гладкими, чтобы дифференцируемость в исходной системе координат сохранялась в новой системе координат. На практике преобразование может быть только локально диффеоморфным, но результаты линеаризации сохраняются только в этой меньшей области.

Для решения этой проблемы требуется несколько инструментов.

Производная Ли

Целью линеаризации обратной связи является создание преобразованной системы, состояниями которой являются выход $y {\ displaystyle y}$ $y$ и его первый $(n - 1) {\ displaystyle (n-1)}$ $(n-1)$ производные. Чтобы понять структуру этой целевой системы, мы используем производную Ли. Рассмотрим производную по времени от (2), которую можно вычислить, используя цепное правило ,

y ˙ = dh (x) dt = dh (x) dxx ˙ = dh (x) dxf (x) + dh ( х) dxg (х) и {\ displaystyle {\ begin {align} {\ dot {y}} = {\ frac {\ mathrm {d} h (x)} {\ mathrm {d} t}} = { \ frac {\ mathrm {d} h (x)} {\ mathrm {d} x}} {\ dot {x}} \\ = {\ frac {\ mathrm {d} h (x)} {\ mathrm {d} x}} f (x) + {\ frac {\ mathrm {d} h (x)} {\ mathrm {d} x}} g (x) u \ end {align}}}

{\ displaystyle {\ begin { выровнено} {\ dot {y}} = {\ frac {\ mathrm {d} h (x)} {\ mathrm {d} t}} = {\ frac {\ mathrm {d} h (x)} { \ mathrm {d} x}} {\ dot {x}} \\ = {\ frac {\ mathrm {d} h (x)} {\ mathrm {d} x}} f (x) + {\ frac {\ mathrm {d} час (x)} {\ mathrm {d} x}} g (x) u \ end {align}}}

Теперь мы можем определить производную Ли от $h (x) {\ displaystyle h (x)}$ $час (x)$ по $f (x) {\ displaystyle f (x)}$ $f (x)$ как,

L fh (x) = dh (x) dxf (x), {\ displaystyle L_ {f} h (x) = {\ frac {\ mathrm {d} h (x)} {\ mathrm { d} x}} f (x),}

{\ displaystyle L_ {f} час (x) = {\ frac {\ mathrm {d} h (x)} {\ mathrm {d} x}} f (x),}

и аналогично производная Ли от $h (x) {\ displaystyle h (x)}$ $час (x)$ вдоль $g (x) {\ displaystyle g (x)}$ $g (x)$ as,

L gh (x) = dh (x) dxg (x). {\ displaystyle L_ {g} h (x) = {\ frac {\ mathrm {d} h (x)} {\ mathrm {d} x}} g (x).}

{\ displaystyle L_ {g} h (x) = {\ frac {\ mathrm {d} h (x)} {\ mathrm {d} x}} g (x).}

В этом новом обозначении мы может выражать $y ˙ {\ displaystyle {\ dot {y}}}$ ${\ dot {y }}$ as,

y ˙ = L fh (x) + L gh (x) u {\ displaystyle {\ dot {y}} = L_ {f} h (x) + L_ {g} h (x) u}

\ dot {y} = L_ {f} h (x) + L_ {g} h (x) u

Обратите внимание, что обозначение производных Ли удобно, когда мы берем множественные производные по одному и тому же векторному полю, или другой. Например,

L f 2 h (x) = L f L fh (x) = d (L fh (x)) dxf (x), {\ displaystyle L_ {f} ^ {2} h (x) = L_ {f} L_ {f} h (x) = {\ frac {\ mathrm {d} (L_ {f} h (x))} {\ mathrm {d} x}} f (x),}

{\ displaystyle L_ {f} ^ {2} час (x) = L_ {f} L_ {f} h (x) = {\ frac {\ mathrm {d} (L_ {f} h (x)) } {\ mathrm {d} x}} f (x),}

L g L fh (x) = d (L fh (x)) dxg (x). {\ displaystyle L_ {g} L_ {f} h (x) = {\ frac {\ mathrm {d} (L_ {f} h (x))} {\ mathrm {d} x}} g (x). }

{\ displaystyle L_ {g} L_ {f} h (x) = {\ frac {\ mathrm {d} (L_ {f} h (x))} {\ mathrm {d} x}} g (x).}

Относительная степень

В нашей линеаризованной системе обратной связи, состоящей из вектора состояния выхода $y {\ displaystyle y}$ $y$ и его первого $(n - 1) {\ displaystyle (n-1)}$ $(n-1)$ производные, мы должны понимать, как ввод $u {\ displaystyle u}$ $u$ попадает в систему. Для этого введем понятие относительной степени. Наша система (1) и (2), как говорят, имеет относительную степень $r ∈ W {\ displaystyle r \ in \ mathbb {W}}$ $r \ in \ mathbb {W}$ в точке $x 0 { \ displaystyle x_ {0}}$ $x_ {0}$ if,

L g L fkh (x) = 0 ∀ x {\ displaystyle L_ {g} L_ {f} ^ {k} h (x) = 0 \ qquad \ forall x}

L_ {g} L_ {f} ^ {k} h (x) = 0 \ qquad \ forall x

в окрестности из

x 0 {\ displaystyle x_ {0}}

x_ {0}

и всех

k ≤ r - 2 {\ displaystyle k \ leq r-2}

k \ leq r-2

L g L fr - 1 час (x 0) ≠ 0 {\ displaystyle L_ {g} L_ {f} ^ {r-1} h (x_ {0})) \ neq 0}

L_ {g} L_ {f} ^ {r-1} h (x_0) \ neq 0

Рассматривая это определение относительной степени в свете выражения производной по времени выходных данных $y {\ displaystyle y}$ $y$ , мы можем рассматривать относительную степень нашей система (1) и (2) - количество раз, которое нам нужно дифференцировать вывод $y {\ displaystyle y}$ $y$ перед вводом $u {\ displaystyle u}$ $u$ отображается явно. В системе LTI относительная степень - это разница между степенью полинома знаменателя передаточной функции (т. Е. Числом полюсов ) и степенью полинома ее числителя (т. Е. Числом из нулей ).

Линеаризация по обратной связи

Для дальнейшего обсуждения мы предположим, что относительная степень системы равна $n {\ displaystyle n}$ $n$ . В этом случае, после дифференцирования вывода $n {\ displaystyle n}$ $n$ раз, мы имеем

y = h (x) y ˙ = L fh (x) y ¨ = L f 2 час (Икс) ⋮ Y (N - 1) знак равно L fn - 1 час (x) y (n) = L fnh (x) + L g L fn - 1 час (x) u {\ displaystyle {\ begin {выровнено } y = h (x) \\ {\ dot {y}} = L_ {f} h (x) \\ {\ ddot {y}} = L_ {f} ^ {2} h (x) \ \ \ vdots \\ y ^ {(n-1)} = L_ {f} ^ {n-1} h (x) \\ y ^ {(n)} = L_ {f} ^ {n} h (x) + L_ {g} L_ {f} ^ {n-1} h (x) u \ end {align}}}

\ begin {align} y = h (x) \\ \ dot {y} = L_ {f} h (x) \\ \ ddot {y} = L_ {f} ^ {2} h (x) \\ \ vdots \\ y ^ {(n-1)} = L_ {f} ^ {n-1} h (x) \\ y ^ {(n)} = L_ {f} ^ {n} h (x) + L_ {g} L_ {f} ^ {n-1} h (x) u \ end {align}

, где обозначение $y (n) {\ displaystyle y ^ { (n)}}$ $y ^ {(n) }$ указывает $n {\ displaystyle n}$ $n$ -ю производную от $y {\ displaystyle y}$ $y$ . Поскольку мы предположили, что относительная степень системы равна $n {\ displaystyle n}$ $n$ , производные Ли вида $L g L fih (x) {\ displaystyle L_ {g} L_ {f} ^ {i} h (x)}$ $L_ {g} L_ {f} ^ {i} h (x)$ для $i = 1,…, n - 2 {\ displaystyle i = 1, \ dots, n-2}$ $i = 1, \ dots, n-2$ все равны нулю. То есть вход $u {\ displaystyle u}$ $u$ не имеет прямого вклада ни в один из первых $(n - 1) {\ displaystyle (n-1)}$ $(n-1)$ -ые производные.

Преобразование координат $T (x) {\ displaystyle T (x)}$ $T (x)$ , которое переводит систему в нормальную форму, происходит от первого $(n - 1) { \ displaystyle (n-1)}$ $(n-1)$ производные. В частности,

z = T (x) = [z 1 (x) z 2 (x) ⋮ zn (x)] = [yy ˙ ⋮ y (n - 1)] = [h (x) L fh (Икс) ⋮ L fn - 1 час (Икс)] {\ Displaystyle Z = T (x) = {\ begin {bmatrix} z_ {1} (x) \\ z_ {2} (x) \\\ vdots \ \ z_ {n} (x) \ end {bmatrix}} = {\ begin {bmatrix} y \\ {\ dot {y}} \\\ vdots \\ y ^ {(n-1)} \ end {bmatrix }} = {\ begin {bmatrix} h (x) \\ L_ {f} h (x) \\\ vdots \\ L_ {f} ^ {n-1} h (x) \ end {bmatrix}}}

z = T (x) = \ begin {bmatrix} z_1 (x) \\ z_2 (x) \\ \ vdots \\ z_n (x) \ end {bmatrix} = \ begin {bmatrix} y \\ \ dot {y} \\ \ vdots \\ y ^ {(n-1)} \ end {bmatrix} = \ begin {bmatrix} h (x) \\ L_ {f} h (x) \\ \ vdots \\ L_ {f} ^ {n-1} h (x) \ end {bmatrix}

преобразует траектории из исходной системы координат $x {\ displaystyle x}$ $x$ в новую систему координат $z {\ displaystyle z}$ $z$ . Пока это преобразование является диффеоморфизмом, гладкие траектории в исходной системе координат будут иметь уникальные аналоги в системе координат $z {\ displaystyle z}$ $z$ , которые также являются гладкими. Эти $z {\ displaystyle z}$ $z$ траектории будут описаны новой системой:

{z ˙ 1 = L fh (x) = z 2 (x) z ˙ 2 = L f 2 h (x) знак равно z 3 (x) ⋮ z ˙ n знак равно L fnh (x) + L g L fn - 1 h (x) u. {\ displaystyle {\ begin {cases} {\ dot {z}} _ {1} = L_ {f} h (x) = z_ {2} (x) \\ {\ dot {z}} _ {2 } = L_ {f} ^ {2} h (x) = z_ {3} (x) \\ \ vdots \\ {\ dot {z}} _ {n} = L_ {f} ^ {n } h (x) + L_ {g} L_ {f} ^ {n-1} h (x) u \ end {cases}}.}

\ begin {cases} \ dot {z} _1 = L_ {f} h (x) = z_2 (x) \\ \ dot {z} _2 = L_ {f} ^ {2} h (x) = z_3 (x) \\ \ vdots \\ \ dot {z} _n = L_ {f } ^ {n} h (x) + L_ {g} L_ {f} ^ {n-1} h (x) u \ end {case}.

Следовательно, закон управления с обратной связью

u = 1 L g L fn - 1 час (x) (- L fnh (x) + v) {\ displaystyle u = {\ frac {1} {L_ {g} L_ {f} ^ {n-1} h (x)}} (-L_ {f} ^ {n} h (x) + v)}

u = \ frac {1} {L_ {g} L_ {f} ^ {n-1} h (x)} (- L_ {f} ^ {n} h (x) + v)

отображает линейную карту ввода-вывода от $v {\ displaystyle v}$ $v$ до $z 1 знак равно y {\ displaystyle z_ {1} = y}$ $z_1 = y$ . Полученная в результате линеаризованная система

{z ˙ 1 = z 2 z ˙ 2 = z 3 ⋮ z ˙ n = v {\ displaystyle {\ begin {cases} {\ dot {z}} _ {1} = z_ { 2} \\ {\ dot {z}} _ {2} = z_ {3} \\ \ vdots \\ {\ dot {z}} _ {n} = v \ end {case}}}

\ begin {cases} \ dot {z} _1 = z_2 \\ \ dot {z} _2 = z_3 \ \ \ vdots \\ \ dot {z} _n = v \ end {case}

представляет собой каскад из $n {\ displaystyle n}$ $n$ интеграторов, а управление внешним контуром $v {\ displaystyle v}$ $v$ может быть выбрано с использованием стандартных линейных системная методология. В частности, закон управления с обратной связью по состоянию

v = - K z, {\ displaystyle v = -Kz \ qquad,}

v = -Kz \ qquad,

, где вектор состояния $z {\ displaystyle z}$ $z$ - это выходные $y {\ displaystyle y}$ $y$ и его первые $(n - 1) {\ displaystyle (n-1)}$ $(n-1)$ производные, приводит к система LTI

z ˙ = A z {\ displaystyle {\ dot {z}} = Az}

\ dot {z} = Az

с,

A = [0 1 0… 0 0 0 1… 0 ⋮ ⋮ ⋮ ⋱ ⋮ 0 0 0… 1 - k 1 - k 2 - k 3… - kn]. {\ displaystyle A = {\ begin {bmatrix} 0 1 0 \ ldots 0 \\ 0 0 1 \ ldots 0 \\\ vdots \ vdots \ vdots \ ddots \ vdots \\ 0 0 0 \ ldots 1 \\ - k_ {1} -k_ {2} - k_ {3} \ ldots -k_ {n} \ end {bmatrix}}.}

A = \ begini n {bmatrix} 0 1 0 \ ldots 0 \\ 0 0 1 \ ldots 0 \\ \ vdots \ vdots \ vdots \ ddots \ vdots \\ 0 0 0 \ ldots 1 \\ -k_1 -k_2 -k_3 \ ldots -k_n \ end {bmatrix}.

Итак, при соответствующем выборе $k {\ displaystyle k}$ $k$ , мы можем произвольно разместить полюса замкнутого контура линеаризованной системы.

Нестабильная динамика нуля

Линеаризация обратной связи может быть выполнена с системами, относительная степень которых меньше $n {\ displaystyle n}$ $n$ . Однако нормальная форма системы будет включать нулевую динамику (то есть состояния, которые не наблюдаются на выходе системы), которые могут быть нестабильными. На практике нестабильная динамика может иметь пагубные последствия для системы (например, для внутренних состояний системы может быть опасно расти неограниченное количество раз). Эти ненаблюдаемые состояния могут быть управляемыми или, по крайней мере, стабильными, и поэтому могут быть приняты меры, чтобы гарантировать, что эти состояния не вызывают проблем на практике. Системы с минимальной фазой дают некоторое представление о нулевой динамике.

См. Также

Нелинейное управление

Дополнительная литература

Внешние ссылки

ECE 758: Моделирование и нелинейное управление однолинейным гибким совместным манипулятором - Дает объяснение и применение линеаризации с обратной связью.
ECE 758: Пример линеаризации шарика в трубе - Тривиальное применение линеаризации для системы, уже находящейся в нормальной форме (т.е. преобразование координат не требуется).
Язык Wolfram для выполнения линеаризации обратной связи, вычисления относительных порядков и определения динамики нуля.