Лагранжева релаксация

редактировать

В области математической оптимизации, лагранжевой релаксации является релаксация метод, который приближает сложную задачу оптимизации с ограничениями более простой задачей. Решение ослабленной проблемы является приближенным решением исходной проблемы и предоставляет полезную информацию.

Метод штрафует нарушения ограничений неравенства с помощью множителя Лагранжа, который накладывает штраф за нарушения. Эти дополнительные затраты используются вместо строгих ограничений неравенства при оптимизации. На практике эту упрощенную задачу часто можно решить легче, чем исходную.

Задача максимизации лагранжевой функции двойственных переменных (лагранжевых множителей) является лагранжевой двойственной задачей.

Содержание
  • 1 Математическое описание
  • 2 Решение LR как граница
  • 3 Переход к решению исходной задачи
  • 4 Связанные методы
  • 5 Ссылки
    • 5.1 Книги
    • 5.2 Статьи
Математическое описание

Предположим, нам дан задача линейного программирования с x ∈ R n {\ displaystyle x \ in \ mathbb {R} ^ {n}}x \ in \ mathbb {R} ^ { n} и A ∈ R m, n { \ displaystyle A \ in \ mathbb {R} ^ {m, n}}A \ in \ mathbb {R} ^ {m, n} следующего вида:

maxc T x {\ displaystyle c ^ {T} x}c ^ T x
ул
A x ≤ b {\ displaystyle Ax \ leq b}Ax \ le b

Если мы разделим ограничения в A {\ displaystyle A}A так, чтобы A 1 ∈ R m 1 п {\ displaystyle A_ {1} \ in \ mathbb {R} ^ {m_ {1}, n}}A_1 \ in \ mathbb {R} ^ {m_1, n} , A 2 ∈ R m 2, n {\ displaystyle A_ {2} \ in \ mathbb {R } ^ {m_ {2}, n}}A_2 \ in \ mathbb {R} ^ {m_2, n} и m 1 + m 2 = m {\ displaystyle m_ {1} + m_ {2} = m}m_1 + m_2 = m мы может записать систему:

maxc T x {\ displaystyle c ^ {T} x}c ^ T x
st
(1)A 1 x ≤ b 1 {\ displaystyle A_ {1} x \ leq b_ {1}}A_1 x \ le b_1
(2)A 2 x ≤ b 2 {\ displaystyle A_ { 2} x \ leq b_ {2}}A_2 x \ le b_2

Мы можем ввести ограничение (2) в цель:

maxc T x + λ T (b 2 - A 2 x) {\ displaystyle c ^ {T} x + \ lambda ^ {T} (b_ {2} -A_ {2} x)}c ^ T x + \ lambda ^ T (b_2-A_2x)
ул.
(1)A 1 x ≤ b 1 {\ displaystyle A_ {1} x \ leq b_ {1}}A_1 x \ le b_1

Если мы допустим λ = (λ 1,…, λ m 2) {\ displaystyle \ lambda = (\ lambda _ {1}, \ ldots, \ lambda _ {m_ {2}})}\lambda=(\lambda_1,\ldots,\lambda_{m_2})быть неотрицательными весами, мы штрафуемся, если нарушаем ограничение (2), и мы также будем вознаграждены, если строго соблюдаем ограничение. Вышеупомянутая система называется лагранжевой релаксацией нашей исходной задачи.

Решение LR как граница

В частности, используется свойство, которое для любого фиксированного набора λ ~ {\ displaystyle {\ tilde {\ lambda}}}{\ tilde {\ lambda}} , оптимальный результат для задачи лагранжевой релаксации будет не меньше, чем оптимальный результат для исходной задачи. Чтобы убедиться в этом, пусть x ^ {\ displaystyle {\ hat {x}}}{\ hat {x} } будет оптимальным решением исходной задачи, и пусть x ¯ {\ displaystyle {\ bar { x}}}{\ bar {x}} - оптимальное решение лагранжевой релаксации. Тогда мы можем видеть, что

c T x ^ ≤ c T x ^ + λ ~ T (b 2 - A 2 x ^) ≤ c T x ¯ + λ ~ T (b 2 - A 2 x ¯) {\ displaystyle c ^ {T} {\ hat {x}} \ leq c ^ {T} {\ hat {x}} + {\ tilde {\ lambda}} ^ {T} (b_ {2} -A_ {2} {\ hat {x}}) \ leq c ^ {T} {\ bar {x}} + {\ tilde {\ lambda}} ^ {T} (b_ {2} -A_ {2} {\ bar {x }})}c ^ T \ hat {x} \ leq c ^ T \ hat {x} + \ tilde {\ лямбда} ^ T (b_2-A_2 \ hat {x}) \ leq c ^ T \ bar {x} + \ tilde {\ lambda} ^ T (b_2-A_2 \ bar {x})

Первое неравенство верно, потому что x ^ {\ displaystyle {\ hat {x}}}{\ hat {x} } выполнимо в исходной задаче, а второе неравенство верно, потому что x ¯ {\ displaystyle {\ bar {x}}}{\ bar {x}} - оптимальное решение лагранжевой релаксации.

Итерация в направлении решения исходной задачи

Вышеупомянутое неравенство говорит нам, что если мы минимизируем максимальное значение, которое мы получаем из упрощенной задачи, мы получим более жесткий предел для объективного значения нашей исходная проблема. Таким образом, мы можем решить исходную проблему, вместо этого исследуя частично дуализированную задачу

minP (λ) {\ displaystyle P (\ lambda)}P (\ lambda) s.t.λ ≥ 0 {\ displaystyle \ lambda \ geq 0}\ lambda \ geq 0

где мы определяем P (λ) {\ displaystyle P (\ lambda)}P (\ lambda) как

maxc T x + λ T (b 2 - A 2 x) {\ displaystyle c ^ {T} x + \ lambda ^ {T} (b_ {2} -A_ {2} x)}c ^ T x + \ lambda ^ T (b_2-A_2x)
ул.
(1)A 1 x ≤ b 1 {\ displaystyle A_ {1} x \ leq b_ {1}}A_1 x \ le b_1

Таким образом, алгоритм лагранжевой релаксации переходит к исследованию диапазона возможных λ { \ displaystyle \ lambda}\ lambda , пытаясь минимизировать результат, возвращаемый внутренней проблемой P {\ displaystyle P}P . Каждое значение, возвращаемое параметром P {\ displaystyle P}P , является потенциальной верхней границей проблемы, наименьшее из которых сохраняется в качестве наилучшей верхней границы. Если мы дополнительно используем эвристику, возможно, засеянную значениями x ¯ {\ displaystyle {\ bar {x}}}{\ bar {x}} , возвращаемыми P {\ displaystyle P}P , чтобы найти возможные решения исходной проблемы, затем мы можем выполнять итерацию до тех пор, пока лучшая верхняя граница и стоимость наилучшего допустимого решения не сойдутся до желаемого допуска.

Связанные методы

расширенный лагранжев метод по духу очень похож на метод лагранжевой релаксации, но добавляет дополнительный член и обновляет двойные параметры λ {\ displaystyle \ lambda}\ lambda более принципиальным образом. Он был представлен в 1970-х годах и широко использовался.

Метод штрафа не использует двойные переменные, а скорее удаляет ограничения и вместо этого штрафует отклонения от ограничения. Этот метод концептуально прост, но, как правило, на практике предпочтительнее использовать расширенные лагранжевые методы, поскольку метод штрафов страдает от проблем с плохой обусловленностью.

Ссылки

Книги

  • Равиндра К. Ахуджа, Томас Л. Магнанти и Джеймс Б. Орлин (1993). Сетевые потоки: теория, алгоритмы и приложения. Прентис Холл. ISBN 0-13-617549-X. CS1 maint: несколько имен: список авторов (ссылка )
  • Берцекас, Дмитрий П. (1999). Нелинейный Программирование: 2-е издание. Athena Scientific. ISBN 1-886529-00-0.
  • Bonnans, J. Frédéric; Gilbert, J. Charles; Lemaréchal, Claude ; Sagastizábal, Claudia A. (2006). Численная оптимизация: теоретические и практические аспекты. Universitext (Второе исправленное издание перевода французского издания 1997 года). Берлин: Springer -Verlag. Pp. Xiv + 490. doi : 10.1007 / 978-3-540-35447-5. ISBN 3-540-35445 -X. MR 2265882.
  • Hiriart-Urruty, Jean-Baptiste; Lemaréchal, Claude (1993). Выпуклый анализ и алгоритмы минимизации, Том I: Основы. Grundlehren der Mathematischen Wissenschaften [Fundamental Principles of Mathematical Наук]. 305 . Berlin: Springer-Verlag. Pp. Xviii + 417. ISBN 3-540-56850-6. MR 1261420.
  • Hiriart-Urruty, Жан-Батист; Лемарешаль, Клод (1993). «14 двойственности для практикующих». Выпуклый анализ и алгоритмы минимизации, Том II: Расширенная теория и методы связки. Grundlehren der Mathematischen Wissenschaften [Основные принципы математических наук]. 306 . Берлин: Springer-Verlag. С. xviii + 346. ISBN 3-540-56852-2.
  • Ласдон, Леон С. (2002). Теория оптимизации для больших систем (переиздание 1970 Macmillan ed.). Минеола, Нью-Йорк: Dover Publications, Inc., стр. Xiii + 523. MR 1888251. CS1 maint: ref = harv (link )
  • Lemaréchal, Claude (2001). «Лагранжианская релаксация». У Михаэля Юнгера и Дениса Наддефа (ред.) Вычислительная комбинаторная оптимизация: доклады весенней школы, прошедшей в Шлос-Дагштуле, 15–19 мая 2000 г. Лекционные заметки по компьютерным наукам. 2241 . Берлин: Springer-Verlag, стр. 112–156. doi : 10.1007 / 3-540-45586-8_4. ISBN 3-540-42877-1. MR 1900016. CS1 maint: ref = harv (ссылка )
  • (1986). Математическое программирование: теория и алгоритмы. Эгон Балас (предисловие) (Перевод Стивена Вайды из французского изд. (1983 Paris: Dunod)). Чичестер: Публикация Wiley-Interscience. John Wiley Sons, Ltd., стр. Xxviii + 489. ISBN 0-471-90170-9. MR 0868279. (Второе издание 2008 г., на французском: Математическое программирование: Теория и алгоритмы. Издания Tec Doc, Париж, 2008. xxx + 711 стр.). CS1 maint: ref = harv (ссылка )

Статьи

  • Эверетт, Хью, III (1963). "Generaliz под ред. Метод множителей Лагранжа для решения задач оптимального распределения ресурсов ». Исследование операций. 11 (3): 399–417. doi : 10.1287 / opre.11.3.399. JSTOR 168028. MR 0152360. CS1 maint: ref = harv (ссылка )
  • Kiwiel, Krzysztof C.; Larsson, Torbjörn; Lindberg, PO ( Август 2007 г.). «Лагранжева релаксация с помощью методов шарикового субградиента». Математика исследования операций. 32 (3): 669–686. doi : 10.1287 / moor.1070.0261. MR 2348241. CS1 maint: ref = harv (ссылка )
Последняя правка сделана 2021-05-26 11:13:37
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте