Ричард Э. Беллман

редактировать
Ричард Эрнест Беллман
Ричард Эрнест Беллман.jpg
Родившийся Ричард Эрнест Беллман ( 1920-08-26)26 августа 1920 г. Нью-Йорк, Нью-Йорк, США
Умер 19 марта 1984 г. (1984-03-19)(63 года) Лос-Анджелес, Калифорния, США
Альма-матер Принстонский университет Университет Джона Хопкинса Университет Висконсина Бруклинский колледж
Известен Динамическое программирование Стохастическое динамическое программирование Проклятие размерности Задача линейного поиска Уравнение Беллмана Алгоритм Беллмана – Форда Проблема Беллмана « Затерянные в лесу» Алгоритм Беллмана – Хелда – Карпа Неравенство Гренволла – Беллмана Уравнение Гамильтона – Якоби – Беллмана
Награды Премия Джона фон Неймана за теорию (1976) Почетная медаль IEEE (1979) Премия Ричарда Э. Беллмана за культурное наследие (1984)
Научная карьера
Поля Математика и теория управления
Учреждения Университет Южной Калифорнии Rand Corporation Стэнфордский университет
Тезис Об ограниченности решений нелинейных дифференциальных и разностных уравнений
Докторант Соломон Лефшец
Докторанты Кристин Шумейкер

Ричард Эрнест Беллман (26 августа 1920 - 19 марта 1984) был американским прикладным математиком, который представил динамическое программирование в 1953 году и внес важный вклад в другие области математики.

СОДЕРЖАНИЕ
  • 1 Биография
  • 2 Работа
    • 2.1 Уравнение Беллмана
    • 2.2 Уравнение Гамильтона – Якоби – Беллмана
    • 2.3 Проклятие размерности
    • 2.4 Алгоритм Беллмана – Форда
  • 3 Публикации
  • 4 ссылки
  • 5 Дальнейшее чтение
    • 5.1 Статьи
  • 6 Внешние ссылки
биография

Беллман родился в 1920 году в Нью-Йорке в семье не практикующих еврейских родителей польского и русского происхождения Перл (урожденная Сафиан) и Джона Джеймса Беллман, которые управляли небольшим продуктовым магазином на Берген-стрит недалеко от Проспект-парка в Бруклине. По своим религиозным взглядам он был атеистом. Он учился в средней школе Авраама Линкольна в Бруклине в 1937 году и изучал математику в Бруклинском колледже, где в 1941 году получил степень бакалавра. Позже он получил степень магистра в Университете Висконсина. Во время Второй мировой войны он работал в группе теоретической физики в Лос-Аламосе. В 1946 году он получил докторскую степень в Принстоне под руководством Соломона Лефшеца. Начиная с 1949 года Беллман много лет работал в корпорации RAND, и именно в это время он разработал динамическое программирование.

Позже интересы Ричарда Беллмана стали уделять особое внимание биологии и медицине, которые он определил как «рубежи современной науки». В 1967 году он стал редактором-основателем журнала Mathematical Biosciences, который специализировался на публикации исследований прикладной математики для медицинских и биологических тем. В 1985 году в его честь была учреждена премия Беллмана в области математических биологических наук, которая дважды в год присуждается лучшей исследовательской работе журнала.

В 1973 году Беллману диагностировали опухоль головного мозга, которую удалили, но из-за осложнений он стал инвалидом. Он был профессором Университета Южной Калифорнии, членом Американской академии искусств и наук (1975), членом Национальной инженерной академии (1977) и членом Национальной академии наук (1983).

Он был награжден Почетной медалью IEEE в 1979 году «за вклад в процессы принятия решений и теорию систем управления, в частности, создание и применение динамического программирования». Его ключевая работа - уравнение Беллмана.

Работа

Уравнение беллмана

Уравнение Беллмана, также известное как уравнение динамического программирования, является необходимым условием оптимальности, связанной с математическим методом оптимизации, известным как динамическое программирование. Практически любую проблему, которую можно решить с помощью теории оптимального управления, можно также решить путем анализа соответствующего уравнения Беллмана. Уравнение Беллмана впервые было применено к инженерной теории управления и к другим темам прикладной математики, а впоследствии стало важным инструментом экономической теории.

Уравнение Гамильтона – Якоби – Беллмана.

Уравнение Гамильтона – Якоби – Беллмана (HJB) - это уравнение в частных производных, которое является центральным в теории оптимального управления. Решением уравнения HJB является «функция стоимости», которая дает оптимальную стоимость для данной динамической системы с соответствующей функцией стоимости. Классические вариационные задачи, например, проблема брахистохрона, также могут быть решены с помощью этого метода. Уравнение является результатом теории динамического программирования, впервые предложенной в 1950-х Ричардом Беллманом и его сотрудниками. Соответствующее уравнение для дискретного времени обычно называют уравнением Беллмана. В непрерывном времени, результат можно рассматривать как продолжение предыдущей работы в классической физике на уравнения Гамильтона-Якоби по Уильям Роуэн Гамильтон и Карл Густав Якоб Якоби.

Проклятие размерности

Основная статья: Проклятие размерности

Проклятие размерности является выражением придумано Беллманом для описания проблемы, вызванной экспоненциальным ростом объема, связанного с добавлением дополнительных измерений к (математическому) пространству. Одним из следствий проклятия размерности является то, что некоторые методы численного решения уравнения Беллмана требуют значительно больше компьютерного времени, когда в функции значения больше переменных состояния. Например, 100 равномерно расположенных точек выборки достаточно для выборки единичного интервала с расстоянием между точками не более 0,01; эквивалентная выборка 10-мерного единичного гиперкуба с решеткой с интервалом 0,01 между соседними точками потребует 10 20 точек выборки: таким образом, в некотором смысле можно сказать, что 10-мерный гиперкуб имеет коэффициент 10 18 " больше », чем единичный интервал. (Адаптировано из примера Р. Е. Беллмана, см. Ниже.)

Алгоритм Беллмана – Форда

Хотя алгоритм обнаружения после того, как Ford, он упоминается в алгоритме Беллмана-Форда, также иногда называют в качестве метки, исправляющих Алгоритм, вычисляет одного источника кратчайшего пути в весовом орграфа, где некоторые из краевых весов может быть отрицательным. Алгоритм Дейкстры решает ту же проблему с меньшим временем работы, но требует, чтобы веса ребер были неотрицательными.

Публикации

За свою карьеру он опубликовал 619 статей и 39 книг. За последние 11 лет своей жизни он опубликовал более 100 статей, несмотря на тяжелые осложнения операций на головном мозге (Dreyfus, 2003). Подборка:

  • 1957. Динамическое программирование.
  • 1959. Асимптотическое поведение решений дифференциальных уравнений.
  • 1961. Введение в неравенство
  • 1961. Адаптивные процессы управления: экскурсия.
  • 1962. Прикладное динамическое программирование.
  • 1967. Введение в математическую теорию процессов управления.
  • 1970. Алгоритмы, графики и компьютеры.
  • 1972. Динамическое программирование и уравнения с частными производными.
  • 1982. Математические аспекты планирования и приложений.
  • 1983. Математические методы в медицине.
  • 1984. Уравнения в частных производных.
  • 1984. Глаз урагана: автобиография, всемирное научное издание.
  • 1985. Искусственный интеллект.
  • 1995. Современные элементарные дифференциальные уравнения.
  • 1997. Введение в матричный анализ.
  • 2003. Динамическое программирование.
  • 2003. Методы возмущений в математике, инженерии и физике.
  • 2003. Теория устойчивости дифференциальных уравнений (первоначально опубликовано в 1953 г.).
Рекомендации
дальнейшее чтение

Статьи

Внешние ссылки
Последняя правка сделана 2023-04-17 10:42:40
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте