Ричард Эрнест Беллман (26 августа 1920 - 19 марта 1984) был американским прикладным математиком, который представил динамическое программирование в 1953 году и внес важный вклад в другие области математики.
Беллман родился в 1920 году в Нью-Йорке в семье не практикующих еврейских родителей польского и русского происхождения Перл (урожденная Сафиан) и Джона Джеймса Беллман, которые управляли небольшим продуктовым магазином на Берген-стрит недалеко от Проспект-парка в Бруклине. По своим религиозным взглядам он был атеистом. Он учился в средней школе Авраама Линкольна в Бруклине в 1937 году и изучал математику в Бруклинском колледже, где в 1941 году получил степень бакалавра. Позже он получил степень магистра в Университете Висконсина. Во время Второй мировой войны он работал в группе теоретической физики в Лос-Аламосе. В 1946 году он получил докторскую степень в Принстоне под руководством Соломона Лефшеца. Начиная с 1949 года Беллман много лет работал в корпорации RAND, и именно в это время он разработал динамическое программирование.
Позже интересы Ричарда Беллмана стали уделять особое внимание биологии и медицине, которые он определил как «рубежи современной науки». В 1967 году он стал редактором-основателем журнала Mathematical Biosciences, который специализировался на публикации исследований прикладной математики для медицинских и биологических тем. В 1985 году в его честь была учреждена премия Беллмана в области математических биологических наук, которая дважды в год присуждается лучшей исследовательской работе журнала.
В 1973 году Беллману диагностировали опухоль головного мозга, которую удалили, но из-за осложнений он стал инвалидом. Он был профессором Университета Южной Калифорнии, членом Американской академии искусств и наук (1975), членом Национальной инженерной академии (1977) и членом Национальной академии наук (1983).
Он был награжден Почетной медалью IEEE в 1979 году «за вклад в процессы принятия решений и теорию систем управления, в частности, создание и применение динамического программирования». Его ключевая работа - уравнение Беллмана.
Уравнение Беллмана, также известное как уравнение динамического программирования, является необходимым условием оптимальности, связанной с математическим методом оптимизации, известным как динамическое программирование. Практически любую проблему, которую можно решить с помощью теории оптимального управления, можно также решить путем анализа соответствующего уравнения Беллмана. Уравнение Беллмана впервые было применено к инженерной теории управления и к другим темам прикладной математики, а впоследствии стало важным инструментом экономической теории.
Уравнение Гамильтона – Якоби – Беллмана (HJB) - это уравнение в частных производных, которое является центральным в теории оптимального управления. Решением уравнения HJB является «функция стоимости», которая дает оптимальную стоимость для данной динамической системы с соответствующей функцией стоимости. Классические вариационные задачи, например, проблема брахистохрона, также могут быть решены с помощью этого метода. Уравнение является результатом теории динамического программирования, впервые предложенной в 1950-х Ричардом Беллманом и его сотрудниками. Соответствующее уравнение для дискретного времени обычно называют уравнением Беллмана. В непрерывном времени, результат можно рассматривать как продолжение предыдущей работы в классической физике на уравнения Гамильтона-Якоби по Уильям Роуэн Гамильтон и Карл Густав Якоб Якоби.
Проклятие размерности является выражением придумано Беллманом для описания проблемы, вызванной экспоненциальным ростом объема, связанного с добавлением дополнительных измерений к (математическому) пространству. Одним из следствий проклятия размерности является то, что некоторые методы численного решения уравнения Беллмана требуют значительно больше компьютерного времени, когда в функции значения больше переменных состояния. Например, 100 равномерно расположенных точек выборки достаточно для выборки единичного интервала с расстоянием между точками не более 0,01; эквивалентная выборка 10-мерного единичного гиперкуба с решеткой с интервалом 0,01 между соседними точками потребует 10 20 точек выборки: таким образом, в некотором смысле можно сказать, что 10-мерный гиперкуб имеет коэффициент 10 18 " больше », чем единичный интервал. (Адаптировано из примера Р. Е. Беллмана, см. Ниже.)
Хотя алгоритм обнаружения после того, как Ford, он упоминается в алгоритме Беллмана-Форда, также иногда называют в качестве метки, исправляющих Алгоритм, вычисляет одного источника кратчайшего пути в весовом орграфа, где некоторые из краевых весов может быть отрицательным. Алгоритм Дейкстры решает ту же проблему с меньшим временем работы, но требует, чтобы веса ребер были неотрицательными.
За свою карьеру он опубликовал 619 статей и 39 книг. За последние 11 лет своей жизни он опубликовал более 100 статей, несмотря на тяжелые осложнения операций на головном мозге (Dreyfus, 2003). Подборка: