Математическая модель представляет собой описание системы, используя математические понятия и язык. Процесс разработки математической модели называется математическим моделированием. Математические модели используются в естественных науках (таких как физика, биология, науки о Земле, химия ) и инженерных дисциплинах (таких как информатика, электротехника ), а также в нефизических системах, таких как социальные науки (например, экономика, психология, социология, политология ). Использование математических моделей для решения задач в бизнесе или военных операциях - большая часть области исследования операций. Математические модели также используются в музыке, лингвистике, философии (например, интенсивно в аналитической философии ) и религии (например, повторяющееся использование чисел 7, 12 и 40 в Библии ).
Модель может помочь объяснить систему и изучить влияние различных компонентов, а также сделать прогнозы относительно поведения.
Математические модели могут принимать различные формы, включая динамические системы, статистические модели, дифференциальные уравнения или теоретико-игровые модели. Эти и другие типы моделей могут пересекаться, при этом данная модель включает в себя множество абстрактных структур. В общем, математические модели могут включать логические модели. Во многих случаях качество научной области зависит от того, насколько хорошо математические модели, разработанные с теоретической стороны, согласуются с результатами повторяемых экспериментов. Несоответствие между теоретическими математическими моделями и экспериментальными измерениями часто приводит к важным достижениям по мере разработки более совершенных теорий.
В физических науках традиционная математическая модель содержит большинство из следующих элементов:
Математические модели обычно состоят из отношений и переменных. Взаимосвязи могут быть описаны операторами, такими как алгебраические операторы, функции, дифференциальные операторы и т. Д. Переменные - это абстракции интересующих системных параметров, которые могут быть определены количественно. Для математических моделей можно использовать несколько критериев классификации в соответствии с их структурой:
В бизнесе и инженерии математические модели могут использоваться для максимизации определенного результата. Рассматриваемая система потребует определенных входов. Система, касающиеся входы к выходам зависит от других переменных тоже: переменных решений, переменных состояний, экзогенных переменных и случайных величин.
Переменные решения иногда называют независимыми переменными. Экзогенные переменные иногда называют параметрами или константами. Переменные не являются независимыми друг от друга, поскольку переменные состояния зависят от решения, входных, случайных и экзогенных переменных. Кроме того, выходные переменные зависят от состояния системы (представленного переменными состояния).
Цели и ограничения системы и ее пользователей могут быть представлены как функции выходных переменных или переменных состояния. Эти целевые функции будут зависеть от точки зрения пользователя модели. В зависимости от контекста целевая функция также известна как индекс производительности, поскольку она представляет собой некоторую меру интереса для пользователя. Хотя количество целевых функций и ограничений, которые может иметь модель, не ограничено, использование или оптимизация модели становятся более сложными (в вычислительном отношении) по мере увеличения числа.
Например, экономисты часто применяют линейную алгебру при использовании моделей затрат-выпуска. Сложные математические модели с множеством переменных можно объединить с помощью векторов, в которых один символ представляет несколько переменных.
Проблемы математического моделирования часто подразделяются на модели черного или белого ящика в зависимости от объема доступной априорной информации о системе. Модель черного ящика - это система, о которой нет априорной информации. Модель белого ящика (также называемая стеклянным ящиком или прозрачным ящиком) - это система, в которой доступна вся необходимая информация. Практически все системы находятся где-то между моделями «черный ящик» и «белый ящик», поэтому эта концепция полезна только в качестве интуитивно понятного руководства для принятия решения о выборе подхода.
Обычно предпочтительно использовать как можно больше априорной информации, чтобы сделать модель более точной. Поэтому модели белого ящика обычно считаются более простыми, потому что, если вы правильно использовали информацию, модель будет вести себя правильно. Часто априорная информация приходит в виде знания типа функций, относящихся к различным переменным. Например, если мы создадим модель того, как лекарство работает в системе человека, мы узнаем, что обычно количество лекарства в крови является экспоненциально убывающей функцией. Но у нас все еще остается несколько неизвестных параметров; как быстро распадается количество лекарства и каково начальное количество лекарства в крови? Таким образом, этот пример не является полностью моделью белого ящика. Эти параметры должны быть оценены с помощью некоторых средств, прежде чем можно будет использовать модель.
В моделях черного ящика пытаются оценить как функциональную форму отношений между переменными, так и числовые параметры в этих функциях. Используя априорную информацию, мы могли бы получить, например, набор функций, которые, вероятно, могли бы адекватно описать систему. Если нет априорной информации, мы попытаемся использовать функции как можно более общие, чтобы охватить все различные модели. Часто используемый подход для моделей черного ящика - это нейронные сети, которые обычно не делают предположений о входящих данных. В качестве альтернативы можно использовать алгоритмы NARMAX (модель нелинейной авторегрессионной скользящей средней с внешними входными данными), которые были разработаны как часть идентификации нелинейной системы, для выбора условий модели, определения структуры модели и оценки неизвестных параметров в присутствии коррелированного и нелинейного шума.. Преимущество моделей NARMAX по сравнению с нейронными сетями состоит в том, что NARMAX создает модели, которые можно записать и связать с базовым процессом, тогда как нейронные сети создают непрозрачное приближение.
Иногда бывает полезно включить субъективную информацию в математическую модель. Это может быть сделано на основе интуиции, опыта или мнения экспертов или на основе удобства математической формы. Байесовская статистика обеспечивает теоретическую основу для включения такой субъективности в строгий анализ: мы указываем априорное распределение вероятностей (которое может быть субъективным), а затем обновляем это распределение на основе эмпирических данных.
Примером того, когда такой подход может быть необходим, является ситуация, в которой экспериментатор слегка сгибает монету и один раз подбрасывает ее, фиксируя, выпадает ли она орлом, а затем ему дается задача предсказать вероятность того, что следующее подбрасывание выпадет орлом. После сгибания монеты истинная вероятность того, что монета выпадет орлом, неизвестна; поэтому экспериментатору нужно будет принять решение (возможно, посмотрев на форму монеты) о том, какое предварительное распределение использовать. Включение такой субъективной информации может быть важным для получения точной оценки вероятности.
В общем, сложность модели предполагает компромисс между простотой и точностью модели. Бритва Оккама - это принцип, особенно актуальный для моделирования, его основная идея заключается в том, что среди моделей с примерно равной предсказательной силой самая простая является наиболее желательной. Хотя дополнительная сложность обычно улучшает реалистичность модели, она может затруднить понимание и анализ модели, а также может создать вычислительные проблемы, включая численную нестабильность. Томас Кун утверждает, что по мере развития науки объяснения имеют тенденцию усложняться, прежде чем смена парадигмы предложит радикальное упрощение.
Например, при моделировании полета самолета мы могли бы встроить каждую механическую часть самолета в нашу модель и, таким образом, получить модель системы почти белого цвета. Однако вычислительные затраты на добавление такого огромного количества деталей могут эффективно препятствовать использованию такой модели. Кроме того, неопределенность может увеличиться из-за чрезмерно сложной системы, потому что каждая отдельная часть вносит некоторую вариативность в модель. Поэтому обычно уместно сделать некоторые приближения, чтобы уменьшить модель до разумного размера. Инженеры часто могут принять некоторые приближения, чтобы получить более надежную и простую модель. Например, классическая механика Ньютона - это приближенная модель реального мира. Тем не менее, модели Ньютона вполне достаточно для большинства ситуаций обычной жизни, то есть до тех пор, пока скорости частиц намного ниже скорости света, и мы изучаем только макрочастицы.
Обратите внимание, что лучшая точность не обязательно означает лучшую модель. Статистические модели склонны к переобучению, что означает, что модель слишком хорошо приспособлена к данным и потеряла способность обобщать новые события, которые ранее не наблюдались.
Любая модель, не являющаяся чистым белым ящиком, содержит некоторые параметры, которые можно использовать для подгонки модели к системе, которую она предназначена для описания. Если моделирование выполняется с помощью искусственной нейронной сети или другого машинного обучения, оптимизация параметров называется обучением, а оптимизация гиперпараметров модели называется настройкой и часто использует перекрестную проверку. В более традиционном моделировании с помощью явно заданных математических функций параметры часто определяются путем подбора кривой.
Важнейшей частью процесса моделирования является оценка того, точно ли данная математическая модель описывает систему. На этот вопрос может быть сложно ответить, поскольку он включает несколько различных типов оценки.
Обычно самая легкая часть оценки модели - это проверка того, соответствует ли модель экспериментальным измерениям или другим эмпирическим данным. В моделях с параметрами общий подход к проверке соответствия состоит в том, чтобы разделить данные на два непересекающихся подмножества: данные обучения и данные проверки. Данные обучения используются для оценки параметров модели. Точная модель будет точно соответствовать данным проверки, даже если эти данные не использовались для установки параметров модели. В статистике такая практика называется перекрестной проверкой.
Определение метрики для измерения расстояний между наблюдаемыми и прогнозируемыми данными - полезный инструмент для оценки соответствия модели. В статистике, теории принятия решений, а также некоторые экономические модели, функция потерь играет аналогичную роль.
Хотя проверить соответствие параметров довольно просто, может быть сложнее проверить правильность общей математической формы модели. В целом, было разработано больше математических инструментов для проверки соответствия статистических моделей, чем моделей, включающих дифференциальные уравнения. Инструменты непараметрической статистики иногда можно использовать для оценки того, насколько хорошо данные соответствуют известному распределению, или для создания общей модели, которая делает только минимальные предположения о математической форме модели.
Оценка объема модели, то есть определение ситуаций, к которым она применима, может быть менее простой задачей. Если модель была построена на основе набора данных, необходимо определить, для каких систем или ситуаций известные данные являются «типичным» набором данных.
Вопрос о том, хорошо ли модель описывает свойства системы между точками данных, называется интерполяцией, а тот же вопрос для событий или точек данных за пределами наблюдаемых данных называется экстраполяцией.
В качестве примера типичных ограничений объема модели при оценке классической механики Ньютона мы можем отметить, что Ньютон проводил свои измерения без современного оборудования, поэтому он не мог измерить свойства частиц, движущихся со скоростью, близкой к скорости света. Точно так же он не измерял движения молекул и других мелких частиц, а измерял только макрочастицы. Поэтому неудивительно, что его модель не может хорошо экстраполироваться на эти области, хотя его модели вполне достаточно для обычной физики жизни.
Многие типы моделирования неявно включают утверждения о причинно-следственной связи. Обычно (но не всегда) это верно для моделей, включающих дифференциальные уравнения. Поскольку цель моделирования - улучшить наше понимание мира, валидность модели зависит не только от ее соответствия эмпирическим наблюдениям, но и от ее способности экстраполировать на ситуации или данные, выходящие за рамки тех, что были первоначально описаны в модели. Это можно рассматривать как различие между качественными и количественными прогнозами. Можно также утверждать, что модель бесполезна, если она не дает некоторого понимания, выходящего за рамки того, что уже известно из прямого исследования изучаемого явления.
Примером такой критики является аргумент о том, что математические модели теории оптимального кормодобывания не предлагают понимания, выходящего за рамки здравого смысла выводов эволюции и других основных принципов экологии.
Математические модели имеют большое значение в естествознании, особенно в физике. Физические теории почти всегда выражаются с помощью математических моделей.
На протяжении всей истории появлялось все больше и больше точных математических моделей. Законы Ньютона точно описывают многие повседневные явления, но в определенных пределах необходимо использовать теорию относительности и квантовую механику.
В физике принято использовать идеализированные модели для упрощения вещей. Безмассовые веревки, точечные частицы, идеальные газы и частица в ящике - это одни из многих упрощенных моделей, используемых в физике. Законы физики представлены простыми уравнениями, такие как законы Ньютона, уравнения Максвелла и уравнения Шредингера. Эти законы являются основой для построения математических моделей реальных ситуаций. Многие реальные ситуации очень сложны и поэтому моделируются приблизительно на компьютере. Модель, которую можно вычислить с помощью вычислений, создается на основе основных законов или приближенных моделей, созданных на основе основных законов. Например, молекулы можно моделировать с помощью моделей молекулярных орбиталей, которые являются приближенными решениями уравнения Шредингера. В инженерии физические модели часто создаются математическими методами, такими как анализ методом конечных элементов.
В разных математических моделях используется разная геометрия, которая не обязательно является точным описанием геометрии Вселенной. Евклидова геометрия широко используется в классической физике, в то время как специальная теория относительности и общая теория относительности являются примерами теорий, которые используют геометрию, не являющуюся евклидовой.
Часто, когда инженеры анализируют систему, которую нужно контролировать или оптимизировать, они используют математическую модель. В процессе анализа инженеры могут построить описательную модель системы в качестве гипотезы того, как система может работать, или попытаться оценить, как непредвиденное событие может повлиять на систему. Точно так же, управляя системой, инженеры могут опробовать различные подходы к управлению в симуляциях.
Математическая модель обычно описывает систему набором переменных и набором уравнений, которые устанавливают отношения между переменными. Переменные могут быть разных типов; действительные или целые числа, логические значения или строки, например. Переменные представляют некоторые свойства системы, например, измеряемые выходные данные системы, часто в форме сигналов, временных данных, счетчиков и возникновения события (да / нет). Фактическая модель - это набор функций, которые описывают отношения между различными переменными.
M = ( Q, Σ, δ, q 0, F), где
| ||
S 1 | S 2 | S 1 |
S 2 | S 1 | S 2 |
Состояние S 1 означает, что до сих пор на входе было четное количество нулей, а S 2 означает нечетное число. 1 на входе не меняет состояние автомата. Когда ввод закончится, состояние покажет, содержал ли ввод четное число нулей или нет. Если вход содержал четное количество нулей, M завершит работу в состоянии S 1, состоянии приема, поэтому входная строка будет принята.
Язык, распознаваемый буквой M, - это обычный язык, задаваемый регулярным выражением 1 * (0 (1 *) 0 (1 *)) *, где «*» - это звезда Клини, например, 1 * обозначает любое неотрицательное число ( возможно ноль) символов «1».
это можно также записать как: