В области вычислительной химии, минимизация энергии (также называется оптимизация энергии, минимизация геометрии или оптимизация геометрии ) - это процесс поиска расположения в пространстве совокупности атомов, где, согласно некоторой вычислительной модели химической связи, чистая межатомная сила, действующая на каждый атом, приемлемо близка к нулю, и положение на поверхности потенциальной энергии (PES) является стационарной точкой (описанной ниже). Набор атомов может представлять собой одну молекулу, ион, конденсированную фазу, переходное состояние или даже набор любых из этих. Вычислительной моделью химической связи может быть, например, квантовая механика.
В качестве примера, при оптимизации геометрии молекулы воды, нужно получить длину связи водород-кислород и угол связи водород-кислород-водород, которые минимизируют силы, которые могут в противном случае будет сближать атомы или раздвигать их.
Мотивацией к выполнению оптимизации геометрии является физическое значение полученной структуры: оптимизированные структуры часто соответствуют веществу, которое встречается в природе, и геометрия такой структуры может использоваться в различных экспериментальных и теоретические исследования в области химического строения, термодинамики, химической кинетики, спектроскопии и других.
Обычно, но не всегда, процесс пытается найти геометрию определенного расположения атомов, которая представляет собой локальный или глобальный минимум энергии. Вместо поиска глобального минимума энергии может быть желательно оптимизация до переходного состояния, то есть седловой точки на поверхности потенциальной энергии. Кроме того, некоторые координаты (например, длина химической связи) могут быть зафиксированы во время оптимизации.
Геометрия набора атомов может быть описана вектор положений атомов. Это может быть набор декартовых координат атомов или, если рассматривать молекулы, могут быть так называемые внутренние координаты, сформированные из набора длин связей, валентных углов и двугранных углов.
Имея набор атомов и вектор, r, описывающий положения атомов, можно ввести понятие энергии как функции положений, E (r ). Оптимизация геометрии тогда представляет собой задачу математической оптимизации, в которой желательно найти значение r, для которого E (r ) находится на локальный минимум, то есть производная энергии по положению атомов, ∂E / ∂ r, является нулевым вектором и второй производной матрицей системы, , также известная как матрица Гессе, которая описывает кривизну PES в r, имеет все положительные собственные значения (это положительно определенное ).
Частным случаем оптимизации геометрии является поиск геометрии переходного состояния ; это обсуждается ниже.
Вычислительная модель, которая обеспечивает приблизительное значение E (r ), может быть основана на квантовой механике (с использованием либо теории функционала плотности, либо полуэмпирические методы ), силовые поля или их комбинация в случае QM / MM. Используя эту вычислительную модель и первоначальное предположение (или анзац ) правильной геометрии, следует итеративная процедура оптимизации, например:
Как описано выше, некоторые методы, такие как квантовая механика, могут использоваться для вычисления энергии E (r ), градиента PES, то есть производная энергии по положению атомов ∂E / ∂ r и вторая производная матрица системы ∂∂E / ∂r i∂rjтакже известная как матрица Гессе, которая описывает кривизну PES в r.
. Алгоритм оптимизации может использовать часть или все E (r ), ∂ E / ∂ r и ∂∂E / ∂r i∂rj, чтобы попытаться минимизировать силы, и теоретически это может быть любой метод su ch как градиентный спуск, сопряженный градиент или метод Ньютона, но на практике алгоритмы, которые используют знание кривизны PES, то есть матрицы Гессе, оказываются лучше. Однако для большинства систем, представляющих практический интерес, вычисление второй производной матрицы может быть чрезмерно дорогостоящим, и оно оценивается на основе последовательных значений градиента, как это типично для оптимизации Квазиньютон.
Выбор системы координат может иметь решающее значение для успешной оптимизации. Например, декартовы координаты являются избыточными, поскольку нелинейная молекула с N атомами имеет 3N – 6 колебательных степеней свободы, тогда как набор декартовых координат имеет 3N измерений. Кроме того, декартовы координаты сильно коррелированы, то есть матрица Гессе имеет много недиагональных членов, которые не близки к нулю. Это может привести к численным проблемам при оптимизации, потому что, например, трудно получить хорошее приближение к матрице Гессе, а ее точное вычисление требует слишком больших вычислительных затрат. Однако в случае, если энергия выражается стандартными силовыми полями, были разработаны эффективные в вычислительном отношении методы, способные аналитически вывести матрицу Гессе в декартовых координатах, сохраняя при этом вычислительную сложность того же порядка, что и при градиентных вычислениях. Внутренние координаты, как правило, менее коррелированы, но их сложнее установить, и может быть сложно описать некоторые системы, например системы с симметрией или большими конденсированными фазами. Многие современные программные пакеты для вычислительной химии содержат автоматические процедуры для автоматического создания разумных систем координат для оптимизации.
Некоторые степени свободы могут быть исключены при оптимизации, например, положениям атомов или длинам связей и углам могут быть заданы фиксированные значения. Иногда их называют замороженными степенями свободы.
На рисунке 1 изображена оптимизация геометрии атомов в углеродной нанотрубке в присутствии внешнего электростатического поля. В этой оптимизации позиции атомов слева зафиксированы. Их взаимодействие с другими атомами в системе все еще вычисляется, но изменение положения атомов во время оптимизации предотвращается.
Рисунок 1: Электростатические отклонения углеродной нанотрубки в электрическом поле.Структуры переходного состояния могут быть определены с помощью поиск седловых точек на PES интересующего химического вещества. Седловая точка первого порядка - это положение на ППЭ, соответствующее минимуму во всех направлениях, кроме одного; седловая точка второго порядка - минимум во всех направлениях, кроме двух и т. д. С математической точки зрения седловая точка n-го порядка характеризуется следующим: ∂E / ∂ r= 0и матрица Гессе, ∂∂E / ∂r i∂rj, имеет ровно n отрицательных собственных значений.
Алгоритмы для определения геометрии переходного состояния делятся на две основные категории: локальные методы и полуглобальные методы. Локальные методы подходят, когда начальная точка оптимизации очень близка к истинному переходному состоянию (очень близкое к этому будет вскоре определено), а полуглобальные методы находят применение, когда требуется определить местонахождение переходного состояния с очень небольшим априорным знанием его геометрия. Некоторые методы, такие как метод Димера (см. Ниже), попадают в обе категории.
Так называемая локальная оптимизация требует первоначального предположения о переходном состоянии, которое очень близко к истинному переходному состоянию. Очень близкое обычно означает, что исходное предположение должно иметь соответствующую матрицу Гессе с одним отрицательным собственным значением или отрицательное собственное значение, соответствующее координате реакции, должно быть больше по величине, чем другие отрицательные собственные значения. Кроме того, собственный вектор с наиболее отрицательным собственным значением должен соответствовать координате реакции, то есть он должен представлять геометрическое преобразование, относящееся к процессу, переходное состояние которого ищется.
С учетом вышеуказанных предварительных условий алгоритм локальной оптимизации может затем двигаться «вверх» по собственному вектору с наиболее отрицательным собственным значением и «вниз» по всем другим степеням свободы, используя что-то похожее на квазиньютон. метод.
Димерный метод может использоваться для поиска возможных переходных состояний без знания окончательной структуры или для уточнения точного предположения о переходной структуре. «Димер» образован двумя изображениями, очень близкими друг к другу на PES. Метод работает, перемещая димер вверх по склону из исходного положения, одновременно вращая димер, чтобы найти направление наименьшей кривизны (в конечном итоге отрицательное).
Техника активации-релаксации (ART) также является открытым методом для поиска новых переходных состояний или уточнения известных седловых точек на PES. Метод следует направлению наименьшей отрицательной кривизны (вычисленной с использованием алгоритма Ланцоша ) на PES для достижения седловой точки, расслабляясь в перпендикулярной гиперплоскости между каждым «прыжком» (активацией) в этом направлении.
Методы цепочки состояний можно использовать для нахождения приблизительной геометрии переходного состояния на основе геометрии реагента и продукта. Сгенерированная приблизительная геометрия затем может служить отправной точкой для уточнения с помощью локального поиска, который был описан выше.
В методах цепочки состояний используется серия векторов, то есть точек на PES, связывающих реагент и продукт интересующей реакции, rреагент и rпродукт, тем самым дискретизируя путь реакции. Очень часто эти точки называют бусинами из-за аналогии с набором бусинок, соединенных нитками или пружинами, которые соединяют реагент и продукты. Серию шариков часто изначально создают путем интерполяции между rреагентом и rпродуктом, например, для серии из N + 1 шариков шарик i может быть задан как
где i ∈ 0, 1,..., N. Каждая из гранул riимеет энергию E (ri) и силы -∂E / ∂ ri, и они обрабатываются с помощью ограниченного процесса оптимизации, который стремится получить как можно более точное представление пути реакции. Для этого должны быть применены ограничения по расстоянию, чтобы каждый шарик riне просто оптимизировался для геометрии реагента и продукта.
Часто это ограничение достигается за счет проецирования компонентов силы на каждый валик riили, альтернативно, движения каждого валика во время оптимизации, которые касаются пути реакции. Например, если для удобства определено, что gi= ∂E / ∂ ri, тогда градиент энергии на каждом шарике за вычетом составляющей градиента энергии, касательной к пути реакции, будет равен
где I - единичная матрица, а τi- единичный вектор, представляющий касательную к пути реакции в ri. Путем проецирования компонентов градиента энергии или шага оптимизации, которые параллельны пути реакции, алгоритм оптимизации значительно снижает тенденцию к прямой оптимизации каждого из шариков до минимума.
Простейшим методом цепочки состояний является метод линейного синхронного транзита (LST). Он работает, беря интерполированные точки между геометриями реагента и продукта и выбирая точку с наибольшей энергией для последующего уточнения с помощью локального поиска. Метод квадратичного синхронного прохождения (QST) расширяет LST, допуская параболический путь реакции с оптимизацией точки наивысшей энергии перпендикулярно параболе.
В методе эластичной ленты с выталкиванием (NEB) шарики вдоль пути реакции имитируют силы пружины в дополнение к химическим силам, -∂E / ∂ ri,, чтобы заставить оптимизатор поддерживать ограничение на интервал. В частности, сила fiв каждой точке i задается как
где
- сила пружины, параллельная траектории в каждой точке ri(k - жесткость пружины, а τ i, как и раньше, - единичный вектор, представляющий касательную к траектории реакции в ri).
В традиционной реализации точка с наибольшей энергией используется для последующего уточнения при локальном поиске. Существует множество вариантов метода NEB, например, восходящее изображение NEB, в котором точка с наибольшей энергией толкается вверх во время процедуры оптимизации, чтобы (надеюсь) получить геометрию, которая даже ближе к геометрии переходного состояния.. Также были расширения для включения регрессии гауссовского процесса для сокращения количества оценок. Для систем с неевклидовой (R ^ 2) геометрией, таких как магнитные системы, метод изменен на подход геодезической подталкиваемой эластичной ленты.
Строковый метод использует сплайны, соединяющие точки, ri, для измерения и применения ограничений расстояния между точками и для вычисления касательной в каждой точке. На каждом шаге процедуры оптимизации точки могут перемещаться в соответствии с силой, действующей на них перпендикулярно пути, а затем, если ограничение эквидистантности между точками больше не выполняется, точки могут быть перераспределены с помощью сплайна представление пути для создания новых векторов с требуемым интервалом.
Варианты строкового метода включают метод растущей строки, в котором предположение о пути вырастает из конечных точек (то есть реагента и продуктов) по мере продвижения оптимизации.
Оптимизация геометрии фундаментально отличается от молекулярной динамики моделирования. Последний моделирует движение молекул во времени, в зависимости от температуры, химических сил, начальных скоростей, броуновского движения растворителя и т. Д. Посредством применения законов движения Ньютона. Это означает, что вычисляемые траектории атомов имеют некоторый физический смысл. Оптимизация геометрии, напротив, не создает «траектории» с каким-либо физическим смыслом - она связана с минимизацией сил, действующих на каждый атом в совокупности атомов, и путь, по которому это достигается, не имеет смысла. Различные алгоритмы оптимизации могут дать один и тот же результат для структуры с минимальной энергией, но прийти к нему другим путем.