Выполнимость по модулю теорий

редактировать

В информатике и математической логике выполнимость по модулю теорий (SMT ) - это проблема решения для логических формул относительно комбинаций фоновых теорий, выраженных в классической логике первого порядка с равенством. Примерами теорий, обычно используемых в информатике, являются теория действительных чисел, теория целых чисел и теории различных структур данных, таких как перечисляет, массивы, битовые векторы и так далее. SMT можно рассматривать как форму проблемы удовлетворения ограничений и, таким образом, определенный формализованный подход к программированию ограничений.

Содержание

1 Базовая терминология
2 Выразительная сила
3 Решающие подходы
4 SMT для неразрешимых теорий
5 Решатели
- 5.1 Стандартизация и соревнование решателей SMT-COMP
6 Приложения
- 6.1 Проверка
- 6.2 Анализ и тестирование на основе символьного исполнения
7 См. Также
8 Примечания
9 Ссылки

Основная терминология

Формально говоря, экземпляр SMT - это формула в логике первого порядка, где некоторые функции и предикатные символы имеют дополнительные интерпретации, а SMT - это проблема определения выполнимости такой формулы. Другими словами, представьте себе пример проблемы логической выполнимости (SAT), в которой некоторые из двоичных переменных заменены предикатами над подходящим набором недвоичных переменных. Предикат - это двоичная функция недвоичных переменных. Примеры предикатов включают линейные неравенства (например, $3 x + 2 y - z ≥ 4 {\ displaystyle 3x + 2y-z \ geq 4}$ ${\ displaystyle 3x + 2y-z \ geq 4}$ ) или равенства, содержащие неинтерпретированные термины и функциональные символы (например, $f (f (u, v), v) = f (u, v) {\ displaystyle f (f (u, v), v) = f ( u, v)}$ $е (е (и, v), v) = е (и, v)$ , где $f {\ displaystyle f}$ $f$ - некоторая неопределенная функция двух аргументов). Эти предикаты классифицируются согласно каждой присвоенной теории. Например, линейные неравенства над действительными переменными оцениваются с использованием правил теории линейной вещественной арифметики, тогда как предикаты, содержащие неинтерпретированные термины и функциональные символы, оцениваются с использованием правил теории неинтерпретированных функций с равенством (иногда называемое пустой теорией ). Другие теории включают теории массивов и списков структур (полезно для моделирования и проверки компьютерных программ ) и теорию битовых векторов (полезно при моделировании и проверке проектов оборудования ). Также возможны подтеории: например, разностная логика - это подтеория линейной арифметики, в которой каждое неравенство ограничено формой $x - y>c {\ displaystyle xy>c}$ $x-y>c$ для переменных <151style>x { x} $x$ и $y {\ displaystyle y}$ $y$ и константа $c {\ displaystyle c}$ $c$ .

Большинство решателей SMT поддерживают только квантификатор -свободные фрагменты их логики.

Выразительная сила

Экземпляр SMT является обобщением логического экземпляра SAT, в котором различные наборы переменных заменяются на предикаты из множества лежащих в основе теорий. Формулы SMT предоставляют гораздо более богатый язык моделирования, чем это возможно с логическими формулами SAT. Например, формула SMT позволяет нам моделировать путь данных операций микропроцессора на rd, а не битовый уровень.

Для сравнения, программирование набора ответов также основано на предикатах (точнее, на атомарных предложениях, созданных из атомарной формулы ). В отличие от SMT, программы с набором ответов не имеют кванторов и не могут легко выразить ограничения, такие как или —ASP в лучшем случае подходит для логических задач, которые сводятся к свободной теории неинтерпретированных функций. Реализация 32-битных целых чисел в качестве битовых векторов в ASP страдает от большинства проблем, с которыми сталкивались ранние SMT-решатели: «очевидные» идентичности, такие как x + y = y + x, трудно вывести.

Программирование логики ограничений действительно обеспечивает поддержку линейных арифметических ограничений, но в совершенно другой теоретической структуре. Решатели SMT также были расширены для решения формул в логике более высокого порядка.

Подходы решателя

Ранние попытки решения экземпляров SMT включали преобразование их в логические экземпляры SAT (например, 32-битную целочисленную переменную будут закодированы 32 однобитными переменными с соответствующими весами, а операции на уровне слова, такие как «плюс», будут заменены логическими операциями более низкого уровня над битами) и передать эту формулу в логический решатель SAT. Этот подход, который называется подходом нетерпеливым, имеет свои достоинства: путем предварительной обработки формулы SMT в эквивалентную булеву формулу SAT существующие булевы решатели SAT могут использоваться «как есть» и их производительность и улучшения емкости со временем. С другой стороны, потеря высокоуровневой семантики лежащих в основе теорий означает, что логическая программа расчета SAT должна работать намного усерднее, чем необходимо, чтобы обнаружить «очевидные» факты (например, $x + y = y + x {\ displaystyle x + y = y + x}$ $x + y = y + x$ для сложения целых чисел.) Это наблюдение привело к разработке ряда решателей SMT, которые тесно интегрируют логические рассуждения DPLL - поиск стиля с помощью специальных решателей (T-решателей), которые обрабатывают конъюнкции (AND) предикатов из данной теории. Этот подход называется ленивым подходом.

Названная DPLL (T), эта архитектура возлагает ответственность за логические рассуждения на основанный на DPLL решатель SAT, который, в свою очередь, взаимодействует с решателем теории T через четко определенный интерфейс. Решателю теории нужно беспокоиться только о проверке выполнимости конъюнкций предикатов теории, переданных ему из решателя SAT, когда он исследует логическое пространство поиска формулы. Однако для того, чтобы эта интеграция работала хорошо, решатель теории должен иметь возможность участвовать в распространении и анализе конфликтов, т. Е. Он должен уметь выводить новые факты из уже установленных фактов, а также давать краткие объяснения неосуществимости, когда теория противоречит возникают. Другими словами, теоретический решатель должен быть инкрементным и с возможностью возврата.

SMT для неразрешимых теорий

Большинство распространенных подходов SMT поддерживают разрешимые теории. Однако многие реальные системы можно смоделировать только с помощью нелинейной арифметики над действительными числами, включая трансцендентные функции, например самолет и его поведение. Этот факт побуждает распространить проблему SMT на нелинейные теории, например определить, является ли

(грех ⁡ (x) 3 = соз ⁡ (журнал ⁡ (y) ⋅ x) ∨ b ∨ - x 2 ≥ 2,3 y) ∧ (¬ b ∨ y < − 34.4 ∨ exp ⁡ ( x)>yx) {\ displaystyle {\ begin {array} {lr} (\ sin (x) ^ {3} = \ cos (\ log (y) \ cdot x) \ vee b \ vee -x ^ {2} \ geq 2.3y) \ wedge \ left (\ neg b \ vee y <-34.4\vee \exp(x)>{y \ over x} \ right) \ end {array}}}

${\begin{array}{lr}(\sin(x)^{3}=\cos(\log(y)\cdot x)\vee b\vee -x^{2}\geq 2.3y)\wedge \left(\neg b\vee y<-34.4\vee \exp(x)>{y \ over x} \ right) \ end {array}}$

где

b ∈ B, x, y ∈ R {\ displaystyle b \ in {\ mathbb {B}}, x, y \ in {\ mathbb {R}}}

b \ in {\ mathbb {B}}, x, y \ in {\ mathbb {R}}

выполнимо. Тогда такие проблемы становятся неразрешимыми в целом. (Теория реальных замкнутых полей и, таким образом, полная теория первого порядка действительных чисел, однако разрешима с использованием исключения кванторов. Это связано с Альфредом Тарским.) Теория первого порядка натуральных чисел со сложением (но не умножением), называемая арифметика Пресбургера, также разрешима.. Грех Поскольку умножение на константы может быть реализовано как вложенное сложение, арифметика во многих компьютерных программах может быть выражена с помощью арифметики Пресбургера, что приводит к разрешимым формулам.

Примерами SMT-решателей, обращающимися к булевым комбинациям теоретических атомов из неразрешимых арифметических теорий над действительными числами, являются ABsolver, в котором используется классическая архитектура DPLL (T) с пакетом нелинейной оптимизации в качестве (обязательно неполного) решателя подчиненной теории, и iSAT [1], основанный на объединении DPLL-решения SAT и распространения ограничений интервала, называемого алгоритмом iSAT.

Solvers

В приведенной ниже таблице приведены некоторые функции многих доступных решателей SMT. Столбец «SMT-LIB» указывает совместимость с языком SMT-LIB; многие системы, отмеченные «да», могут поддерживать только старые версии SMT-LIB или предлагать только частичную поддержку языка. Столбец «CVC» указывает на поддержку языка CVC. Столбец «DIMACS» указывает на поддержку формата DIMACS.

Проекты различаются не только функциями и производительностью, но и жизнеспособностью окружающего сообщества, его постоянным интересом к проекту и его способностью вносить документацию, исправления, тесты и улучшения.

Платформа			Функции						Примечания
Имя	ОС	Лицензия	SMT-LIB	CVC	DIMACS	Встроенные теории	API	SMT-COMP [2]
ABsolver	Linux	CPL	v1.2	Нет	Да	линейная арифметика, нелинейная арифметика	C ++	нет	На основе DPLL
Alt-Ergo	Linux, Mac OS, Windows	CeCILL-C (примерно эквивалент LGPL )	частичные версии 1.2 и 2.0	Нет	Нет	пустая теория, линейная целочисленная и рациональная арифметика, нелинейная арифметика, битовые векторы, квантификаторы	OCaml	2008	Полиморфный язык ввода первого порядка а-ля ML, на основе SAT-решателя, объединяет подходы, подобные Шостаку и Нельсону-Оппену, для рассуждения теорий по модулю
Barcelogic	Linux	Собственный	v1.2			пустая теория,	C ++	2009	на основе DPLL, замыкание конгруэнтности
Beaver	Linux, Windows	BSD	v1.2	Нет	Нет	битвекторы	OCaml	2009	на основе SAT-решателя
Булектор	Linux	MIT	v1.2	Нет	Нет	битовые векторы, массивы	C	2009	SAT-решатель на основе
CVC3	Linux	BSD	v1.2	Да		пустая теория, линейная арифметика, массивы, кортежи, типы, записи, битовые векторы, квантификаторы	C /C ++	2010	вывод проверки на HOL
CVC4	Linux, Mac OS, Windows, FreeBSD	BSD	Да	Да		рациональная и целочисленная линейная арифметика, массивы, кортежи, записи, индуктивные типы данных, битовые векторы, строки и равенство над неинтерпретированные функциональные символы	C ++	2010	версия 1.5, выпущенная в июле 2017 г.
Decision Procedure Toolkit (DPT)	Linux	Apache	Нет				OCaml	нет	на основе DPLL
iSAT	Linux	проприетарный	нет			нелинейная арифметика		нет	DPLL-базовый ed
MathSAT	Linux, Mac OS, Windows	проприетарный	Да		Да	пустая теория, линейная арифметика, нелинейная арифметика, битовые векторы, массивы	C /C ++, Python, Java	2010	на основе DPLL
MiniSmt	Linux	LGPL	частичная v2.0			нелинейная арифметика		2010	на основе SAT-решателя, на основе Yices
Norn									SMT-решатель для строковых ограничений
OpenCog	Linux	AGPL	Нет	Нет	Нет	вероятностная логика, арифметика. реляционные модели	C ++, Scheme, Python	no	изоморфизм подграфов
OpenSMT	Linux, Mac OS, Windows	GPLv3	частичная v2.0		Да	пустая теория, различия, линейная арифметика, битовые векторы	C ++	2011	lazy SMT Solver
raSAT	Linux	GPLv3	v2.0			вещественная и целочисленная нелинейная арифметика		2014, 2015	расширение распространения интервальных ограничений с тестированием и теоремой о промежуточном значении
SatEEn	?	Собственный	v1.2			линейная арифметика, разностная логика	нет	2009
SMTInterpol	Linux, Mac OS, Windows	LGPLv3	v2.5			неинтерпретируемые функции, линейные действительная арифметика и линейная целочисленная арифметика	Java	2012	Ориентация на создание высококачественных компактных интерполянтов.
SMCHR	Linux, Mac OS, Windows	GPLv3	Нет	Нет	Нет	линейная арифметика, нелинейная арифметика, кучи	C	нет	Можно реализовать новые теории, используя правила обработки ограничений.
SMT-RAT	Linux, Mac OS	MIT	v2.0	Нет	Нет	линейная арифметика, нелинейная арифметика	C ++	2015	Toolbox для стратегического и параллельного решения SMT, состоящего из набора совместимых с SMT реализаций.
SONOLAR	Linux, Windows	Собственный	частичный v2.0			битовые векторы	C	2010	на основе SAT-решателя
Spear	Linux, Mac OS, Windows	Proprietary	v1.2			bitvectors		2008
STP	Linux, OpenBSD, Windows, Mac OS	MIT	частично v2.0	Да	Нет	битовые векторы, массивы	C, C ++, Python, OCaml, Java	2011	SAT -сольвер
SWORD	Linux	Собственные	v1.2			битвекторы		2009
UCLID	Linux	BSD	Нет	Нет	Нет	пустая теория, линейная арифметика, битовые векторы и ограниченная лямбда (массивы, память, кеш и т. Д.)		нет	SAT -сольвер, записанный в Москва МЛ. Язык ввода - проверка модели SMV. Хорошо задокументированы!
VeriT	Linux, OS X	BSD	частичная v2.0			пустая теория, рациональная и целочисленная линейная арифметика, кванторы и равенство над неинтерпретируемой функцией символы	C /C ++	2010	на основе SAT-решателя
Yices	Linux, Mac OS, Windows, FreeBSD	GPLv3	v2.0	Нет	Да	рациональная и целочисленная линейная арифметика, битовые векторы, массивы и равенство над неинтерпретируемыми функциональными символами	C	2014	Исходный код доступен в Интернете
Z3 Theorem Prover	Linux, Mac OS, Windows, FreeBSD	MIT	v2.0		Да	пустая теория, линейная арифметика, нелинейная арифметика, битовые векторы, массивы, типы данных, квантификаторы, строки	C /C ++, .NET, OCaml, Python, Java, Haskell	2011	Исходный код доступно в Интернете

Стандартизация и конкуренция между решателями SMT-COMP

Есть несколько mpts для описания стандартизованного интерфейса для решателей SMT (и автоматических средств доказательства теорем, термин, часто используемый как синоним). Самым известным является стандарт SMT-LIB, который предоставляет язык, основанный на S-выражениях. Другие широко поддерживаемые стандартизованные форматы - это формат DIMACS, поддерживаемый многими логическими программами SAT-решения, и формат CVC, используемый автоматическим средством доказательства теорем CVC.

Формат SMT-LIB также поставляется с рядом стандартизированных тестов и позволяет проводить ежегодное соревнование между решателями SMT под названием SMT-COMP. Первоначально конкурс проводился во время конференции Computer Aided Verification (CAV), но с 2020 года конкурс проводится в рамках семинара SMT, который связан с Международной совместной конференцией по Automated Reasoning (IJCAR).

Приложения

SMT-решатели полезны как для проверки, подтверждения правильности программ, так и для тестирования программного обеспечения на основе символического выполнение, а для синтеза генерирование фрагментов программы путем поиска в пространстве возможных программ. Помимо верификации программного обеспечения, решатели SMT также использовались для моделирования теоретических сценариев, включая моделирование убеждений субъектов в ядерной контроле над вооружениями.

Верификация

Компьютерная верификация компьютерных программ часто использует решатели SMT. Распространенным методом является перевод предварительных условий, постусловий, условий цикла и утверждений в формулы SMT, чтобы определить, все ли свойства могут выполняться.

Существует множество верификаторов, построенных на основе решателя SMT Z3. Boogie - это язык промежуточной проверки, использующий Z3 для автоматической проверки простых императивных программ. Верификатор VCC для параллельного C использует Boogie, а также Dafny для императивных объектно-ориентированных программ, Chalice для параллельных программ и Spec # для C #. F * - язык с зависимой типизацией, использующий Z3 для поиска доказательств; компилятор передает эти доказательства для создания байт-кода, несущего доказательство. Инфраструктура проверки Viper кодирует условия проверки в Z3. Библиотека sbv обеспечивает проверку программ Haskell на основе SMT и позволяет пользователю выбирать среди ряда решателей, таких как Z3, ABC, Boolector, CVC4, MathSAT и Yices.

Существует также множество верификаторов, построенных на основе решателя Alt-Ergo SMT. Вот список зрелых приложений:

Why3, платформа для дедуктивной проверки программ, использует Alt-Ergo в качестве основного средства проверки;
CAVEAT, средство проверки C, разработанное CEA и используемое Airbus; Alt-Ergo был включен в квалификацию DO-178C одного из своих последних самолетов;
Frama-C, фреймворк для анализа C-кода, использует Alt-Ergo в плагинах Jessie и WP (посвященных " дедуктивная проверка программы ");
SPARK, использует CVC4 и Alt-Ergo (за GNATprove) для автоматизации проверки некоторых утверждений в SPARK 2014;
Atelier-B может вместо этого использовать Alt-Ergo своего основного доказателя (увеличение успеха с 84% до 98% в тестах ANR Bware project );
Rodin, фреймворк B-метода, разработанный Systerel, может использовать Alt-Ergo в качестве серверной части;
Cubicle, средство проверки моделей с открытым исходным кодом для проверки свойств безопасности систем перехода на основе массивов.
EasyCrypt, набор инструментов для анализа реляционных свойств вероятностных вычислений с противостоящим кодом.

Многие Решатели SMT реализуют общий формат интерфейса под названием SMTLIB2 (такие файлы обычно имеют расширение «.smt2»). Инструмент LiquidHaskell реализует ссылку Верификатор на основе типа элемента для Haskell, который может использовать любой совместимый с SMTLIB2 решатель, например CVC4, MathSat или Z3.

Анализ и тестирование на основе символьного исполнения

Важным применением решателей SMT является символьное выполнение для анализа и тестирования программ (например, concolic testing ), направленный, в частности, на поиск уязвимостей безопасности. К важным активно поддерживаемым инструментам в этой категории относятся SAGE из Microsoft Research, KLEE, S2E и Triton.. Решатели SMT, которые особенно полезны для приложений с символьным исполнением, включают Z3, STP, Z3str2 и Boolector.

См. Также

Примечания

^Barbosa, Haniel, et al. "Расширение решателей SMT до логики более высокого порядка." Международная конференция по автоматическому отчислению. Springer, Cham, 2019.
^Nieuwenhuis, R.; Oliveras, A.; Тинелли, С. (2006), "Решение теорий SAT и SAT по модулю: от абстрактной процедуры Дэвиса-Патнэма-Логеманна-Ловленда до DPLL (T)", Журнал ACM (PDF), 53, pp. 937–977
^Bauer, A.; Пистер, М.; Таучниг, М. (2007), «Инструментальная поддержка для анализа гибридных систем и моделей», Труды конференции 2007 года по проектированию, автоматизации и тестированию в Европе (DATE'07), IEEE Computer Society, стр. 1, CiteSeerX 10.1.1.323.6807, doi : 10.1109 / DATE.2007.364411, ISBN 978-3-9810801-2-4, S2CID 9159847
^Fränzle, M.; Herde, C.; Ratschan, S.; Schubert, T.; Тейдж, Т. (2007), «Эффективное решение больших нелинейных систем арифметических ограничений со сложной логической структурой», Специальный выпуск JSAT по интеграции SAT / CP (PDF), 1, стр. 209–236
^Барретт, Кларк; де Моура, Леонардо; Пень, Аарон (2005). Этессами, Коуша; Раджамани, Шрирам К. (ред.). "SMT-COMP: Конкурс теорий удовлетворенности по модулю". Компьютерная проверка. Конспект лекций по информатике. Берлин, Гейдельберг: Springer: 20–23. doi : 10.1007 / 11513988_4. ISBN 978-3-540-31686-2.
^Барретт, Кларк; де Моура, Леонардо; Ранис, Сильвио; Пень, Аарон; Тинелли, Чезаре (2011). Барнер, Шэрон; Харрис, Ян; Кронинг, Даниэль; Раз, Орна (ред.). «Инициатива SMT-LIB и рост SMT». Аппаратное и программное обеспечение: проверка и тестирование. Конспект лекций по информатике. Берлин, Гейдельберг: Springer: 3–3. DOI : 10.1007 / 978-3-642-19583-9_2. ISBN 978-3-642-19583-9.
^«SMT-COMP 2020». SMT-COMP. Проверено 19 октября 2020 г.
^Бомонт, Пол; Эванс, Нил; Хут, Майкл; Завод, Том (2015). Пернул, Гюнтер; Y. Райан, Питер; Weippl, Эдгар (ред.). «Анализ уверенности для контроля над ядерным оружием: SMT-абстракции байесовских сетей верований». Компьютерная безопасность - ESORICS 2015. Конспект лекций по информатике. Чам: Издательство Springer International: 521–540. DOI : 10.1007 / 978-3-319-24174-6_27. ISBN 978-3-319-24174-6.

Литература

С. Барретт, Р. Себастьяни, С. Сешиа, С. Тинелли, «Теории выполнимости по модулю. " В Справочнике по выполнимости, т. 185 of Frontiers in Artificial Intelligence and Applications, (A Biere, MJH Heule, H van Maaren, and T. Walsh, ред.), IOS Press, февраль 2009 г., стр. 825–885.
Виджай Ганеш ( PhD. Thesis 2007), Процедуры принятия решений для битовых векторов, массивов и целых чисел, факультет компьютерных наук, Стэнфордский университет, Стэнфорд, Калифорния, США, сентябрь 2007 г.
Susmit Jha, Rhishikesh Limaye, и Санджит А. Сешия. Бивер: разработка эффективного решателя SMT для бит-векторной арифметики. В материалах 21-й Международной конференции по компьютерной проверке, стр. 668–674, 2009.
R. Э. Брайант, С. М. Герман и М. Н. Велев, «Проверка микропроцессора с использованием эффективных процедур принятия решений для логики равенства с неинтерпретируемыми функциями », в Аналитических таблицах и связанных с ними методах, стр. 1–13, 1999.
М. Дэвис и Х. Патнэм, Вычислительная процедура для теории количественной оценки, Журнал Ассоциации вычислительной техники, вып. 7, no., Pp. 201–215, 1960.
М. Дэвис, Дж. Логеманн и Д. Ловленд, Машинная программа для доказательства теорем, Связь ACM, т. 5, вып. 7. С. 394–397, 1962.
Д. Кроенинг и О. Стрихман, Процедуры принятия решений - алгоритмическая точка зрения (2008), Springer (серия теоретической информатики) ISBN 978-3-540- 74104-6.
Г.-Дж. Нам, К. А. Сакаллах, Р. Рутенбар, Новый подход к детальной маршрутизации ПЛИС с помощью логической удовлетворенности на основе поиска, Транзакции IEEE по автоматизированному проектированию интегральных схем и систем, т. 21, нет. 6, pp. 674–684, 2002.
SMT-LIB: Библиотека теорий по модулю соответствия
SMT-COMP: Конкурс теорий по модулю удовлетворенности
Процедуры принятия решений - алгоритмическая точка зрения
R. Sebastiani, Lazy Satisfiability Modulo Theories, Dipartimento di Ingegneria e Scienza dell'Informazione, Universita di Trento, Италия, декабрь 2007 г.
Д.Юричев, Краткое введение в решатели SAT / SMT и символическое исполнение

Эта статья адаптирована из столбца электронного информационного бюллетеня ACM SIGDA , подготовленного проф. Карем Сакаллах. Исходный текст доступен здесь