Программирование на основе автоматов

редактировать

Программирование на основе автоматов - это парадигма программирования, в которой программа или ее часть рассматривается как модель конечного автомата (FSM) или любого другого (часто более сложного) формального автомата (см. теория автоматов ). Иногда вводится потенциально бесконечный набор возможных состояний, и такой набор может иметь сложную структуру, а не просто перечисление.

Программирование на основе конечных автоматов в целом то же самое, но, формально говоря, не охватывает все возможные варианты, поскольку конечный автомат обозначает конечный автомат, а автоматное программирование не обязательно использует конечные автоматы в строгий смысл.

Следующие свойства являются ключевыми индикаторами для программирования на основе автоматов:

Период времени выполнения программы четко разделен на шаги автомата. Каждый шаг фактически представляет собой выполнение раздела кода (одинакового для всех шагов), имеющего единственную точку входа. Этот раздел можно разделить на подразделы, которые будут выполняться в зависимости от различных состояний, хотя в этом нет необходимости.
Любая связь между этапами автомата возможна только через явно отмеченный набор переменных, называемых состоянием автомата. Между любыми двумя шагами программа не может иметь неявных компонентов своего состояния, таких как значения локальных переменных, адреса возврата, текущий указатель инструкции и т. Д. То есть состояние всей программы, полученное в любые два момента ввода шаг автомата, может отличаться только значениями переменных, рассматриваемых как состояние автомата.

Все выполнение кода, основанного на автомате, является циклом шагов автомата.

Другая причина использования понятия программирования на основе автоматов заключается в том, что стиль мышления программиста о программе в этой технике очень похож на стиль мышления, используемый для решения математических задач с использованием машин Тьюринга, Марковские алгоритмы и т. Д.

Содержание

1 Пример
- 1.1 Задача
- 1.2 Традиционная программа
- 1.3 Программа на основе автоматов
  - 1.3.1 Процедурная
  - 1.3.2 Объектно-ориентированный
- 1.4 Автоматизация и автоматизация
  - 1.4.1 Программа автоматизации
  - 1.4.2 События
2 Приложения
3 История
4 Сравнение с императивным и процедурным программированием
5 Связь объектно-ориентированного программирования
6 См. Также
7 Ссылки
8 Внешние ссылки

Пример

Задача

Рассмотрим задачу чтения текста из стандартного ввода построчно и записывая первое слово каждой строки в стандартный вывод. Сначала мы пропускаем все ведущие пробельные символы, если они есть. Затем печатаем все символы первого слова. Наконец, мы пропускаем все завершающие символы до тех пор, пока не встретится символ новой строки. Каждый раз, когда последовательность символов новой строки встречается не в начале потока, мы печатаем только первый и пропускаем остальные; иначе мы пропускаем все. Затем мы перезапускаем процесс со следующей строки. При обнаружении условия конца файла (независимо от этапа) мы останавливаемся.

Традиционная программа

Традиционная программа на C, которая выполняет вышеуказанную задачу, может выглядеть следующим образом:

#include #include int main (недействительно) {int c; делать {делать {c = getchar (); } while (isspace (c)); в то время как (! isspace (c) c! = EOF) {putchar (c); c = getchar (); } while (c! = '\ n' c! = EOF) {c = getchar (); } если (c == '\ n') {putchar (c); }} while (c! = EOF); возврат 0; }

Например, компиляция и выполнение указанной выше программы на этом входе:

$ clang program.c (printf "\ t \ v \ f \ r \ n \ n \ t \ v \ f \ r foo bar baz \ n \ n \ t \ v \ f \ r qux quux corge "|./a.out)

возвращает:

foo qux

Программа на основе автоматов

Процедурная

Эту же задачу можно решить, если мыслить в терминах конечных автоматов. Обратите внимание, что синтаксический анализ строки состоит из трех этапов: пропуск начальных пробельных символов, печать символов первого слова и пропуск конечных символов. Назовем эти состояния автомата ДО, ВНУТРИи ПОСЛЕ. Версия программы на основе автоматов может выглядеть так:

#include #include enum State {BEFORE, INSIDE, AFTER}; int main (void) {int c; enum State s = BEFORE; while ((c = getchar ())! = EOF) {переключатель (s) {case BEFORE: if (! isspace (c)) {putchar (c); s = ВНУТРИ; } перемена; case INSIDE: if (c == '\ n') {putchar (c); s = ДО; } иначе, если (isspace (c)) {s = AFTER; } else {putchar (c); } перемена; case AFTER: if (c == '\ n') {putchar (c); s = ДО; } перемена; }} return 0; }

Хотя программа теперь выглядит длиннее, у нее есть по крайней мере одно существенное преимущество: есть только одна инструкция чтения (то есть вызов функции getchar). Кроме того, здесь всего одна петля вместо четырех в традиционной версии. Тело цикла while- это шаг автомата, а сам цикл - это цикл шага автомата. Программа реализует работу конечного автомата, показанного на диаграмме состояний.

Самым важным свойством программы является то, что секция кода шага автомата четко локализована. С явной функцией stepдля этапа автоматизации программа лучше демонстрирует это свойство:

#include #include enum State {BEFORE, INSIDE, AFTER}; void step (enum State * const s, int const c) {переключатель (* s) {case BEFORE: if (! isspace (c)) {putchar (c); * s = ВНУТРИ; } перемена; case INSIDE: if (c == '\ n') {putchar (c); * s = ДО; } иначе, если (isspace (c)) {* s = ПОСЛЕ; } else {putchar (c); } перемена; case AFTER: if (c == '\ n') {putchar (c); * s = ДО; } перемена; }} int main (void) {int c; enum State s = BEFORE; в то время как ((c = getchar ())! = EOF) {шаг (s, c); } return 0; }

Теперь программа наглядно демонстрирует основные свойства автоматного кода:

периоды выполнения автоматных шагов могут не перекрываться;
единственной информацией, передаваемой от предыдущего шага к следующему, является явно заданное состояние автомата.

Конечный автомат может быть определен с помощью таблицы переходов между состояниями, строки которой соответствуют текущим состояниям, столбцы - входам, а ячейки - следующим состояниям и действиям для выполнять.

Таблица перехода между состояниями
Ввод Текущее состояние	новая строка	пробел	другое
перед	перед	до	внутри / печать
внутри	до / печать	после	внутри / печать
после	до / печать	после	после

Диаграмма состояний
диаграмма состояний конечного автомата, который печатает первое слово каждой строки входной поток. Машина выполняет ровно один переход на каждом шаге, в зависимости от текущего состояния и встречающегося символа. Действие, сопровождающее переход, - это либо отсутствие операции, либо печать обнаруженного символа, обозначенного print.

Вообще говоря, автоматная программа, естественно, может использовать этот подход. С явным двумерным массивом переходовдля таблицы переходов состояний программа использует следующий подход:

#include #include enum State {BEFORE, INSIDE, AFTER}; void nop (int const c) {} void print (int const c) {putchar (c); } struct Branch {enum State const next_state; void (* действие) (число); }; struct Branch const transitions [3] [3] = {// новая строка пробела других входов / состояний {{BEFORE, nop}, {BEFORE, nop}, {INSIDE, print}}, // перед {{BEFORE, print}, {AFTER, nop}, {INSIDE, print}}, // внутри {{BEFORE, print}, {AFTER, nop}, {AFTER, nop}} // после}; void step (enum State * const s, int const c) {int const row = (* s == BEFORE)? 0: (* s == ВНУТРИ)? 1: 2; int const column = (c == '\ n')? 0: isspace (c)? 1: 2; struct Branch const * const b = переходы [строка] [столбец]; * s = b->next_state; б->действие (в); } int main (void) {int c; enum State s = BEFORE; в то время как ((c = getchar ())! = EOF) {шаг (s, c); } return 0; }

Объектно-ориентированный

Если язык реализации поддерживает объектно-ориентированное программирование, простой рефакторинг программы заключается в инкапсуляции автомата в объект, таким образом скрывая детали его реализации. Программа на C ++ с использованием объектно-ориентированного стиля может выглядеть так:

#include #include enum State {BEFORE, INSIDE, AFTER}; struct Branch {enum State const next_state; void (* действие) (число); }; класс StateMachine {общественности: StateMachine (); void feedChar (число); protected: static void nop (int); статическая пустота print (int); частные: enum State _state; статическая структура Branch const _transitions [3] [3]; }; StateMachine :: StateMachine (): _state (BEFORE) {} void StateMachine :: feedChar (int const c) {int const row = (_state == BEFORE)? 0: (_state == ВНУТРИ)? 1: 2; int const column = (c == '\ n')? 0: isspace (c)? 1: 2; struct Branch const * const b = _transitions [строка] [столбец]; _state = b->next_state; б->действие (в); } void StateMachine :: nop (int const c) {} void StateMachine :: print (int const c) {putchar (c); } struct Branch const StateMachine :: _ transitions [3] [3] = {// новая строка пробела другие входы / состояния {{BEFORE, nop}, {BEFORE, nop}, {INSIDE, print}}, // перед {{BEFORE, print}, {AFTER, nop}, {INSIDE, print}}, // внутри {{BEFORE, print}, {AFTER, nop}, {AFTER, nop}} // после}; int main () {int c; StateMachine m; в то время как ((c = getchar ())! = EOF) {m.feedChar (c); } return 0; }

Примечание. - Для минимизации изменений, не связанных напрямую с тематикой статьи, функции input/output getcharи putcharиз стандартной библиотеки C уже используются.

Шаблон проектирования состояния - это способ для объекта изменить свое поведение во время выполнения в соответствии с его внутренним состоянием, не прибегая к большим условным операторам или просмотру таблиц благодаря вызовам виртуальных функций. Его главное преимущество перед кодом, использующим большие условные операторы, заключается в том, что код, зависящий от состояния, распределен по различным объектам, а не локализован в монолитном блоке, что улучшает ремонтопригодность. Его основные преимущества перед кодом, использующим таблицы перехода состояний, заключаются в том, что вызовы виртуальных функций часто более эффективны, чем поиск в таблицах, критерии перехода между состояниями более явны, чем в табличном формате, и что легче добавлять действия, сопровождающие переходы состояний. Однако это создает новую проблему: количество классов делает код менее компактным, чем другие подходы. Программа, использующая шаблон проектирования состояний, может выглядеть так:

#include #include class StateMachine; class State {public: виртуальная пустота feedChar (StateMachine *, int) const = 0; }; class Перед: общественное состояние {общественное: статическое состояние const * instantiate (); виртуальная пустота feedChar (StateMachine *, int) const override; protected: Before () = по умолчанию; частный: статическое состояние const * _instance; }; класс Внутри: общественное состояние {общественное: статическое состояние const * instantiate (); виртуальная пустота feedChar (StateMachine *, int) const override; защищенный: Внутри () = по умолчанию; частный: статическое состояние const * _instance; }; класс После: общественное состояние {общественное: статическое состояние const * instantiate (); виртуальная пустота feedChar (StateMachine *, int) const override; защищенный: After () = по умолчанию; частный: статическое состояние const * _instance; }; класс StateMachine {общественности: StateMachine (); void feedChar (число); защищенный: void setState (состояние const *); частный: состояние const * _state; класс друзей До; Friend class Inside; класс друзей После; }; Состояние const * Before :: instantiate () {if (! _Instance) {_instance = new Before; } return _instance; } void Before :: feedChar (StateMachine * const m, int const c) const {если (! isspace (c)) {putchar (c); m->setState (Внутри :: instantiate ()); }} Состояние const * Before :: _ instance = nullptr; Состояние const * Inside :: instantiate () {if (! _Instance) {_instance = new Inside; } return _instance; } void Inside :: feedChar (StateMachine * const m, int const c) const {if (c == '\ n') {putchar (c); m->setState (До :: instantiate ()); } иначе если (isspace (c)) {m->setState (After :: instantiate ()); } else {putchar (c); }} Состояние const * Внутри :: _ instance = nullptr; Состояние const * After :: instantiate () {if (! _Instance) {_instance = new After; } return _instance; } void After :: feedChar (StateMachine * const m, int const c) const {if (c == '\ n') {putchar (c); m->setState (До :: instantiate ()); }} Состояние const * After :: _ instance = nullptr; StateMachine :: StateMachine (): _state (Before :: instantiate ()) {} void StateMachine :: feedChar (int const c) {_state->feedChar (this, c); } void StateMachine :: setState (State const * const s) {_state = s; } int main () {int c; StateMachine m; пока ((c = getchar ())! = EOF) {m.feedChar (c); } return 0; }

Автоматизация и автоматы

Программирование на основе автоматов действительно близко соответствует потребностям программирования в области автоматизации.

Производственный цикл обычно моделируется как:

последовательность этапов шаг по входным данным (от захватчиков);
набор действий, выполняемых в зависимости от текущего этапа.

Различные специализированные языки программирования позволяют выразить такую модель более или менее изощренно.

Программа автоматизации

Пример, представленный выше, может быть выражен в соответствии с этим представлением, как в следующем псевдокоде ('set' активирует логическую переменную, 'reset' деактивирует логическую переменную, ':' присваивает переменную, а '=' проверяет равенство):

новая строка: '\ n' пробел: ('\ t', '\ n', '\ v', '\ f ',' \ r ',' ') состояния: (до, внутри, после) setState (c) {если до и (c! = новая строка и c не в пробеле), то установить внутри, если внутри then (если c в пробеле затем установить после else, если c = новая строка, затем установить до), если после и c = новая строка, затем установить до} doAction (c) {если до и (c! = новая строка и c не в пробеле), то напишите (c) если внутри и c не в пробеле, то напишите (c) если после и c = новая строка, то напишите (c)} cycle {установить перед циклом до (c: readCharacter) = EOL {setState (c) doAction (c)}}

Разделение подпрограммы, выражающие прогрессию цикла с одной стороны, и фактическое действие с другой (согласование ввода и вывода) позволяют более четко и просто код лера.

События

В области автоматизации переход от шага к шагу зависит от входных данных, поступающих от самой машины. В программе это представлено чтением символов из текста. В действительности эти данные сообщают о положении, скорости, температуре и т. Д. Критических элементов машины.

Как и в программировании GUI, изменения в состоянии машины, таким образом, можно рассматривать как события, вызывающие переход из одного состояния в другое, пока не будет достигнуто последнее. Комбинация возможных состояний может генерировать большое количество событий, определяя более сложный производственный цикл. Как следствие, циклы обычно далеки от простых линейных последовательностей. Обычно существуют параллельные ветви, идущие вместе, и альтернативы, выбираемые в соответствии с различными событиями, схематично представлены ниже:

s: stage c: condition s1 | | -c2 | s2 | ---------- | | | -c31 | -c32 | | s31 s32 | | | -c41 | -c42 | | ---------- | s4

Приложения

Программирование на основе автоматов широко используется в лексическом и синтаксическом анализе.

. Кроме того, мышление в терминах автоматов (то есть разбиение процесса выполнения на этапы автоматизации и передача информации от этапа к этапу через явное состояние автомата) необходимо для событийно-ориентированного программирования как единственной альтернативы использованию параллельных процессов или потоков.

Понятия состояний и конечных автоматов часто используются в области формальной спецификации. Например, при разработке архитектуры программного обеспечения на основе UML используются диаграммы состояний для определения поведения программы. Также различные протоколы связи часто указываются с использованием явного понятия состояния (например, RFC 793 ).

Мышление в терминах автоматов (шагов и состояний) также может использоваться для описания семантики некоторых языков программирования. Например, выполнение программы, написанной на языке Refal, описывается как последовательность шагов так называемой абстрактной машины Refal; состояние машины - это представление (произвольное выражение Рефаля без переменных).

Продолжение в языке Scheme требует мышления в терминах шагов и состояний, хотя сама Scheme никоим образом не связана с автоматами (она рекурсивна). Чтобы функция call / cc могла работать, реализация должна иметь возможность улавливать все состояние выполняющейся программы, что возможно только тогда, когда в состоянии нет неявной части. Такое пойманное состояние и есть то, что называется продолжением, и его можно рассматривать как состояние (относительно сложного) автомата. Шаг автомата выводит следующее продолжение из предыдущего, а процесс выполнения - это цикл таких шагов.

Александр Оллонгрен в своей книге объясняет так называемый венский метод описания семантики языков программирования, полностью основанный на формальных автоматах.

Система STAT [1] - хороший пример использования подхода, основанного на автоматах; эта система, помимо других функций, включает встроенный язык под названием STATL, который ориентирован исключительно на автоматизацию.

История

Методы, основанные на автоматах, широко использовались в тех областях, где есть алгоритмы, основанные на теории автоматов, такие как анализ формального языка.

Одна из ранних работ по это Джонсон и др., 1968.

Одно из самых ранних упоминаний о автоматном программировании как об общем методе содержится в статье Питера Наура, 1963. Автор называет подход машины Тьюринга, однако в статье не приводится реальная машина Тьюринга ; вместо этого описывается техника, основанная на шагах и состояниях.

Сравнение с императивным и процедурным программированием

Понятие состояния не является исключительным свойством автоматного программирования. Вообще говоря, состояние (или состояние программы ) появляется во время выполнения любой компьютерной программы как комбинация всей информации, которая может изменяться во время выполнения. Например, состояние традиционной императивной программы состоит из

значений всех переменных и информации, хранящейся в динамической памяти;
значений, хранящихся в регистрах;
содержимое стека (включая значения локальных переменных и адреса возврата);
текущее значение указателя инструкции.

Их можно разделить на явную часть (например, значения, хранящиеся в переменных) и неявную часть ( адреса возврата и указатель инструкции).

Сказав это, автоматная программа может рассматриваться как частный случай императивной программы, в которой неявная часть состояния минимизирована. Состояние всей программы, полученное в два разных момента входа в секцию кода шага, может отличаться только состоянием автомата. Это упрощает анализ программы.

Взаимосвязь объектно-ориентированного программирования

В теории объектно-ориентированного программирования считается, что объект имеет внутреннее состояние и способен принимать сообщения, отвечая на их, отправляя сообщения другим объектам и изменяя свое внутреннее состояние во время обработки сообщений. В более практической терминологии вызов метода объекта рассматривается как отправка сообщения объекту.

Таким образом, с одной стороны, объекты из объектно-ориентированного программирования могут рассматриваться как автоматы (или модели автоматов), состояние которых является комбинацией частных полей, а один или несколько методов считаются этапом. Такие методы не должны вызывать друг друга или самих себя, ни прямо, ни косвенно, иначе объект не может считаться реализованным на основе автоматов.

С другой стороны, объект хорош для реализации модели автомата. Когда подход, основанный на автоматах, используется в объектно-ориентированном языке, автоматная модель обычно реализуется классом, состояние представлено частными полями класса, а шаг реализуется как метод; такой метод обычно является единственным непостоянным общедоступным методом класса (помимо конструкторов и деструкторов). Другие общедоступные методы могут запрашивать состояние, но не меняют его. Все второстепенные методы (например, обработчики определенных состояний) обычно скрыты в частной части класса.

См. Также

Клеточный автомат
Недетерминированное программирование
Шаблон состояния
Esterel, язык на основе автоматов
Umple, инструмент для добавления автоматов в Java и C ++

Ссылки

^ Aho, Alfred V.; Ульман, Джеффри Д. (1973). Теория разбора, перевода и компиляции. 1 . Энглвуд Клиффс, штат Нью-Джерси: Прентис-Холл. ISBN 0-13-914564-8.
^Оллонгрен, Александр (1974). Определение языков программирования путем интерпретации автоматов. Лондон: Academic Press. ISBN 0-12-525750-3.
^Johnson, W. L.; Porter, J. H.; Ackley, S. I.; Росс, Д. Т. (1968). «Автоматическая генерация эффективных лексических процессоров с использованием методов конечного состояния». Связь ACM. 11 (12): 805–813. doi : 10.1145 / 364175.364185.
^Наур, Питер (сентябрь 1963 г.). "Дизайн компилятора GIER ALGOL Часть II". BIT Численная математика. 3 (3): 145–166. doi : 10.1007 / BF01939983.
^«Автоматное программирование» (PDF). Научно-технический журнал информационных технологий, механики и оптики (53). 2008.

Внешние ссылки

J. В. Благородный. «Конечные автоматы в форте» - автоматное программирование на форте
Харел, Дэвид (1987). «Диаграммы состояний: визуальный формализм для сложных систем» (PDF). Sci. Comput. Программирование. 8 (3): 231–274. doi : 10.1016 / 0167-6423 (87) 90035-9.
Харел, Дэвид; Друсинский, Д. (1989). «Использование диаграмм состояний для описания и синтеза оборудования». IEEE Transactions по автоматизированному проектированию интегральных схем и систем. 8 (7): 798–807. DOI : 10.1109 / 43.31537. S2CID 8754800.
Поликарпова Н.И., Шалыто А.А. Автоматное программирование СПб.: Питер. 2009 (рус)
Университет ИТМО, кафедра «Технологии программирования»