Soar (когнитивная архитектура)

редактировать

Soar - это когнитивная архитектура, первоначально созданная Джоном Лэрдом, Аллен Ньюэлл и Университет Карнеги-Меллона. (Розенблум продолжал выполнять функции главного исследователя после перехода в Стэнфордский университет, затем в Институт информационных наук Университета Южной Калифорнии.) В настоящее время поддерживается и разработан исследовательской группой Джона Лэрда в Мичиганском университете.

Целью проекта Soar является разработка фиксированных вычислительных строительных блоков, необходимых для общих интеллектуальных агентов - агентов, которые могут выполнять широкий спектр задач, а также кодирование, использование и изучение всех типов знаний для реализации всего спектра когнитивных способностей человека, таких как принятие решений, решение проблем, планирование и понимание естественного языка. Это и теория того, что такое познание, и вычислительная реализация этой теории. С момента своего появления в 1983 году в качестве тезиса Джона Лэрда он широко использовался исследователями ИИ для создания интеллектуальных агентов и когнитивных моделей различных аспектов человеческого поведения. Наиболее актуальным и полным описанием Soar является книга 2012 года «Когнитивная архитектура Soar».

Содержание

1 Теория
2 Архитектура
- 2.1 Цикл обработки - процедура принятия решения
- 2.2 Обучение с подкреплением
- 2.3 Тупиковые ситуации, подсостояния и фрагменты
- 2.4 Символический ввод и вывод
- 2.5 Пространственная визуальная система и ментальные образы
- 2.6 Семантическая память
- 2.7 Эпизодическая память
- 2.8 Обучение
3 Развитие агента
4 Программное обеспечение
5 Приложения
- 5.1 Головоломки и игры
- 5.2 Конфигурация компьютера
- 5.3 Понимание естественного языка
- 5.4 Моделируемые пилоты
- 5.5 STEAM
- 5.6 NTD-Soar
- 5.7 Виртуальные люди
- 5.8 Игровые ИИ и мобильные приложения
- 5.9 Робототехника
- 5.10 Интерактивное обучение задач
- 5.11 Планирование
6 См. Также
7 Ссылки
8 Библиография
9 Внешние ссылки

Теория

Soar воплощает несколько гипотез о вычислительных структурах, лежащих в основе общего интеллекта, многие из которых разделяются с другими когнитивными пять архитектур, включая ACT-R, который был создан Джоном Р. Андерсоном, и LIDA, который был создан Стэном Франклином. В последнее время упор на Soar делался на общий ИИ (функциональность и эффективность), тогда как акцент на ACT-R всегда делался на когнитивное моделирование (детальное моделирование человеческого познания).

Исходной теорией познания, лежащей в основе Soar, является гипотеза проблемного пространства, которая описана в книге Аллена Ньюэлла Unified Theories of Cognition. и восходит к одной из первых созданных систем искусственного интеллекта, Newell, Simon и Shaw, Logic Theorist, впервые представленной в 1955 году. Гипотеза проблемного пространства утверждает, что любое целенаправленное поведение можно представить как поиск в пространстве возможных состояний (а) при попытке достичь цели. На каждом этапе выбирается один оператор, который затем применяется к текущему состоянию агента, что может привести к внутренним изменениям, таким как извлечение знаний из долговременной памяти или модификациям или внешним действиям в мире. (Название Soar происходит от этого базового цикла, состоящего из состояний, оператора и результата; однако он больше не рассматривается как акроним.) Гипотезе проблемного пространства присуще то, что любое поведение, даже сложное действие, такое как планирование, разложимо. в последовательность выбора и применения примитивных операторов, которые при отображении на поведение человека занимают ~ 50 мс.

Вторая гипотеза теории Соара заключается в том, что, хотя на каждом шаге может быть выбран только один оператор, вызывая последовательное узкое место, процессы выбора и применения реализуются посредством параллельных запусков правил, которые обеспечивают контекстно-зависимое извлечение процедурных знаний.

Третья гипотеза заключается в том, что если знания для выбора или применения оператора неполны или неопределенны, возникает тупик, и архитектура автоматически создает подсостояние. В подсостоянии рекурсивно используется тот же процесс решения проблемы, но с целью извлечения или открытия знаний, чтобы можно было продолжить принятие решений. Это может привести к стеку подсостояний, где естественным образом возникают традиционные методы проблем, такие как планирование или иерархическая декомпозиция задач. Когда результаты, созданные в подсостоянии, разрешают тупик, подсостояние и связанные с ним структуры удаляются. Общий подход называется универсальной подцелью.

Эти предположения приводят к архитектуре, которая поддерживает три уровня обработки. На самом низком уровне идет восходящая, параллельная и автоматическая обработка. Следующий уровень - это совещательный уровень, где знания первого уровня используются для предложения, выбора и применения одного действия. Эти два уровня обеспечивают быстрое и квалифицированное поведение и примерно соответствуют уровню обработки Канемана Системы 1. Более сложное поведение возникает автоматически, когда знание является неполным или неопределенным, через третий уровень обработки с использованием подсостояний, примерно соответствующий Системе 2.

Четвертая гипотеза в Soar состоит в том, что основная структура является модульной, но не в терминах модулей, основанных на задачах или возможностях, таких как планирование или язык, но вместо этого как модули, не зависящие от задачи, включая: модуль принятия решений; модули памяти (краткосрочные пространственные / визуальные и рабочие воспоминания; долгосрочные процедурные, декларативные и эпизодические воспоминания), механизмы обучения, связанные со всеми долгосрочными воспоминаниями; а также перцептивные и двигательные модули. Существуют и другие предположения о конкретных свойствах этих воспоминаний, описанных ниже, в том числе о том, что все обучение происходит онлайн и происходит постепенно.

Пятая гипотеза состоит в том, что элементы памяти (за исключением пространственной / визуальной памяти) представлены как символические, реляционные структуры. Гипотеза о том, что символическая система необходима для общего интеллекта, известна как гипотеза физической системы символов. Важная эволюция в Soar заключается в том, что все символические структуры имеют связанные статистические метаданные (такие как информация о давности и частоте использования или ожидаемом будущем вознаграждении), которые влияют на извлечение, обслуживание и изучение символических структур.

Архитектура

Цикл обработки - процедура принятия решения

Основной цикл обработки Soar возникает из взаимодействия между процедурной памятью (ее знаниями о том, как что-то делать) и рабочая память (представление текущей ситуации) для поддержки выбора и применения операторов. Информация в рабочей памяти представлена в виде символьной структуры графа , укорененной в состоянии. Знания в процедурной памяти представлены как если-то правила (наборы условий и действий), которые постоянно сопоставляются с содержимым рабочей памяти. Когда условия правила соответствуют структурам в рабочей памяти, оно срабатывает и выполняет свои действия. Эта комбинация правил и рабочей памяти также называется производственной системой. В отличие от большинства производственных систем, в Soar все соответствующие правила запускаются параллельно.

Вместо выбора единственного правила, являющегося ключевым моментом при принятии решений, принятие решений Soar происходит посредством выбора и применения операторов, которые предлагаются, оцениваются и применяются по правилам. Оператор предлагается с помощью правил, которые проверяют текущее состояние и создают представление оператора в рабочей памяти, а также приемлемое предпочтение, которое указывает, что оператор следует рассматривать для выбора и применения. Дополнительные правила совпадают с предложенным оператором и создают дополнительные предпочтения, которые сравнивают и оценивают его с другими предложенными операторами. Предпочтения анализируются процедурой принятия решения, которая выбирает предпочтительного оператора и устанавливает его в качестве текущего оператора в рабочей памяти. Затем срабатывают правила, соответствующие текущему оператору, чтобы применить его и внести изменения в рабочую память. Изменения в рабочей памяти могут быть простыми выводами, запросами для извлечения из долговременных семантических или эпизодических воспоминаний Соара, командами двигательной системе для выполнения действий в окружающей среде или взаимодействиями с пространственной визуальной системой (SVS), которая является рабочей памятью. интерфейс к восприятию. Эти изменения в рабочей памяти приводят к тому, что предлагаются и оцениваются новые операторы, за которыми следует выбор одного и его применения.

Обучение с подкреплением

Soar поддерживает обучение с подкреплением, которое настраивает значения правил, которые создают числовые предпочтения для оценки операторов на основе вознаграждения. Чтобы обеспечить максимальную гибкость, в рабочей памяти есть структура, в которой создается вознаграждение.

Тупиковые ситуации, подсостояния и разбиение на части

Если предпочтений для операторов недостаточно, чтобы указать выбор одного оператора, или недостаточно правил для применения оператора, возникает тупиковая ситуация. В ответ на тупик в рабочей памяти создается подсостояние, цель которого - разрешить тупик. Дополнительные процедурные знания затем могут предлагать и выбирать операторов в подсостоянии, чтобы получить больше знаний, и либо создавать предпочтения в исходном состоянии, либо изменять это состояние, чтобы разрешить тупиковую ситуацию. Подсостояния предоставляют средства для сложных рассуждений по запросу, включая иерархическую декомпозицию задач, планирование и доступ к декларативной долгосрочной памяти. Как только тупиковая ситуация разрешена, все структуры подсостояния удаляются, за исключением любых результатов. Механизм фрагментации Soar компилирует обработку в подсостоянии, которая привела к результатам, в правила. В будущем изученные правила автоматически срабатывают в аналогичных ситуациях, чтобы не возникало тупиковой ситуации, постепенно преобразовывая сложные рассуждения в автоматическую / реактивную обработку. Недавно общая процедура универсальной подцели была расширена за счет механизма целенаправленного и автоматического увеличения базы знаний, который позволяет выходить из тупика путем рекомбинации новаторским и проблемно-ориентированным способом знаний, которыми обладает агент Soar.

Символьный ввод и вывод

Символьный ввод и вывод происходит через структуры рабочей памяти, прикрепленные к верхнему состоянию, которые называются входной ссылкой и выходной ссылкой. Если структуры создаются на выходном канале в рабочей памяти, они преобразуются в команды для внешних действий (например, управления двигателем).

Пространственная визуальная система и ментальные образы

Для поддержки взаимодействия с системами зрения и несимволических рассуждений у Soar есть пространственная визуальная система (SVS). SVS внутренне представляет мир в виде графа сцены, набора объектов и подобъектов компонентов, каждый из которых имеет пространственные свойства, такие как форма, местоположение, поза, относительное положение и масштаб. Агент Soar, использующий SVS, может создавать фильтры для автоматического извлечения функций и отношений из своего графа сцены, которые затем добавляются в рабочую память. Кроме того, агент Soar может добавлять структуры в SVS и использовать их для ментальных образов. Например, агент может создать гипотетический объект в SVS в заданном месте и запросить, не сталкивается ли он с какими-либо воспринимаемыми объектами.

Семантическая память

Семантическая память (SMEM) в Soar предназначена для очень большой долговременной памяти структур, подобных фактам. Данные в SMEM представлены в виде ориентированных циклических графов. Структуры можно сохранять или извлекать с помощью правил, которые создают команды в зарезервированной области рабочей памяти. Полученные структуры добавляются в рабочую память.

У структур SMEM есть значения активации, которые представляют частоту или новизну использования каждой памяти, реализующие схему активации базового уровня, первоначально разработанную для ACT-R. Во время поиска извлекается структура в SMEM, которая соответствует запросу и имеет максимальную активацию. Soar также поддерживает активацию распространения, при которой активация распространяется от структур SMEM, которые были извлечены в рабочую память, на другие долговременные воспоминания, с которыми они связаны. Эти воспоминания, в свою очередь, распространяют активацию на воспоминания соседей с некоторым распадом. Активация распространения - это механизм, позволяющий текущему контексту влиять на извлечение из семантической памяти.

Эпизодическая память

Эпизодическая память (EPMEM) автоматически записывает моментальные снимки рабочей памяти во временном потоке. Предыдущие эпизоды можно загрузить в рабочую память с помощью запроса. Как только эпизод был извлечен, можно будет извлечь следующий (или предыдущий) эпизод. Агент может использовать EPMEM для последовательного воспроизведения эпизодов из своего прошлого (что позволяет ему предсказать последствия действий), извлечения определенных воспоминаний или запроса эпизодов, обладающих определенными структурами памяти.

Обучение

С каждым долгосрочным воспоминанием Соара связаны механизмы онлайн-обучения, которые создают новые структуры или изменяют метаданные на основе опыта агента. Например, Soar изучает новые правила для процедурной памяти с помощью процесса, называемого фрагментированием, и использует обучение с подкреплением для настройки правил, участвующих в выборе операторов.

Разработка агента

Стандартный подход к разработке агента в Soar начинается с написания правил, которые загружаются в процедурную память, и инициализации семантической памяти с соответствующими декларативными знаниями. Процесс разработки агента подробно описан в официальном руководстве по Soar, а также в нескольких учебных пособиях, которые представлены на веб-сайте исследовательской группы.

Программное обеспечение

Расширение когнитивной архитектуры Soar, автор John Laird, 2008.

Архитектура Soar поддерживается и расширяется исследовательской группой Джона Лэрда в Мичиганском университете. Текущая архитектура написана на комбинации C и C ++ и находится в свободном доступе (лицензия BSD) на веб-сайте исследовательской группы.

Soar может взаимодействовать с внешними языковыми средами, включая C ++, Java, Tcl и Python, через Язык разметки Soar (SML). SML - это основной механизм для создания экземпляров агентов Soar и взаимодействия с их ссылками ввода-вывода.

JSoar - это реализация Soar, написанная на Java. Он поддерживается SoarTech, компанией, занимающейся исследованиями и разработками в области ИИ. JSoar внимательно следит за реализацией архитектуры Мичиганского университета, хотя, как правило, не отражает последних разработок и изменений этой версии C / C ++.

Приложения

Ниже приведен исторический список различных областей приложения, реализованные в Soar. В Soar реализовано более сотни систем, хотя подавляющее большинство из них представляют собой игрушечные задачи или головоломки.

Пазлы и игры

На протяжении всей своей истории Soar использовался для реализации широкого спектра классических головоломок и игр с ИИ, таких как «Ханойская башня», «Кувшин для воды», «Крестики-нолики», «Восьмерка»., Миссионеры и каннибалы, а также варианты мира Blocks. Одно из первых достижений Soar показало, что множество различных слабых методов естественным образом возникнет из знания задачи, которое было закодировано в нем, свойство, называемое универсальным слабым методом.

Конфигурация компьютера

Первым крупномасштабным приложением Soar было R1-Soar, частичное повторное внедрение Полом Розенблумом экспертной системы R1 (XCON ) Джон Макдермотт разработал для настройки компьютеров DEC. R1-Soar продемонстрировал способность Soar масштабироваться до задач среднего размера, использовать иерархическую декомпозицию и планирование задач и преобразовывать преднамеренное планирование и решение проблем в реактивное выполнение посредством разбиения на части.

Понимание естественного языка

NL-Soar была системой понимания естественного языка, разработанной в Soar Джилл Фейн Леман, Риком Льюисом, Нэнси Грин, Дерилом Лонсдейлом и Грегом Нельсоном. Он включал возможности для понимания естественного языка, генерации и диалога с упором на инкрементный синтаксический анализ и генерацию в реальном времени. NL-Soar использовался в экспериментальной версии TacAir-Soar и в NTD-Soar.

Моделируемые пилоты

Второе крупномасштабное применение Soar включало разработку агентов для использования при обучении в больших -масштабное распределенное моделирование. Две основные системы для выполнения тактических воздушных миссий США были совместно разработаны в Мичиганском университете и Институте информационных наук (ISI) Университета Южной Калифорнии. Система Michigan получила название TacAir-Soar и использовала (в моделировании) самолет U. S. военные тактические задачи (такие как поддержка с воздуха, удары, CAP, дозаправка и SEAD миссии). Система ISI получила название RWA-Soar и использовала винтокрылые (вертолетные) миссии. Некоторые из возможностей, включенных в TacAir-Soar и RWA-Soar, включают внимание, ситуационную осведомленность и адаптацию, планирование в реальном времени и динамическое перепланирование, а также сложную коммуникацию, координацию и сотрудничество между комбинациями агентов Soar и людей. Эти системы участвовали в демонстрации передовых концептуальных технологий (ACTD) DARPA Synthetic Theater of War (STOW-97), которая в то время была крупнейшей площадкой синтетических агентов в совместной боевое пространство в течение 48 часов и включало обучение личного состава действующей службы. Эти системы продемонстрировали жизнеспособность использования агентов ИИ для крупномасштабного обучения.

STEAM

Одним из важных результатов проекта RWA-Soar была разработка STEAM Милиндом Тамбе, структура для гибкой командной работы, в которой агенты поддерживали модели своих товарищей по команде, используя структуру совместных намерений Коэна Левеск.

NTD-Soar

NTD-Soar была имитацией Директор по испытаниям НАСА (NTD), лицо, ответственное за координацию подготовки космического шаттла НАСА перед запуском. Это была интегрированная когнитивная модель, которая включала в себя множество различных сложных когнитивных возможностей, включая обработку естественного языка, внимание и визуальный поиск, а также решение проблем в широкой агентной модели.

Виртуальные люди

Soar использовался для имитации виртуальных людей, поддерживающих диалоги лицом к лицу и сотрудничество в виртуальном мире, разработанном в Институте творческих технологий в USC. Виртуальные люди обладают интегрированными способностями восприятия, понимания естественного языка, эмоций, управления телом и действий, среди прочего.

Игровые ИИ и мобильные приложения

Агенты Game AI были созданы с использованием Soar для таких игр, как StarCraft, Quake II, Descent 3, Unreal Турнир и Minecraft, поддерживающие такие возможности, как пространственное мышление, стратегия в реальном времени и ожидание оппонента. Также были созданы агенты искусственного интеллекта для видеоигр, включая Infinite Mario, в которой использовалось обучение с подкреплением, и Frogger II, Space Invaders и Fast Eddie, в котором использовались оба подкрепления. обучение и мысленные образы.

Soar изначально могут работать на мобильных устройствах. Мобильное приложение для игры Liar's Dice было разработано для iOS, которое запускает архитектуру Soar прямо с телефона в качестве движка для ИИ противника.

Робототехника

Множество различных роботизированных приложений было создано с использованием Soar с тех пор, как в 1991 году был реализован оригинальный Robo-Soar для управления манипулятором Puma. Они варьировались от управления мобильными роботами до гуманоидных служб REEM роботов, роботов-мулов и беспилотных подводных аппаратов.

Интерактивное обучение задач

Текущее направление исследований и разработок в Сообщество Soar - это интерактивное обучение задач (ITL), автоматическое изучение новых задач, особенностей среды, поведенческих ограничений и других спецификаций посредством естественного взаимодействия с инструктором. Исследования в области ITL были применены к настольным играм и навигации по нескольким комнатам.

Планирование

Вначале Мерл-Соар продемонстрировал, как Соар может изучить сложную задачу планирования, смоделированную по образцу ведущего человека-планировщика на заводе по производству лобовых стекол, расположенном недалеко от Питтсбурга.

См. также

Ссылки

Библиография

Laird, 2012 The Soar Когнитивная архитектура
Lehman, Laird, and Rosenbloom, 2006 Мягкое введение в Soar: обновление 2006 г.
Rosenbloom, Laird, and Newell, 1993 The Soar Papers: Readings on Integrated Intelligence, Институт информационных наук

Внешние ссылки