Распознавание эмоций

редактировать

Распознавание эмоций - это процесс идентификации человеческих эмоций. Люди сильно различаются по точности распознавания эмоций других. Использование технологий для помощи людям в распознавании эмоций - относительно новая область исследований. Как правило, технология работает лучше всего, если в контексте используется несколько модальностей . На сегодняшний день большая часть работы была проделана по автоматизации распознавания выражений лица из видео, устных выражений из аудио, письменных выражений из текста и физиологии, измеренных с помощью носимых устройств.

Содержание

1 Человек
2 Автоматически
- 2.1 Подходы
  - 2.1.1 Технологии, основанные на знаниях
  - 2.1.2 Статистические методы
  - 2.1.3 Гибридные подходы
- 2.2 Наборы данных
- 2.3 Приложения
3 Подполя распознавания эмоций
- 3.1 Распознавание эмоций в тексте
- 3.2 Распознавание эмоций в звуке
- 3.3 Распознавание эмоций в видео
- 3.4 Распознавание эмоций в разговоре
4 См. также
5 Источники

Человек

Люди демонстрируют большую вариативность в своих способностях распознавать эмоции. Ключевой момент, о котором следует помнить при изучении автоматизированного распознавания эмоций, заключается в том, что существует несколько источников «основной истины» или истины о том, что такое настоящая эмоция. Предположим, мы пытаемся распознать эмоции Алекса. Один из источников: «Что бы большинство людей сказали, что чувствует Алекс?» В этом случае «правда» может не соответствовать тому, что чувствует Алекс, но может соответствовать тому, что большинство людей назвали бы тем, что думает Алекс. Например, Алексу может быть грустно, но он широко улыбается, и тогда большинство людей говорят, что он выглядит счастливым. Если автоматизированный метод дает те же результаты, что и группа наблюдателей, его можно считать точным, даже если он фактически не измеряет то, что Алекс действительно чувствует. Еще один источник «истины» - спросить Алекса, что он на самом деле чувствует. Это работает, если Алекс хорошо понимает свое внутреннее состояние и хочет рассказать вам, что это такое, и способен точно выразить это словами или числами. Однако некоторые люди алекситимичны и не имеют четкого представления о своих внутренних чувствах или не могут точно передать их словами и числами. В целом, чтобы понять, какая эмоция присутствует на самом деле, может потребоваться определенная работа, она может варьироваться в зависимости от выбранных критериев и обычно предполагает поддержание определенного уровня неопределенности.

Автоматическое

Десятилетия научных исследований были разработаны и оценены методы автоматического распознавания эмоций. В настоящее время существует обширная литература, в которой предлагаются и оцениваются сотни различных методов, использующих методы из разных областей, например обработка сигналов, машинное обучение, компьютерное зрение, и обработка речи. Для интерпретации эмоций могут использоваться различные методологии и техники, такие как байесовские сети., Гауссовский Смешанные модели и Скрытые марковские модели.

Подходы

Точность распознавания эмоций обычно повышается, если оно объединяет анализ человеческих выражений из мультимодальных форм, таких как тексты, физиология, аудио или видео. Различные типы эмоций обнаруживаются посредством интеграции информации из выражений лица, движений тела и жестов и речи. Считается, что эта технология способствовала появлению так называемого эмоционального или эмоционального Интернета.

. Существующие подходы к распознаванию эмоций для классификации определенных типов эмоций можно в целом разделить на три основные категории: методы, основанные на знаниях, статистические методы и гибридные подходы.

Методы, основанные на знаниях

Методы, основанные на знаниях (иногда называемые методами лексикона ), используют знание предметной области и семантические и синтаксические характеристики языка для обнаружения определенных типов эмоций. В этом подходе в процессе классификации эмоций обычно используются ресурсы, основанные на знаниях, такие как WordNet, SenticNet, ConceptNet и EmotiNet, чтобы назвать мало. Одним из преимуществ этого подхода является доступность и экономичность, обусловленные большой доступностью таких ресурсов, основанных на знаниях. С другой стороны, ограничением этого метода является его неспособность справиться с нюансами концепций и сложными лингвистическими правилами.

Методы, основанные на знаниях, в основном можно разделить на две категории: подходы на основе словаря и корпуса. Подходы на основе словаря находят мнение или эмоции исходные слова в словаре и ищут их синонимы и антонимы, чтобы расширить начальный список мнения или эмоции. С другой стороны, подходы, основанные на корпусе, начинают с исходного списка мнений или слов эмоций и расширяют базу данных, находя другие слова с контекстно-зависимыми характеристиками в большом корпусе. Хотя корпусные подходы учитывают контекст, их эффективность по-прежнему различается в разных доменах, поскольку слово в одном домене может иметь разную ориентацию в другом домене.

Статистические методы

Статистические методы обычно включают использование различных контролируемых алгоритмов машинного обучения, в которых большой набор аннотированных данных вводится в алгоритмы, позволяющие системе изучать и предсказывать соответствующие типы эмоций. Машинное обучение алгоритмы обычно обеспечивают более разумную точность классификации по сравнению с другими подходами, но одной из проблем в достижении хороших результатов в процессе классификации является необходимость иметь достаточно большой обучающий набор.

Некоторые из самых важных Наиболее часто используемые алгоритмы машинного обучения включают Support Vector Machines (SVM), Naive Bayes и Maximum Entropy. Deep Learning, который входит в семейство неконтролируемых машинного обучения, также широко используется для распознавания эмоций. Хорошо известные алгоритмы глубокого обучения включают различные архитектуры искусственной нейронной сети (ИНС), такие как сверточная нейронная сеть (CNN), долгосрочная краткосрочная Память (LSTM) и Extreme Learning Machine (ELM). Популярность подходов глубокого обучения в области распознавания эмоций в основном объясняется их успехом в связанных приложениях, таких как компьютерное зрение, распознавание речи и Обработка естественного языка (NLP).

Гибридные подходы

Гибридные подходы к распознаванию эмоций, по сути, представляют собой комбинацию методов, основанных на знаниях, и статистических методов, в которых используются взаимодополняющие характеристики обоих методов. Некоторые из работ, в которых применялся ансамбль лингвистических элементов и статистических методов, основанных на знаниях, включают в себя дозорные вычисления и iFeel, в обеих из которых был заимствован ресурс SenticNet, основанный на знаниях. Роль таких ресурсов, основанных на знаниях, в реализации гибридных подходов очень важна в процессе классификации эмоций. Поскольку гибридные методы извлекают выгоду из преимуществ, предлагаемых как основанными на знаниях, так и статистическими подходами, они, как правило, имеют лучшую эффективность классификации, чем независимое использование основанных на знаниях или статистических методов. Однако недостатком использования гибридных методов является сложность вычислений во время процесса классификации.

Наборы данных

Данные являются неотъемлемой частью существующих подходов к распознаванию эмоций и в большинстве случаев это проблема для получения аннотированных данных, необходимых для обучения алгоритмов машинного обучения. Для задачи классификации различных типов эмоций из мультимодальных источников в форме текстов, аудио, видео или физиологических сигналов доступны следующие наборы данных:

HUMAINE: предоставляет естественные клипы со словами эмоций и контекстными метками. в нескольких модальностях
База данных Белфаста: предоставляет клипы с широким диапазоном эмоций из телепрограмм и записей интервью
SEMAINE: предоставляет аудиовизуальные записи между человеком и виртуальным агентом и содержит аннотации эмоций, такие как гнев, счастье, страх, отвращение, грусть, презрение и веселье
IEMOCAP: обеспечивает записи диадических сеансов между актерами и содержит эмоции аннотации, такие как счастье, гнев, печаль, разочарование и нейтральное состояние
eNTERFACE: предоставляет аудиовизуальные записи субъектов семи национальностей и содержит аннотации эмоций, такие как счастье, гнев, печаль, удивление, отвращение и страх
DEAP: обеспечивает e лектроэнцефалография (ЭЭГ ), электрокардиография (ЭКГ ) и видеозаписи лиц, а также аннотации эмоций с точки зрения валентность, возбуждение и людей, просматривающих отрывки из фильмов
DREAMER: обеспечивает электроэнцефалографию (ЭЭГ ) и записи электрокардиографии (ЭКГ ), а также эмоции аннотации с точки зрения валентности, возбуждения и людей, наблюдающих отрывки из фильма
MELD: это набор данных для многостороннего разговора, где каждое высказывание помечено эмоциями и настроениями. MELD обеспечивает диалоги в видеоформате и, следовательно, подходит для мультимодального распознавания эмоций и анализа настроений. MELD полезен для мультимодального анализа настроений и распознавания эмоций, диалоговых систем и распознавания эмоций в разговорах.

Приложения

Эмоции признание используется в обществе по разным причинам. Affectiva, созданная на базе MIT, предоставляет программное обеспечение искусственного интеллекта, которое позволяет более эффективно выполнять задачи, ранее выполнявшиеся людьми вручную, в основном для определения выражения лица и информация о вокальном выражении, относящаяся к конкретным контекстам, в которых зрители дали согласие на передачу этой информации. Например, вместо того, чтобы заполнять длинный опрос о том, как вы себя чувствуете в каждый момент просмотра образовательного видео или рекламы, вы можете дать согласие на то, чтобы камера смотрела на ваше лицо и слушала, что вы говорите, и отмечать, во время какой части опыта вы показывать такие выражения, как скука, интерес, замешательство или улыбка. (Обратите внимание, что это не означает, что он читает ваши самые сокровенные чувства - он только читает то, что вы выражаете внешне.) Другие применения Affectiva включают помощь детям с аутизмом, помощь слепым людям в чтении выражений лиц, помогая роботам более разумно взаимодействовать с людьми и отслеживая признаки внимания во время вождения, чтобы повысить безопасность водителя.

A патент, поданный Snapchat в 2015 году, описывает метод извлечения данных о толпе в публичные мероприятия, выполняя алгоритмическое распознавание эмоций для пользователей с геотегами селфи.

Emotient была стартапом, которая применила распознавание эмоций к чтению хмурых взглядов, улыбок и других выражений лиц, а именно искусственных интеллекта для прогнозирования «отношения и действий на основе выражения лица». Apple купила Emotient в 2016 году и использует технологию распознавания эмоций для повышения эмоционального интеллекта своих продуктов.

nViso предоставляет реальные -время распознавания эмоций для веб-приложений и мобильных приложений через API в реальном времени. Visage Technologies AB предлагает оценку эмоций как часть своего Visage SDK для маркетинга и научные исследования и аналогичные цели.

Eyeris - компания по распознаванию эмоций, которая работает с производителями встроенных систем, включая автопроизводителей и компании социальных роботов, над интеграцией своего программного обеспечения для анализа лиц и распознавания эмоций; а также с создателями видеоконтента, чтобы помочь им измерить воспринимаемую эффективность их коротких и длинных видеообъявлений.

Существует множество продуктов для сбора информации об эмоциях, передаваемых в Интернете, в том числе с помощью нажатия кнопки «Нравится» и с помощью подсчет положительных и отрицательных фраз в тексте и распознавание аффектов все чаще используется в некоторых играх и виртуальной реальности, как в образовательных целях, так и для того, чтобы дать игрокам более естественный контроль над своими социальными аватарами.

Подполя распознавания эмоций

Распознавание эмоций, вероятно, даст лучший результат, если применить несколько модальностей путем объединения различных объектов, включая текст (разговор), аудио, видео и физиологию для обнаружения эмоций.

Распознавание эмоций в тексте

Текстовые данные являются благоприятным объектом исследования для распознавания эмоций, когда они бесплатны и доступны повсюду в жизни человека. По сравнению с другими типами данных, текстовые данные хранятся легче и их легко сжать до максимальной производительности из-за частого повторения слов и символов на языках. Эмоции могут быть извлечены из двух основных текстовых форм: письменных текстов и разговоров (диалогов). Что касается письменных текстов, многие ученые сосредотачиваются на работе с уровнем предложения, чтобы выделить «слова / фразы», представляющие эмоции.

Распознавание эмоций в аудио

В отличие от распознавания эмоций в тексте, голосовые сигналы используются для распознавание для извлечения эмоций из звука.

Распознавание эмоций в видео

Видеоданные - это комбинация аудиоданных, данных изображения и иногда текстов (в случае субтитров ).

Распознавание эмоций в разговоре

Распознавание эмоций в разговоре (ERC) извлекает мнения между участниками из массивных разговорных данных на социальных платформах, таких как Facebook, Twitter, YouTube и другие. ERC может принимать входные данные, такие как текст, аудио, видео или комбинированную форму, для обнаружения нескольких эмоций, таких как страх, похоть, боль и удовольствие.

См. Также

Ссылки