Академики | |
---|---|
Дисциплины: | Обработка естественного языка. Вычислительная лингвистика. Семантика |
Umbrella. Организация: | ACL-SIGLEX hhdgdhc |
Обзор семинара | |
Год основания: | 1998 (Senseval ) |
Последний раз: | SemEval-2015. NAACL @ Денвер, США |
Ожидается: | SemEval-2018 |
History | |
Senseval-1 | 1998 @ Sussex |
Senseval-2 | 2001 @ Toulouse |
Senseval -3 | 2004 @ Barcelona |
SemEval-2007 | 2007 @ Prague |
SemEval-2010 | 2010 @ Uppsala |
SemEval-2012 | 2012 @ Montreal |
SemEval-2013 | 2013 @ Atlanta |
SemEval-2014 | 2014 @ Dublin |
SemEval-2015 | 2015 @ Denver |
SemEval-2016 | 2016 @ San Diego |
SemEval (Sem antic Eval uation) - это непрерывная серия оценок систем вычислительного семантического анализа ; она произошла от Sensevalсмысл слова серия оценок. Оценки предназначены для изучать природу значения в языке. Хотя смысл интуитивно понятен людям, перенос этой интуиции в вычислительный анализ оказался труднодостижимым.
Эта серия оценок предоставляет механизм для более точной характеристики того, что необходимо вычислить по значению. Таким образом, оценки обеспечивают возникающий механизм для выявления проблем и решений для вычислений со смыслом. Эти упражнения эволюционировали, чтобы сформулировать больше аспектов, которые участвуют в нашем использовании языка. Они начали с очевидных простых попыток идентифицировать значения слов с помощью вычислений. Они были разработаны для исследования взаимосвязей между элементами в предложении (например, обозначение семантической роли ), отношений между предложениями (например, кореференция ) и характера того, что мы говорим. (и анализ тональности ).
Целью упражнений SemEval и Senseval является оценка систем семантического анализа. «Семантический анализ » относится к формальному анализу значения, а «вычислительный» относится к подходам, которые в принципе поддерживают эффективную реализацию.
Первые три оценки, от Senseval-1 до Senseval-3, были сосредоточены на устранении неоднозначности слов (WSD), каждый раз увеличивая количество языков, предлагаемых в задачах, и количество участвующих команд. Начиная с четвертого семинара, SemEval-2007 (SemEval-1), характер задач расширился и теперь включает в себя задачи семантического анализа, выходящие за рамки устранения неоднозначности слов.
Инициируемые концепцией, сообщество SemEval решило проводить семинары по оценке ежегодно в связи с конференцией * SEM. Также было принято решение, что не все задачи по оценке будут выполняться каждый год, например ни одна из задач WSD не была включена в семинар SemEval-2012.
С самых ранних дней, оценка Качество алгоритмов устранения неоднозначности смысла слов было в первую очередь вопросом внутренней оценки, и «почти не было предпринято попыток оценить встроенные компоненты WSD». Лишь совсем недавно внешние оценки начали предоставлять некоторые свидетельства ценности WSD для приложений конечных пользователей. Примерно до 1990 года обсуждения задачи устранения неоднозначности были сосредоточены в основном на иллюстративных примерах, а не на всеобъемлющей оценке. В начале 1990-х годов были начаты более систематические и строгие внутренние оценки, включая более формальные эксперименты с небольшими наборами неоднозначных слов.
В апреле 1997 года Марта Палмер и Марк Лайт организовали семинар "Тэги с помощью лексической семантики: почему, что и как?" совместно с Конференцией по прикладной обработке естественного языка. В то время было очевидное признание того, что вручную аннотированный корпус корпус произвел революцию в других областях НЛП, таких как тегирование части речи и синтаксический анализ, и что основанные на корпусе подходы также могут произвести революцию в автоматическом семантическом анализе. Килгаррифф напомнил, что существует «высокая степень согласия в отношении того, что область нуждается в оценке», и несколько практических предложений Резника и Яровски положили начало дискуссии, которая привела к созданию оценочных упражнений Senseval.
После SemEval-2010 многие участники считают, что трехлетний цикл - это долгое ожидание. Многие другие общие задачи, такие как (CoNLL) и (RTE), выполняются ежегодно. По этой причине координаторы SemEval дали возможность организаторам задач выбирать между двухлетним или трехлетним циклом. Сообщество SemEval отдавало предпочтение трехлетнему циклу.. Хотя голосование в сообществе SemEval отдавало предпочтение трехлетнему циклу, организаторы и координаторы решили разделить задачу SemEval на 2 семинара по оценке. Это было вызвано появлением нового. Организаторы SemEval сочли целесообразным связать наше мероприятие с конференцией * SEM и совместить семинар SemEval с конференцией * SEM. Организаторы получили очень положительные отзывы (от координаторов задач / организаторов и участников) об ассоциации с ежегодным * SEM, и 8 задач были готовы перейти на 2012 год. Так родились СемЭвал-2012 и СемЭвал-2013. Текущий план состоит в том, чтобы переключиться на ежегодное расписание SemEval, чтобы связать его с конференцией * SEM, но не все задачи должны выполняться каждый год.
Структура семинаров по оценке SemEval / Senseval имитирует конференции по пониманию сообщений (MUC) и другие семинары по оценке, проводимые ARPA (Агентство перспективных исследовательских проектов, переименованное в Агентство перспективных оборонных исследовательских проектов (DARPA) ).
Этапы семинаров по оценке SemEval / Senseval
Senseval-1 и Senseval-2 сосредоточены на оценке систем WSD на основных языках, для которых были доступны корпус и компьютеризированный словарь. Senseval-3 вышла за рамки лексем и начала оценивать системы, которые изучали более широкие области семантики, такие как семантические роли (технически известные как тета-роли в формальной семантике), Логическая форма Преобразование (обычно семантика фраз, предложений или предложений была представлена в логических формах первого порядка ) и Senseval-3 исследовали возможности семантического анализа на Машинный перевод.
В качестве типы различных вычислительных семантических систем вышли за рамки WSD, Senseval превратился в SemEval, где оценивались другие аспекты вычислительных семантических систем.
Упражнения SemEval предоставляют механизм для изучения проблем семантического анализа текстов. Интересующие темы не соответствуют логической строгости, присущей формальной вычислительной семантике, пытающейся идентифицировать и охарактеризовать виды проблем, относящихся к человеческому пониманию языка. Основная цель - воспроизвести обработку человека с помощью компьютерных систем. Задачи (показанные ниже) разрабатываются отдельными лицами и группами для решения идентифицируемых проблем, поскольку они принимают конкретную форму.
Первой важной областью семантического анализа является определение предполагаемого значения на уровне слова (включая идиоматические выражения). Это устранение неоднозначности смысла слова (концепция, которая эволюционирует от представления о том, что слова имеют дискретные значения, а скорее характеризуются способами их использования, то есть их контекстами). Задачи в этой области включают лексический образец и устранение неоднозначности во всех словах, устранение многоязычной и межъязыковой неоднозначности и лексическую замену. Учитывая трудности определения значений слов, другие задачи, относящиеся к этой теме, включают в себя наведение смысла слов, получение подкатегорий и оценку лексических ресурсов.
Вторая важная область семантического анализа - это понимание того, как различные предложения и текстовые элементы сочетаются друг с другом. Задачи в этой области включают обозначение семантических ролей, анализ семантических отношений и разрешение кореферентности. Другие задачи в этой области относятся к более специализированным вопросам семантического анализа, таким как обработка временной информации, разрешение метонимии и анализ тональности. Задачи в этой области имеют множество потенциальных приложений, таких как извлечение информации, ответы на вопросы, обобщение документов, машинный перевод, построение тезаурусов и семантических сетей, языковое моделирование, перефразирование и распознавание текстового следования. В каждом из этих потенциальных приложений вклад типов семантического анализа представляет собой наиболее важную исследовательскую проблему.
Например, в задаче индукции смысла слов и устранения неоднозначности есть три отдельных этапа:
При неконтролируемой оценке WSI учитывались два типа оценки (Rosenberg and Hirschberg, 2007) и (Artiles et al., 2009). Эта оценка проводится после контролируемой оценки задачи SemEval-2007 WSI (Agirre and Soroa, 2007)
Приведенные ниже таблицы отражают рост семинара с Senseval для SemEval и дает обзор того, какая область вычислительной семантики оценивалась на семинарах Senseval / SemEval.
Мастерская | No. задач | Области изучения | Языки оцениваемых данных |
---|---|---|---|
Senseval-1 | 3 | Устранение неоднозначности слов (WSD) - лексический образец Задачи WSD | Английский, французский, Итальянский |
Senseval-2 | 12 | Устранение неоднозначности слов (WSD) - лексический образец, все слова, перевод Задачи WSD | Чешский, голландский, английский, эстонский, баскский, китайский, датский, английский, итальянский, Японский, корейский, испанский, шведский |
Senseval-3 | 16. (включая 2 отмененных) | Преобразование логической формы, оценка машинного перевода (MT), маркировка семантических ролей, WSD | Баскский, каталонский, китайский, английский, итальянский, румынский, испанский |
SemEval2007 | 19. (включая 1 отменен) | Межъязычный, извлечение фреймов, извлечение информации, лексическая подстановка, лексическая выборка, метонимия, семантическая аннотация, семантические отношения, маркировка семантических ролей, анализ тональности, выражение времени, WSD | арабский, каталонский, китайский, английский, испанский, турецкий |
SemEval2010 | 18. (включая 1 отменено) | Coreference, Cross-lingual, Ellipsis, Extraction, Лексическая подстановка, метонимия, соединения существительных, синтаксический анализ, семантические отношения, обозначение семантических ролей, анализ тональности, текстовое преобразование, выражения времени, WSD | каталонский, китайский, голландский, английский, французский, немецкий, итальянский, японский, Испанский |
SemEval2012 | 8 | здравый смысл, лексическое упрощение, реляционное сходство, пространственное обозначение ролей, анализ семантических зависимостей, семантическое и текстовое сходство | китайский, английский |
SemEval2013 | 14 | временная аннотация, тональность Анализ, пространственное обозначение ролей, соединения существительных, фразовая семантика, текс фактическое сходство, анализ ответов, кросс-язычный текст, биомедицинские тексты, кросс- и многоязычный WSD, индукция смысла слов и лексический образец | каталонский, французский, немецкий, английский, итальянский, испанский |
SemEval2014 | 10 | Композиционно-распределительная семантика, грамматическая индукция для речевых диалоговых систем, межуровневое семантическое сходство, анализ тональности, помощник по написанию L2, контролируемый семантический анализ, клинический анализ текста, анализ семантических зависимостей, анализ тональности в Twitter, многоязычное семантическое текстовое сходство | английский, испанский, французский, немецкий, голландский, |
SemEval2015 | 18. (вкл. 1 отменено) | Сходство текста и ответы на вопросы, время и пространство, тональность, устранение неоднозначности и индукция смыслового значения, изучение семантических отношений | английский, испанский, арабский, итальянский |
SemEval2016 | 14 | Сходство текста и ответы на вопросы, анализ тональности, семантический анализ, семантический анализ, семантическая таксономия | |
SemEval2017 | 12 | Семантическое сравнение слов и текстов, определение настроения, юмора и истины и анализ семантических структур | |
SemEval2018 | 12 | Affect и творческий язык в твитах, Coreference, извлечение информации, лексическая семантика и понимание прочитанного и рассуждение |
Задача Multilingual WSD была представлена на семинаре SemEval-2013. Задача направлена на оценку систем устранения неоднозначности слов в многоязычном сценарии с использованием BabelNet в качестве своего смыслового инвентаря. В отличие от аналогичной задачи, такой как межъязычный WSD или задача многоязычной лексической замены, где не указан фиксированный реестр смысла, Multilingual WSD использует BabelNet в качестве своего смыслового инвентаря. До разработки BabelNet задача оценки двуязычного лексического образца WSD выполнялась в SemEval-2007 на китайско-английских битекстах.
Межъязыковая задача WSD была представлена в SemEval -2007 семинар по оценке и повторно предложен на семинаре SemEval-2013. Чтобы упростить интеграцию систем WSD в другие приложения обработки естественного языка (NLP), такие как машинный перевод и многоязычный поиск информации, была введена межъязыковая задача оценки WSD. -независимый и основанный на знаниях подход к WSD. Задача представляет собой неконтролируемое задание на устранение неоднозначности слов для английских существительных с помощью параллельных корпусов. Он следует за лексическим образцом классической задачи WSD, ограниченным только 20 многозначными существительными.
Стоит отметить, что на SemEval-2014 есть только две задачи, которые были многоязычными / межъязыковыми, то есть (i) задача L2 Writing Assistant, которая представляет собой межъязыковую задачу WSD, которая включает английский, Испанский, немецкий, французский и голландский и (ii) задание Многоязычное семантическое текстовое сходство, которое оценивает системы на английском и испанском языках.
Основные задачи семантической оценки включают следующие области обработки естественного языка. Ожидается, что этот список будет расти по мере развития области.
В следующей таблице показаны области исследований, которые были задействованы в Senseval-1 - SemEval-2014 (S относится к Senseval, а SE относится к SemEval, например, S1 относится к к Senseval-1, а SE07 относится к SemEval2007):
Области изучения | S1 | S2 | S3 | SE07 | SE10 | SE12 | SE13 | SE14 | SE15 | SE16 | SE17 |
---|---|---|---|---|---|---|---|---|---|---|---|
Биоинфоматика / клинический анализ текста | |||||||||||
Обоснование здравого смысла () | |||||||||||
Coreference Разрешение | |||||||||||
Составные слова (Извлечение информации ) | |||||||||||
Многоточие | |||||||||||
Грамматическая индукция | |||||||||||
Извлечение ключевой фразы (Извлечение информации ) | |||||||||||
Лексическое упрощение | |||||||||||
Лексическая замена (многоязычная или кросслингвальная) | |||||||||||
Лексическая Сложность | |||||||||||
Метонимия (Извлечение информации ) | |||||||||||
Перефразирование | |||||||||||
Ответ на вопрос | |||||||||||
Слухи и достоверность | |||||||||||
Семантическая маркировка ролей | |||||||||||
(межъязыковая) | |||||||||||
(многоязычная) | |||||||||||
Анализ тональности | |||||||||||
Введение / обогащение таксономии | |||||||||||
Временная аннотация | |||||||||||
Tw itter Analysis | |||||||||||
Устранение неоднозначности в словах (Лексический образец ) | |||||||||||
Устранение неоднозначности в словах (All-Words ) | |||||||||||
Устранение неоднозначности в словах (Многоязычный) | |||||||||||
Устранение неоднозначности в словах (кросс-языковые) | |||||||||||
Индукция смысла слова |
Задачи SemEval создали много типов семантических аннотаций, каждый тип с различной схемой. В SemEval-2015 организаторы решили сгруппировать задачи в несколько треков. Эти треки относятся к тому типу семантических аннотаций, на которые рассчитана задача. Здесь перечислены типы семантических аннотаций, используемых на семинарах SemEval:
Задача и распределение ее дорожек являются гибкими; задача может развиться в отдельный путь, например задача оценки таксономии в SemEval-2015 находилась в треке Learning Semantic Relations, а в SemEval-2016 есть специальный трек для Semantic Taxonomy с новой задачей Semantic Taxonomy Enrichment.