Программа DARPA TIDES

редактировать

TIDES - амбициозный усилия по развитию технологий, финансируемые DARPA. Это означает Translingual Information Detection, Extraction and Summarization . Он ориентирован на автоматическую обработку и понимание разнообразных данных на человеческом языке. Основная цель - дать возможность носителям английского языка быстро и эффективно находить и интерпретировать необходимую информацию независимо от языка или носителя.

Содержание
  • 1 Обзор
  • 2 Хранилище данных расследований
  • 3 См. Также
  • 4 Примечания и библиография
  • 5 Внешние ссылки
Обзор

Для обеспечения этих общих возможностей, TIDES предназначен для разработки набора надежных, мощных и широко полезных компонентов; эффективно интегрировать эти компоненты в системы демонстрации технологий; и экспериментируйте с системами на реальных проблемах. Все эти исследования связаны с высоким риском.

Четыре возможности компонента:

  • Обнаружение - Найдите или обнаружите необходимую информацию.
  • Извлечение - Выделите ключевые факты.
  • Обобщение - Уменьшите количество слов, которые кто-то должен прочтите.
  • Перевод - конвертируйте текст с другого языка на английский.

Обнаружение, извлечение и обобщение должны работать в пределах одного языка (одноязычно) и между языками (транслингвально), чтобы помочь людям, говорящим только на английском.

Помимо создания эффективных технологий, TIDES стремится разработать методы для быстрого и недорогого переноса этих возможностей на другие языки, включая языки с сильно ограниченными лингвистическими ресурсами.

TIDES будет интегрировать свои компоненты друг с другом и с другими технологиями для создания синергетических, эффективных, сквозных демонстрационных систем, способных работать с множеством реальных приложений.

Хранилище данных расследований

В Хранилище данных расследований ФБР находится «Библиотека новостей с открытым исходным кодом». В этой библиотеке собраны новости, собранные программой TIDES. Информация собирается с десятков общедоступных веб-сайтов по всему миру, таких как «Гаарец», «Правда», «Джордан Таймс», «The People's Daily», «Вашингтон пост» и других. Он использует систему MiTAP (Mitre Text and Audio Processing).

См. Также
Примечания и библиография
Внешние ссылки
Последняя правка сделана 2021-05-16 08:34:50
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте