TIDES - амбициозный усилия по развитию технологий, финансируемые DARPA. Это означает Translingual Information Detection, Extraction and Summarization . Он ориентирован на автоматическую обработку и понимание разнообразных данных на человеческом языке. Основная цель - дать возможность носителям английского языка быстро и эффективно находить и интерпретировать необходимую информацию независимо от языка или носителя.
Для обеспечения этих общих возможностей, TIDES предназначен для разработки набора надежных, мощных и широко полезных компонентов; эффективно интегрировать эти компоненты в системы демонстрации технологий; и экспериментируйте с системами на реальных проблемах. Все эти исследования связаны с высоким риском.
Четыре возможности компонента:
Обнаружение, извлечение и обобщение должны работать в пределах одного языка (одноязычно) и между языками (транслингвально), чтобы помочь людям, говорящим только на английском.
Помимо создания эффективных технологий, TIDES стремится разработать методы для быстрого и недорогого переноса этих возможностей на другие языки, включая языки с сильно ограниченными лингвистическими ресурсами.
TIDES будет интегрировать свои компоненты друг с другом и с другими технологиями для создания синергетических, эффективных, сквозных демонстрационных систем, способных работать с множеством реальных приложений.
В Хранилище данных расследований ФБР находится «Библиотека новостей с открытым исходным кодом». В этой библиотеке собраны новости, собранные программой TIDES. Информация собирается с десятков общедоступных веб-сайтов по всему миру, таких как «Гаарец», «Правда», «Джордан Таймс», «The People's Daily», «Вашингтон пост» и других. Он использует систему MiTAP (Mitre Text and Audio Processing).