Амит Шет

редактировать

Амит Шет
Родился	Гуджарат, Индия
Alma mater	Огайо Государственный университет, Институт технологий и науки Бирла
Профессия	Исполнительный директор Kno.e.sis Center
Должность	Профессор в Райт Государственный университет
Веб-сайт	Амит Шет

Амит Шет является специалистом по информатике в Государственном университете Райта в Дейтоне, Огайо. Он является выдающимся ученым Lexis Nexis Ohio в области расширенного управления данными и анализа. До октября 2018 года работы Шета цитировали более 41000 публикаций. У него индекс Хирша, равный 100, что ставит его в число 100 ведущих компьютерных ученых с самым высоким индексом Хирша. До основания он работал директором лаборатории крупномасштабных распределенных информационных систем в Университете Джорджии в Афинах, Джорджия.

Содержание

1 Образование
2 Исследования
- 2.1 Семантическая совместимость / интеграция и семантическая сеть
- 2.2 Управление рабочими процессами и семантические веб-сервисы
- 2.3 Интеграция информации, взаимодействие / интеграция баз данных и федерации баз данных
- 2.4 Более детальная идентификация взаимосвязей на связанные открытые данные
- 2.5 Извлечение информации на основе семантики и знаний / НЛП / машинное обучение, поиск, просмотр и анализ
- 2.6 Масштабируемая аналитика социальных сетей в реальном времени
3 Предпринимательство
4 Награды
5 Ссылки

Образование

Шет получил степень бакалавра инженерных наук в Технологическом и научном институте Бирла по информатике в 1981 году. Он получил степень магистра наук. и к.т.н. по информатике от Государственного университета Огайо в 1983 и 1985 годах соответственно.

Исследования

Семантическая совместимость / интеграция и семантическая сеть

Шет исследовал, продемонстрировал и выступил за всестороннее использование метаданных. Он исследовал синтаксические, структурные и семантические метаданные; недавно он впервые применил основанные на онтологии подходы к извлечению метаданных и семантической аналитике. Он был одним из первых исследователей, использовавших онтологии на основе логики описания для интеграции схем и информации (за десять лет до того, как W3C принял стандарт представления онтологий на основе DL), и он был первым, кто выступил с основным докладом о семантике. Веб-приложения в поиске. Его работа по обработке запросов с несколькими онтологиями включает наиболее цитируемую статью по этой теме (более 930 цитирований). В 1996 году он представил мощную концепцию ссылки на метаданные (MREF) для связывания метаданных с гипертекстом, который связывает документы в Интернете, и описал реализацию на основе RDF в 1998 году, до того, как RDF был принят в качестве рекомендации W3C.. Часть его недавних работ была сосредоточена на извлечении информации из текста для генерации семантических метаданных в форме RDF. В его работе семантические метаданные, извлеченные из биологического текста, состоят из сложных структур знаний (сложных сущностей и отношений), которые отражают сложные взаимодействия в биомедицинских знаниях. Шет предложил реализовать видение MEMEX Ванневара Буша как Сеть отношений, основанную на семантических метаданных, извлеченных из текста. Шет и его соавторы были награждены первым известным патентом на коммерческие приложения семантической паутины для просмотра, поиска, профилирования, персонализации и рекламы, что привело к основанию им первой компании семантического поиска Taalee.

В 1992 году он выступил с влиятельным докладом под названием «До сих пор (схематически), но так близко (семантически)», который свидетельствовал о необходимости предметно-ориентированной семантики, использования онтологического представления для более обширного семантического моделирования / представление знаний и использование контекста при поиске сходства между объектами. Его работа по использованию онтологий для обработки информации охватывала подход к поиску автоматизированных онтологий аргументов для интеграции схем, семантического поиска, других приложений и обработки семантических запросов. Последний включал в себя преобразования запросов с использованием различных онтологий для пользовательских запросов и ресурсов, а также объединенных запросов - концепцию со связанными мерами и методами для вычисления потери информации при просмотре таксономических отношений.

Управление рабочим процессом и семантические веб-сервисы

В начале 1990-х он инициировал исследования в области формального моделирования, планирования и правильности рабочих процессов. Его проект МЕТЕОР продемонстрировал ценность исследований с использованием реальных приложений; его инструменты использовались в аспирантуре в нескольких странах, а его технология была лицензирована для создания коммерческого продукта, а затем разработала METEOR-S. Он руководил исследованием (позже к которому присоединился IBM ), в результате которого W3C представил WSDL-S (семантическую аннотацию WSDL ), основу для SAWSDL, рекомендация W3C для добавления семантики в WSDL и XML-схему.

как для SAWSDL, так и для SA-REST, он обеспечил лидерство в сообществе. на основе процесса, за которым следует W3C. Он был соавтором статьи 1995 года в Журнале распределенных и параллельных баз данных, которая является одной из наиболее цитируемых статей в области литературы по управлению рабочими процессами, с более чем 2330 цитированием, а также самой цитируемой среди более чем 430 статей, опубликованных в этом журнале.. Его ключевые технические аспекты вклада в управление рабочими процессами включают адаптивное управление рабочими процессами, обработку исключений, авторизацию и контроль доступа, безопасность, оптимизацию и качество обслуживания.

Интеграция информации, взаимодействие / интеграция баз данных и объединение баз данных

В 1980-х годах крупные организации хотели объединить несколько автономных баз данных для выполнения определенных задач, но как это можно было сделать с технической точки зрения, не понимали. Начиная с 1987 года Шет провел ряд руководств на ICDE, VLDB, SIGMOD и других крупных конференциях в области управления распределенными (объединенными) данными и разработал научные основы и принципы архитектуры для решения этих проблем взаимодействия баз данных. Он разработал чистую эталонную архитектуру, описанную в его наиболее цитируемой статье о федеративных базах данных. Он предоставляет архитектуру, состоящую из ряда тесно связанных (т. Е. Глобальных как представление) до слабосвязанных (т. Е. Локальных как представление) альтернатив для работы с тремя измерениями: распределением, неоднородностью и автономностью. Позже он руководил разработкой инструмента интеграции схем в США.

Шет проанализировал ограничения, возникающие из-за автономности отдельных баз данных, и работал над глубокой интеграцией, разрабатывая модели спецификаций для зависимостей между базами данных, позволяя ограниченное количество степень связи для обеспечения глобальной согласованности для критически важных приложений. Вместе с Димитриосом Георгакопулосом и Мареком Русинкевичем он разработал метод продажи билетов для управления параллелизмом глобальных транзакций, которые должны видеть и сохранять согласованное состояние в нескольких базах данных. Эта работа, которая была отмечена наградой за лучшую работу на Международной конференции по инженерии данных в 1991 г., получила патент и привела к прогрессу в транзакциях с несколькими базами данных другими исследователями.

Его работа продолжалась в области интеграции и взаимодействия сетевых баз данных на предприятиях с доступом к базам данных через Интернет. Он также помог охарактеризовать метаданные и разработать методы извлечения и использования метаданных для интегрированного доступа к разнообразному контенту, от баз данных до мультимедийных / мультимодальных данных.

Более подробная идентификация взаимосвязей в связанных открытых данных

Шет был ярым сторонником определения более богатого и широкого набора взаимосвязей, таких как мерономия и причинно-следственная связь, в семантической сети. Его идея «сети отношений» вдохновлена видением memex, данным Ванневаром Бушем. С момента создания связанных данных он делал упор на использование знаний схемы и информации, представленной в сети и связанных данных для этой цели. Эти идеи привели к созданию системы под названием BLOOMS для идентификации взаимосвязей на уровне схемы между наборами данных, принадлежащими связанным данным. Другая связанная система, называемая PLATO, позволяла идентифицировать партономическую взаимосвязь между объектами в связанных данных.

Семантика и извлечение информации на основе знаний / НЛП / ML, поиск, просмотр и анализ

В 1993 году он инициировал InfoHarness, систему, которая извлекала метаданные из разнообразного контента (новости, программный код и документы требований) с помощью фасетного поиска в браузере Mozilla. Эта система была преобразована в продукт Bellcore в 1995 году, а вслед за ней последовала поисковая машина на основе метаданных для личного электронного руководства по программам и видео в Интернете для кабельной приставки. Он лицензировал эту технологию, которую разработал в Университете Джорджии для своей компании Taalee в том же году, когда Тим-Бернерс Ли ввел термин семантическая сеть. В первом выступлении по Семантической паутине, сделанном где угодно, Шет представил коммерческую реализацию семантической поисковой машины Taalee, на которую распространяется патент «Система и метод для создания семантической сети и ее приложений для просмотра, поиска, профилирования, персонализации и рекламы».

Это воплощение семантического поиска 1999–2001 гг. (Как описано в патентном документе) началось с обширного инструментария для создания онтологии / модели WorldModel (сегодняшнего графа знаний) для разработки схемы, а затем автоматического извлечения информации (путем извлечения знаний агентов) и включают знания из множества высококачественных источников, чтобы заполнить онтологию и поддерживать ее актуальность. Это включает механизм устранения неоднозначности, позволяющий определить, что нового и что изменилось.

Затем агенты извлечения данных, которые поддерживали разнообразный контент, либо извлекали (сканировали), либо отправляли (например, синдицированные новости в NewsML), вызвали комитет из девяти классификаторов (с использованием байесовских, HMM и основанных на знаниях классификаторов) для определения доменов контента, определения соответствующего подмножества онтологии для использования и выполнения семантической аннотации. «Механизм семантического улучшения: модульная платформа улучшения документов для семантических приложений с гетерогенным контентом» - одна из первых публикаций, демонстрирующих необычную эффективность классификаторов, основанных на знаниях, по сравнению с более традиционными методами машинного обучения. Третий компонент системы использует онтологию и метаданные (аннотации) для поддержки семантического поиска, просмотра, профилирования, персонализации и рекламы.

Эта система также поддерживала динамически генерируемую «Справку по мультимедиа» (также известную как информационное окно Google), которая не только отображала метаданные об искомом объекте, извлеченные из онтологии и метабазы, но также предоставляла то, что было названо «смешанным семантическим просмотром и запрос ". Он также руководил работой в других формах / модальностях данных, включая социальные данные и данные датчиков. Он ввел термин «Semantic Sensor Web», а также инициировал и возглавил усилия W3C по созданию сетей семантических датчиков, результатом которых стал стандарт де-факто. Он представил концепцию семантического восприятия, чтобы отразить процесс преобразования огромных объемов данных IoT в абстракции более высокого уровня для поддержки человеческого познания и восприятия при принятии решений, что включает в себя абдуктивную и дедуктивную структуру рассуждений с поддержкой онтологии IntellegO для итеративного уточнения и проверки гипотез..

Масштабируемая аналитика социальных сетей в реальном времени

В начале 2009 года он инициировал и сформулировал проблему анализа социальных сетей в широком наборе семантических измерений, которые он назвал «пространственно-временным-тематическим» ( СТТ). Он сделал упор на анализе социальных данных с точки зрения людей, содержания, анализа настроений и эмоций. Эта идея привела к созданию системы под названием Twitris, в которой для этой цели используются динамически развивающиеся семантические модели, созданные проектом семантической паутины Doozer. Система Twitris может определять эмоции людей (такие как: радость, печаль, гнев, страх и т. Д.) По их сообщениям в социальных сетях, применяя методы машинного обучения с миллионами самоназванных эмоциональных твитов.

Предпринимательство

Шет основал Infocosm, Inc. в 1997 году, которая лицензировала и коммерциализировала технологию METEOR на основе исследований, которые он возглавлял в Университете Джорджии, в результате чего были разработаны продукты для управления распределенными рабочими процессами, WebWork и ORBWork. Он основал Taalee, Inc. в 1999 году на основе лицензирования технологии VideoAnywhere на основе исследования, которое он возглавлял в Университете Джорджии. Первым продуктом Taalee была система семантического поиска. После слияния в 2002 году Taalee стал Voquette, а в 2004 году - Semagix. В 2016 году была основана Cognovi Labs, основанная на технологии Twirtis в результате исследования, которое он проводил в Центре Kno.e.sis Государственного университета Райта. Эта технология была успешно использована для прогнозирования Брексита и президентских выборов в США в 2016 году.

Награды

Избран научным сотрудником AAAS (выпуск 2018 года) за новаторский и постоянный вклад в интеграцию информации рабочий процесс, семантика и аналитика больших данных на основе знаний.
Избран стипендиатом AAAI (выпуск 2018 г.) за значительный и постоянный вклад в семантику и методы, основанные на знаниях, для преобразования разнообразных данных в идеи
Премия Совета факультетов штата Огайо по коммерциализации технологий (занявшая второе место)
Избрана стипендиатом IEEE (выпуск 2006 г.) за вклад в интеграцию информации и управление рабочими процессами.
Получил награду Trustees за выдающиеся способности преподавателей, высшую награду, присужденную Государственным университетом Райта.
премией IBM Faculty Award 2004.

Ссылки