Arnetminer

редактировать

ArnetMiner (также AMiner) - это бесплатный онлайн-сервис, используемый для индексации, поиска и добычи больших научных данных.

Содержание
  • 1 Обзор
  • 2 Работа
  • 3 История
  • 4 Ресурсы
  • 5 См. Также
  • 6 Ссылки
  • 7 Внешние ссылки
  • 8 Дополнительная литература
Обзор

ArnetMiner (AMiner) предназначен для поиска и выполнения операций интеллектуального анализа данных в отношении научных публикаций в Интернете с использованием анализа социальных сетей для выявления связей между исследователями, конференциями и публикациями. Это позволяет ему предоставлять такие услуги, как поиск экспертов, географический поиск, анализ тенденций, рекомендации рецензентов, поиск ассоциаций, поиск курсов, оценка успеваемости и моделирование тем.

ArnetMiner был создан как исследовательский проект по анализу социального влияния, ранжированию в социальных сетях и извлечению из социальных сетей. По результатам разработки системы был опубликован ряд рецензируемых статей. Он действует более трех лет и проиндексировал 130 000 000 исследователей и более 200 миллионов публикаций. Исследование финансировалось Китайской национальной программой исследований и разработок в области высоких технологий и фондом.

ArnetMiner обычно используется в академических кругах для определения взаимосвязей и статистических корреляций между исследованиями и исследователями. Он привлек более 10 миллионов независимых IP-доступов из 220 стран и регионов. Продукт использовался на платформе SciVerse Elsevier и на научных конференциях, таких как SIGKDD, ICDM, PKDD, WSDM.

Операция

ArnetMiner автоматически извлекает профиль исследователя из Интернета. Он собирает и идентифицирует соответствующие страницы, а затем использует единый подход для извлечения данных из идентифицированных документов. Он также извлекает публикации из электронных электронных библиотек с помощью эвристических правил.

Он объединяет извлеченные профили исследователей и извлеченные публикации. В качестве идентификатора используется имя исследователя. Была предложена вероятностная структура для решения проблемы неоднозначности имени при интеграции. Интегрированные данные хранятся в базе знаний исследовательской сети (RNKB).

Другими основными продуктами в этой области являются Google Scholar, Elsevier's Scirus и проект с открытым исходным кодом CiteSeer.

История

Он был инициирован и создан профессором Цзе Тан из Университета Цинхуа, Китай. Впервые он был запущен в марте 2006 г. Ниже приводится список обновлений за последние годы:

  • март 2006 г., версия 0.1. Функции включают профилирование исследователя, поиск экспертов, поиск по конференциям и поиск публикаций. Система была разработана на Perl;
  • август 2006 г., версия 1.0, система была повторно реализована на Java;
  • июль 2007 г., версия 2.0, новые функции включают анализ интересов исследователей, поиск ассоциаций, поиск исследовательской бумаги (сейчас недоступен);
  • апрель 2008 г., версия 3.0, новые функции включают понимание запросов, новый графический интерфейс и анализ журнала поиска;
  • ноябрь 2008 г., версия 4.0, Новые функции включают поиск в графах, моделирование тем, извлечение информации о финансировании NSF / NSFC;
  • апрель 2009 г., версия 5.0, новые функции включают редакцию профиля, открытый сервис API, поиск по Bole, поиск по курсам (сейчас недоступно);
  • декабрь 2009 г., версия 6.0, новые функции включают оценку академической успеваемости, отзывы пользователей, анализ конференций;
  • май 2010 г., версия 7.0, новые функции включают устранение неоднозначности имени, рекомендацию рецензента статьи, создание ArnetPage ;
  • Март 2012 г., версия II, переименованная в AMiner, переписала все коды и переработала графический интерфейс. Новые функции включают: географический поиск, платформу ArnetAPP.
  • июнь 2014 г., версия II, переименована в AMiner, переписаны все коды и переработан графический интерфейс. Новые функции включают: географический поиск, платформу ArnetAPP.
  • декабрь 2015 г., в сети появилась совершенно новая версия.
  • май 2017 г., онлайн-версия профессиональной версии.
  • апрель 2018 г., новинка функции включают анализ тенденций, основанный на глубоком обучении устранение неоднозначности имен
Ресурсы

ArnetMiner опубликовал несколько наборов данных для академических исследований, в том числе Open Academic Graph, DBLP + citation (набор данных, дополняющих цитаты в данных DBLP из Проект электронной библиографии и библиотеки ), Устранение неоднозначности имен, Анализ социальных связей. Дополнительные доступные наборы данных и исходные коды для исследований см. В.

См. Также
Ссылки
  1. ^Jie Tang; Цзин Чжан; Лимин Яо; Хуанзи Ли; Ли Чжан; Чжун Су (2008). «ArnetMiner: добыча и майнинг академических социальных сетей». Материалы 14-й Международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных. Нью-Йорк: ACM.
  2. ^«Arnetminer: введение». Проверено 28 мая 2010 г.
  3. ^«SciVerse - HUB - Home». Архивировано из оригинала 9 сентября 2012 г. Получено 24 апреля 2012 г.
  4. ^«Анализ тенденций». Проверено 24 декабря 2018 г.
  5. ^Ютао Чжан; Fanjin Zhang; Пейран Яо; Цзе Тан (2018). «Устранение неоднозначности имени в AMiner: кластеризация, обслуживание и человек в цикле». Материалы 24-й Международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных. Лондон: ACM.
  6. ^"Open Academic Graph". Проверено 24 декабря 2018 г.
  7. ^«Документы DBLP + связь цитирования». Проверено 24 декабря 2018 г.
  8. ^«Устранение неоднозначности имени». Проверено 24 апреля 2012 г.
  9. ^«Вывод социальных связей в больших сетях». Проверено 24 апреля 2012 г.
  10. ^«Открытые данные и коды от ArnetMiner». Проверено 24 апреля 2012 г.
Внешние ссылки
Дополнительная литература
  • Цзе Тан, Цзин Чжан, Лимин Яо, Цзюаньцзи Ли, Ли Чжан, Чжун Су. Arnetminer: добыча и майнинг академических социальных сетей. В материалах 14-й международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных (SIGKDD'2008)
  • Чи Ван, Цзявэй Хан, Юньтао Цзя, Цзе Тан, Дуэт Чжан, Иньтао Ю и Цзинъи Го. Отношения советника по горному делу-консультант из исследовательских издательских сетей. Материалы шестнадцатой Международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных (SIGKDD'2010).
  • Цзе Тан, Цзимэн Сунь, Чи Ван и Цзы Ян. Анализ социального влияния в крупномасштабных сетях. В материалах пятнадцатой Международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных (SIGKDD'2009). С. 807–816.
  • Цзе Тан, Жуомин Цзинь и Цзин Чжан. Подход тематического моделирования и его интеграция в структуру случайного блуждания для академического поиска. В материалах Международной конференции IEEE 2008 г. по интеллектуальному анализу данных (ICDM'2008). С. 1055–1060.
  • Цзе Тан, Лиминь Яо, Дуо Чжан и Цзин Чжан. Комбинированный подход к профилированию веб-пользователей. Транзакции ACM по обнаружению знаний из данных (TKDD), (том 5, № 1), статья 2 (декабрь 2010 г.), 44 страницы.
  • Ютао Чжан, Фаньцзинь Чжан, Пейран Яо и Цзе Тан. Устранение неоднозначности имен в AMiner: кластеризация, обслуживание и человек в петле. В материалах Двадцать четвертой Международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных (KDD'18). pp. 1002-1011.
Последняя правка сделана 2021-06-11 19:36:08
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте