SimHash

редактировать

В информатике, SimHash - это метод быстрой оценки схожести двух наборов. алгоритм используется поисковым роботом Google для поиска почти повторяющихся страниц. Он был создан Моисеем Чарикаром.

Содержание
  • 1 Оценка и тесты
  • 2 См. Также
  • 3 Ссылки
  • 4 Внешние ссылки
Оценка и тесты

A В 2006 г. компанией Google была проведена крупномасштабная оценка для сравнения производительности алгоритмов Minhash и Simhash. В 2007 году Google сообщил об использовании Simhash для обнаружения дубликатов при сканировании Интернета и использовании Minhash и LSH для Google News персонализации.

См. Также
Ссылки
Внешние ссылки
Последняя правка сделана 2021-06-08 09:16:13
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте