Apache HBase

редактировать

Apache HBase
Apache HBase Logo.svg
Разработчик (и) Apache Software Foundation
Первоначальный выпуск28 марта 2008 г.; 12 лет назад (2008-03-28)
Стабильный выпуск
1.4.x1.4.13 / 29 февраля 2020 г.; 7 месяцев назад (29.02.2020)
1.6.x1.6.0 / 6 марта 2020 г.; 7 месяцев назад (2020-03-06)
2.2.x2.2.6 / 4 сентября 2020 г.; 45 дней назад (04.09.2020)
Предварительная версия 2.3.2 / 25 сентября 2020 г.; 24 дня назад (2020-09-25)
Репозиторий HBase Repository
Написано наJava
Операционная система Кросс-платформенная
Тип Распределенная база данных
Лицензия Лицензия Apache 2.0
Веб-сайтhbase.apache.org

HBase является открытым источником нереляционным распределенная база данных, созданная по образцу Google Bigtable и написанная на Java. Он разработан как часть проекта Apache Software Foundation Apache Hadoop и работает поверх HDFS (распределенная файловая система Hadoop) или Alluxio, предоставляя возможности, подобные Bigtable, для Hadoop. То есть, он обеспечивает отказоустойчивый способ хранения больших объемов разреженных данных (небольшие объемы информации, попавшие в большой набор пустых или неважных данных, например, поиск 50 самые большие элементы в группе из 2 миллиардов записей или поиск ненулевых элементов, составляющих менее 0,1% огромной коллекции).

HBase поддерживает сжатие, работу в памяти и фильтры Блума для каждого столбца, как указано в исходной статье Bigtable. Таблицы в HBase могут служить входом и выходом для заданий MapReduce, выполняемых в Hadoop, и к ним можно получить доступ через API Java, а также через REST, Avro или Thrift API шлюза. HBase - это хранилище данных типа "ключ-значение", ориентированное на столбцы и получившее широкое распространение из-за его происхождения от Hadoop и HDFS. HBase работает поверх HDFS и хорошо подходит для более быстрых операций чтения и записи в больших наборах данных с высокой пропускной способностью и низкой задержкой ввода / вывода.

HBase не является прямой заменой классической базы данных SQL , однако проект Apache Phoenix предоставляет уровень SQL для HBase, а также Драйвер JDBC, который можно интегрировать с различными приложениями Analytics и Business Intelligence. Проект Apache Trafodion предоставляет механизм запросов SQL с драйверами ODBC и JDBC и распределенную защиту транзакций ACID для нескольких операторов, таблиц и строк которые используют HBase в качестве механизма хранения.

HBase в настоящее время обслуживает несколько веб-сайтов, управляемых данными, но платформа обмена сообщениями Facebook недавно перешла с HBase на MyRocks. В отличие от реляционных и традиционных баз данных, HBase не поддерживает сценарии SQL; вместо этого эквивалент написан на Java, используя сходство с приложением MapReduce.

Говоря языком Эрика Брюера теорема CAP, HBase - это система типов CP.

Содержание
  • 1 История
  • 2 Примеры использования и производственные развертывания
    • 2.1 Предприятия, использующие HBase
  • 3 См. Также
  • 4 Ссылки
  • 5 Библиография
  • 6 Внешние ссылки
История

Apache HBase зародился как проект компании Powerset из-за необходимости обрабатывать большие объемы данных для целей поиска на естественном языке. Теперь это проект Apache верхнего уровня.

Facebook решил внедрить свою новую платформу обмена сообщениями с использованием HBase в ноябре 2010 года, но в 2018 году перешел с HBase.

Серия 2.2.z является текущей стабильной линией выпуска, она заменяет предыдущую версию линий.

Примеры использования и производственные развертывания

Предприятия, использующие HBase

Ниже приведен список известных предприятий, которые использовали или используют HBase:

  • 23andMe
  • Adobe
  • Airbnb использует HBase как часть своей структуры потоковых вычислений в реальном времени AirStream
  • Alibaba Group
  • Amadeus IT Group в качестве своей основной БД долгосрочного хранения.
  • Bloomberg, для хранения данных временных рядов
  • Facebook использовал HBase для своей платформы обмена сообщениями с 2010 по 2018 гг.
  • Flipkart использовал HBase для своего поискового индекса и пользовательской информации.
  • Flurry
  • HubSpot
  • Imgur использует HBase для работы своей системы уведомлений
  • Kakao
  • Meesho
  • Netflix
  • Pinterest
  • Quicken Loans
  • Richrelevance
  • Rocket Fuel
  • Salesforce.com
  • Sears
  • Sophos для некоторых своих внутренних систем.
  • Spotify использует HBase в качестве основы для Hadoop и задач машинного обучения.
  • Tuenti использует HBase для своей платформы обмена сообщениями.
  • Xiaomi
  • Yahoo!
См. Также
  • Бесплатное программное обеспечение с открытым исходным кодом портал
  • icon Портал компьютерного программирования
Ссылки
Библиография
Внешние ссылки
Последняя правка сделана 2021-06-11 20:10:29
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте