Разработчик (и) | Apache Software Foundation | ||||||
---|---|---|---|---|---|---|---|
Первоначальный выпуск | 28 марта 2008 г.; 12 лет назад (2008-03-28) | ||||||
Стабильный выпуск |
| ||||||
Предварительная версия | 2.3.2 / 25 сентября 2020 г.; 24 дня назад (2020-09-25) | ||||||
Репозиторий | HBase Repository | ||||||
Написано на | Java | ||||||
Операционная система | Кросс-платформенная | ||||||
Тип | Распределенная база данных | ||||||
Лицензия | Лицензия Apache 2.0 | ||||||
Веб-сайт | hbase.apache.org |
HBase является открытым источником нереляционным распределенная база данных, созданная по образцу Google Bigtable и написанная на Java. Он разработан как часть проекта Apache Software Foundation Apache Hadoop и работает поверх HDFS (распределенная файловая система Hadoop) или Alluxio, предоставляя возможности, подобные Bigtable, для Hadoop. То есть, он обеспечивает отказоустойчивый способ хранения больших объемов разреженных данных (небольшие объемы информации, попавшие в большой набор пустых или неважных данных, например, поиск 50 самые большие элементы в группе из 2 миллиардов записей или поиск ненулевых элементов, составляющих менее 0,1% огромной коллекции).
HBase поддерживает сжатие, работу в памяти и фильтры Блума для каждого столбца, как указано в исходной статье Bigtable. Таблицы в HBase могут служить входом и выходом для заданий MapReduce, выполняемых в Hadoop, и к ним можно получить доступ через API Java, а также через REST, Avro или Thrift API шлюза. HBase - это хранилище данных типа "ключ-значение", ориентированное на столбцы и получившее широкое распространение из-за его происхождения от Hadoop и HDFS. HBase работает поверх HDFS и хорошо подходит для более быстрых операций чтения и записи в больших наборах данных с высокой пропускной способностью и низкой задержкой ввода / вывода.
HBase не является прямой заменой классической базы данных SQL , однако проект Apache Phoenix предоставляет уровень SQL для HBase, а также Драйвер JDBC, который можно интегрировать с различными приложениями Analytics и Business Intelligence. Проект Apache Trafodion предоставляет механизм запросов SQL с драйверами ODBC и JDBC и распределенную защиту транзакций ACID для нескольких операторов, таблиц и строк которые используют HBase в качестве механизма хранения.
HBase в настоящее время обслуживает несколько веб-сайтов, управляемых данными, но платформа обмена сообщениями Facebook недавно перешла с HBase на MyRocks. В отличие от реляционных и традиционных баз данных, HBase не поддерживает сценарии SQL; вместо этого эквивалент написан на Java, используя сходство с приложением MapReduce.
Говоря языком Эрика Брюера теорема CAP, HBase - это система типов CP.
Apache HBase зародился как проект компании Powerset из-за необходимости обрабатывать большие объемы данных для целей поиска на естественном языке. Теперь это проект Apache верхнего уровня.
Facebook решил внедрить свою новую платформу обмена сообщениями с использованием HBase в ноябре 2010 года, но в 2018 году перешел с HBase.
Серия 2.2.z является текущей стабильной линией выпуска, она заменяет предыдущую версию линий.
Ниже приведен список известных предприятий, которые использовали или используют HBase: