BeeGFS

редактировать
BeeGFS
BeeGFS-Logo.png
Разработчик (и) ThinkParQ Fraunhofer ITWM,.
Стабильная версия 7.0 / 29 мая 2018 г.
Операционная система GNU / Linux
Тип Распределенная файловая система
Веб-сайтbeegfs.io

BeeGFS (ранее FhGFS) - это параллельная файловая система, разработанная и оптимизированная для высокопроизводительных вычислений. BeeGFS включает распределенную архитектуру метаданных по причинам масштабируемости и гибкости. Самый важный его аспект - это скорость передачи данных.

BeeGFS был первоначально разработан в Fraunhofer Центре высокопроизводительных вычислений в Германии командой Свена Брейнера, который позже стал генеральным директором ThinkParQ (2014-2018 гг.), дочерней компании, которая была основана в 2014 году для поддержки BeeGFS и предоставления профессиональных услуг.

Хотя Community Edition BeeGFS можно загрузить и использовать бесплатно, Enterprise Edition должна использоваться в соответствии с контрактом на профессиональную поддержку.

Содержание
  • 1 История и использование
  • 2 Ключ концепции и функции
    • 2.1 BeeOND (BeeGFS по запросу)
  • 3 Тесты
  • 4 BeeGFS и exascale
  • 5 См. также
  • 6 Ссылки
История и использование

BeeGFS начат в 2005 году как внутренняя разработка в Центре Фраунгофера для HPC для замены существующей файловой системы в новом вычислительном кластере института и для использования в производственной среде.

В 2007 году первая бета-версия программного обеспечения была анонсирована на ISC07 в Дрездене, Германия, и представлена ​​широкой публике на SC07 в Рино, штат Невада. Год спустя стал доступен первый стабильный основной выпуск.

В 2014 году Fraunhofer начал свое отделение, новую компанию под названием ThinkParQ for BeeGFS. В ходе этого процесса FhGFS был переименован в BeeGFS®. ThinkParQ обслуживает программное обеспечение и предлагает профессиональные услуги, а дальнейшая разработка функций будет продолжена в сотрудничестве с ThinkParQ и Fraunhofer.

Поскольку BeeGFS является бесплатной, неизвестно, сколько сейчас активных установок. Однако в 2014 году уже около 100 клиентов по всему миру использовали BeeGFS при коммерческой поддержке ThinkParQ и Fraunhofer. Среди них - академические пользователи, такие как университеты и исследовательские центры, а также коммерческие компании в таких областях, как финансы или нефтегазовая промышленность.

Известные установки включают несколько компьютеров TOP500, таких как кластер Loewe-CSC в Университете Гете во Франкфурте, Германия (№22 по установке), Венский научный кластер в Венский университет, Австрия (№56 по установке), и кластер Abel в Университете Осло, Норвегия (№96 по установке).

Ключевые концепции и особенности

При разработке BeeGFS Фраунгофер стремился к трем ключевым концепциям программного обеспечения: масштабируемость, гибкость и удобство использования.

BeeGFS работает на любой машине Linux и состоит из нескольких компонентов, которые включают службы для клиентов, серверов метаданных и серверов хранения. Кроме того, существует служба для хоста управления, а также служба для графической системы администрирования и мониторинга.

Для запуска BeeGFS требуется по крайней мере один экземпляр сервера метаданных и сервера хранения. Но BeeGFS позволяет нескольким экземплярам каждой службы распределять нагрузку с большого количества клиентов. Масштабируемость каждого компонента гарантирует масштабируемость самой системы.

Содержимое файла распределяется по нескольким серверам хранения с использованием чередования, т.е. каждый файл разбивается на блоки заданного размера, и эти блоки распределяются по существующим серверам хранения. Размер этих блоков может быть определен администратором файловой системы. Кроме того, метаданные также распределяются по нескольким серверам метаданных на уровне каталогов, причем каждый сервер хранит часть полного дерева файловой системы. Такой подход обеспечивает быстрый доступ к данным.

Клиенты, а также серверы метаданных или хранилища могут быть добавлены в существующую систему без простоев. Сам клиент - это легкий модуль ядра, не требующий никаких исправлений ядра. Серверы работают поверх существующей локальной файловой системы. Нет никаких ограничений на тип базовой файловой системы, если она поддерживает POSIX ; Рекомендуется использовать ext4 для серверов метаданных и XFS для серверов хранения. Оба сервера работают в пользовательском пространстве.

Кроме того, нет строгих требований к выделенному оборудованию для отдельных услуг. Дизайн позволяет администратору файловой системы запускать службы в любой комбинации на заданном наборе машин и расширять их в будущем. Среди пользователей BeeGFS распространенный способ воспользоваться этим - объединить серверы метаданных и серверы хранения на одних и тех же машинах.

BeeGFS поддерживает различные сетевые соединения с динамическим аварийным переключением, такие как Ethernet или Infiniband, а также множество различных дистрибутивов и ядер Linux (от 2.6.16 до последней версии vanilla). Программа имеет простой механизм настройки и запуска с использованием сценариев инициализации. Для пользователей, которые предпочитают графический интерфейс командным строкам, доступен графический интерфейс на основе Java (AdMon). Графический интерфейс пользователя обеспечивает мониторинг состояния BeeGFS и управление настройками системы. Помимо управления и администрирования установки BeeGFS, этот инструмент также предлагает несколько вариантов мониторинга, помогающих выявлять проблемы с производительностью в системе.

BeeOND (BeeGFS по требованию)

BeeOND (BeeGFS по запросу) позволяет создавать экземпляры файловой системы BeeGFS на наборе узлов с помощью одной единственной командной строки. Возможные варианты использования инструмента разнообразны; некоторые из них включают настройку выделенной параллельной файловой системы для кластерного задания (часто называемое пакетной буферизацией), облачные вычисления или быстрые и простые временные настройки для целей тестирования.

Тесты

Следующие тесты были выполнены на Fraunhofer Seislab, тестовом и экспериментальном кластере в Fraunhofer ITWM с 25 узлами (20 вычислений + 5 хранилищ) и трехуровневой памятью: 1 ТБ Оперативная память, SSD 20 ТБ, HDD 120 ТБ. Производительность одного узла в локальной файловой системе без BeeGFS составляет 1332 МБ / с (запись) и 1317 МБ / с (чтение).

Узлы оснащены 2x Intel Xeon X5660, 48 ГБ ОЗУ, 4x Intel 510 Series SSD (RAID 0), Ext4, QDR Infiniband и работают под управлением Scientific Linux 6.3, Kernel 2.6.32-279 и FhGFS 2012.10- beta1.

BeeGFS и exascale

Fraunhofer ITWM участвует в проекте Dynamic-Exascale Entry Platform - Extended Reach (DEEP-ER) Европейский союз, который решает проблемы растущего разрыва между скоростью вычислений и пропускной способностью ввода-вывода, а также отказоустойчивостью систем для крупномасштабных систем.

Некоторые аспекты, над которыми разработчики BeeGFS работают в рамках этого проекта:

  • поддержка многоуровневого хранилища,
  • расширения интерфейса POSIX,
  • отказоустойчивость и высокая доступность (HA), и
  • улучшенные инструменты мониторинга и диагностики.

План состоит в том, чтобы сохранить интерфейс POSIX для обратной совместимости, но также предоставить приложениям больше контроля над тем, как файловая система обрабатывает такие вещи, как размещение данных и согласованность через расширения API.

См. Также
Ссылки
Последняя правка сделана 2021-05-12 09:26:18
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте