Разработчик (и) | tribe29 GmbH (ранее Mathias Kettner GmbH) |
---|---|
Первый выпуск | 2008 г.; 12 лет назад (2008 г.) |
Стабильный выпуск | 1.6.0p16 / 19 августа 2020 г.; 2 месяца назад (2020-08-19) |
Репозиторий | |
Написано на | Python, C ++ |
Операционная система | Linux |
Тип | ИТ-инфраструктура Мониторинг |
Лицензия | GNU GPL v2 и другие лицензии с открытым исходным кодом, лицензия Checkmk Enterprise |
Веб-сайт | checkmk.com |
Checkmk - это программное обеспечение, разработанное на Python и C ++ для мониторинга ИТ-инфраструктуры. Он используется для мониторинга серверов, приложений, сетей, облачных инфраструктур (общедоступных, частных, гибридных ), контейнеры, хранилище, базы данных и датчики среды .
Checkmk доступен в трех редакциях: редакция с открытым исходным кодом ("Checkmk Raw Edition - CRE »), коммерческую корпоративную версию (« Checkmk Enterprise Edition - CEE ») и коммерческую версию для поставщиков управляемых услуг (« Checkmk Managed Services Edition - CME »). Эти Checkmk-Editions доступны для ряда платформ, в частности для различных версий Debian, Ubuntu, SLES и RedHat / CentOS <104.>, а также как изображение Docker. Кроме того, предлагаются физические устройства различных размеров, а также виртуальные устройства для упрощения администрирования базовой операционной системы с помощью графического пользовательского интерфейса и для обеспечения решений высокой доступности.
Агенты, используемые Checkmk для сбора данных, доступны для 11 платформ, включая Windows.
Checkmk возник в 2008 году как Agent, заменяющий сценарий оболочки для Inetd, и был опубликовано в апреле 2009 г. по лицензии GPL. Первоначально он был основан на Nagios и был дополнен рядом новых компонентов. Версия с открытым исходным кодом (Checkmk Raw Edition) также по-прежнему основана на ядре Nagios и объединяет его с дополнительными компонентами с открытым исходным кодом в полную систему.
За многие годы коммерческие версии Checkmk превратились в самостоятельные - автономная система мониторинга, в которой все основные компоненты Nagios заменены собственными, включая собственное ядро мониторинга. Большинство разработок для коммерческих редакций, в частности все плагины, также доступны в Checkmk Raw Edition.
В то время как в прошлом Checkmk был разработан для мониторинга больших и гетерогенных локальных сред, начиная с версии 1.5+ (1.5p12) он также поддерживает мониторинг AWS, Azure, Docker и Kubernetes services.
Checkmk разрабатывается tribe29 GmbH в Мюнхене Германия, которая до 16.04.2019 действовала под названием Mathias Kettner GmbH. Вместе с изменением названия компании название продукта «Check_MK» также было изменено на «Checkmk».
tribe29 GmbH следует бизнес-модели открытого ядра . Версия с открытым исходным кодом доступна под различными лицензиями с открытым исходным кодом - в основном GPLv2, в то время как большая часть коммерческих выпусков работает под проприетарной лицензией Checkmk Enterprise.
Checkmk сочетает в себе три типа ИТ-мониторинга:
Для обеспечения очень широкого мониторинга Checkmk в настоящее время имеет 1700+ подключаемых модулей в каждой редакции, все из которых лицензированы по GPLv2. Эти плагины поддерживаются как часть продукта и регулярно дополняются дополнительными плагинами или расширениями. Также возможно подключение существующих устаревших подключаемых модулей Nagios.
Чтобы упростить настройку и работу, все компоненты Checkmk поставляются полностью интегрированными. Конфигурация 1: n на основе правил, а также высокая степень автоматизации значительно ускоряют рабочие процессы . Сюда входят:
Кроме того, существуют также инструкции по использованию инструментов настройки и развертывания, таких как Ansible или Salt.
Checkmk часто используется в очень больших распределенных средах, где большое количество сайтов (например, 300 местоположений Faurecia ) и / или более 100000 устройств (например, Edeka ) находятся под наблюдением. Это возможно, среди прочего, потому что микроядро Checkmk потребляет гораздо меньше ресурсов CPU, чем, например, Nagios, и поэтому предлагает значительно более высокую производительность на том же оборудовании. Кроме того, непостоянные данные хранятся в памяти в RAM, что значительно сокращает время доступа.
В коммерческих версиях Checkmk используется собственное ядро мониторинга, написанное на C ++. Его производительность намного выше, чем у ядра Nagios. Кроме того, начиная с версии 1.6 он позволяет динамическую запись объектов с коротким сроком службы, таких как контейнеры. Это возможно, потому что - в отличие от ядра Nagios - Checkmk Microcore не требует перезагрузки при внесении изменений в конфигурацию. Версия с открытым исходным кодом "Checkmk Raw Edition" в настоящее время все еще использует ядро Nagios.
Checkmk предлагает автономное обнаружение сервисов и создание настроек. Checkmk использует свой собственный метод при проведении проверок. В течение периода тестирования с каждым хостом связываются только один раз. Результаты тестирования передаются в ядро мониторинга как пассивные проверки. Это значительно улучшает производительность на сервере мониторинга, а также на контролируемых хостах.
Checkmk использует разные методы для доступа к данным в целевых системах. К ним относятся агенты, установленные в целевой системе, «специальные агенты», работающие на сервере мониторинга и взаимодействующие с API целевой системы, SNMP API для мониторинга, например, сети устройства и принтеры, а также протоколы HTTP / TCP для связи с веб-службами и Интернет-службами. По умолчанию Checkmk следует «принципу извлечения», то есть данные явно запрашиваются системой мониторинга, чтобы быстро определить, когда система внезапно выходит из строя и не реагирует на «извлечение». В качестве альтернативы, однако, можно настроить «push», при котором система передает свои данные напрямую в Checkmk или на промежуточный хост.
Livestatus - это основной интерфейс в Checkmk. Он обеспечивает прямой доступ ко всем данным с контролируемых хостов и сервисов. Данные извлекаются непосредственно из ОЗУ, что позволяет избежать медленного доступа к жесткому диску и обеспечивает быстрый доступ к информации без чрезмерной перегрузки системы. Доступ осуществляется через простой протокол и возможен со всех языков программирования без использования специальной библиотеки.
Мультисайт - это веб-интерфейс Checkmk. Помимо быстрого макета страницы, он предлагает определяемые пользователем представления и информационные панели, распределенный мониторинг путем интеграции нескольких экземпляров мониторинга через Livestatus, интеграцию NagVis, встроенное соединение LDAP, доступ к данным состояния через веб-сервисы и многое другое. Панели мониторинга и представления можно различать для разных пользователей или групп пользователей, например, для администраторов VMware, для конкретных vSphere. Веб-интерфейс в настоящее время доступен на немецком и английском языках.
Средство веб-администрирования делает систему на основе Checkmk полностью управляемой через браузер. Сюда входит управление пользователями, ролями, группами, временными периодами и т. Д. Разрешения могут быть предоставлены детально с использованием концепции ролей. Для этого можно использовать существующие средства контроля доступа на основе ролей (LDAP, AD). WATO работает на основе правил, поэтому конфигурация остается интуитивно понятной даже в сложных средах, а необходимые усилия минимальны. Автоматическое обнаружение и настройка, а также автоматическое обновление агента еще больше ускоряют процесс настройки. HTTP API также можно использовать для интеграции CMDB для ускоренной настройки.
Можно настроить несколько каналов уведомлений с разными правилами для каждого пользователя. Например, электронные письма могут быть отправлены в любое время дня, но уведомления через SMS отправляются только по важным вопросам в часы работы по вызову. Уведомления можно настроить для всех или для определенных команд, например уведомлять только администраторов хранилища о неисправном жестком диске. Повторяющиеся уведомления группируются вместе, поэтому ни один пользователь не получает дважды уведомления по определенному каналу. Кроме того, пользователи могут сами настраивать свои собственные уведомления. В распределенных средах можно централизованно управлять оповещениями. Для обнаруженных проблем действия могут запускаться автоматически (управление тревогой) с помощью скриптов. Checkmk включает интеграцию с электронной почтой и SMS-шлюзами, а также с решениями для управления коммуникациями и ИТ-услугами, такими как Slack, Jira, PagerDuty, OpsGenie, VictorOps и ServiceNow.
Модуль бизнес-аналитики интегрирован в графический интерфейс пользователя. Он объединяет общее состояние бизнес-процессов, их зависимость от сложных приложений и элементов ИТ-инфраструктуры от множества отдельных хостов и служб на основе правил. Его также можно использовать для представления приложений, состоящих из микросервисов, которые, в свою очередь, состоят из модулей и развертываний Kubernetes. Кроме того, в реальном времени можно моделировать наихудшие сценарии и анализировать исторические данные, чтобы понять причины снижения производительности.
Консоль событий объединяет обработку сообщений журнала и ловушек SNMP в мониторинг. Он настраивается с помощью гибкого набора правил и решает, следует ли отбрасывать входящие сообщения или как их классифицировать. Он может подсчитывать, сопоставлять, ожидать сообщения, переписывать сообщения и многое другое. Подобные записи могут быть сгруппированы в одно событие (например, несколько неудачных попыток входа в систему) для отслеживания событий. Он также имеет встроенный syslog демон, который принимает сообщения непосредственно на порт 514, и приемник прерываний SNMP, который принимает прерывания на порт 162.
коммерческие версии Checkmk используют собственную систему показателей и графиков. Это позволяет анализировать показатели временных рядов на длительных интервалах с помощью интерактивных графиков HTML5. Максимальное разрешение - одна секунда. Данные могут быть импортированы из различных источников данных и форматов показателей (JSON, XML, SNMP и т. Д.) И сохранены на диске устройства долгосрочного хранения данных.
В качестве альтернативы, Graphite или InfluxDB можно подключить через интерфейс экспорта. Начиная с версии CEE 1.5p16, доступен плагин для интеграции данных непосредственно из Checkmk в Grafana для целей визуализации. В настоящее время Checkmk Raw Edition использует PNP4Nagios в качестве системы построения графиков.
Отчетность позволяет напрямую или автоматически предоставлять отчеты в формате PDF через регулярные промежутки времени. Он включает в себя анализ доступности, в котором история состояний за любой желаемый период времени может быть предоставлена одним щелчком мыши. При расчетах доступности можно исключить неконтролируемое время, настроить разрешение или игнорировать короткие интервалы. Помимо расчетов доступности, отчеты также включают отчеты SLA, в которых можно отслеживать сложные SLA. Отчетность доступна только в коммерческих версиях Checkmk.
Инвентаризация оборудования / программного обеспечения может использоваться, например, для отслеживания изменений оборудования и программного обеспечения, для проверки наличия установленных обновлений безопасности и для обновления статических данных с помощью динамические параметры (например, обновление текущей статистики использования диска на основе данных мониторинга). База данных управления конфигурацией (CMDB) i-doit имеет глубокую интеграцию, которая позволяет обмениваться данными CMDB с данными мониторинга.