Управление проблемами это процесс, отвечающий за управление жизненным циклом всех проблем, которые происходят или могут произойти в ИТ-службе. Основные цели управления проблемами - предотвратить возникновение проблем и связанных с ними инцидентов, устранить повторяющиеся инциденты и минимизировать влияние инцидентов, которые невозможно предотвратить. Библиотека инфраструктуры информационных технологий определяет проблему как причину одного или нескольких инцидентов.
Управление проблемами включает в себя действия, необходимые для диагностики основной причины инцидентов, выявленных в процессе Управление инцидентами, и определения решения те проблемы. Он также отвечает за обеспечение того, чтобы решение было реализовано с помощью соответствующих процедур контроля, особенно Управление изменениями и Управление выпуском.
Управление проблемами также будет поддерживать информацию о проблемах и соответствующих обходных путях и решениях, чтобы организация могла со временем уменьшить количество и влияние инцидентов. В этом отношении Управление проблемами имеет надежный интерфейс с Управлением знаниями, и для обоих будут использоваться такие инструменты, как База данных известных ошибок. Хотя управление инцидентами и управление проблемами являются отдельными процессами, они тесно связаны и обычно используют одни и те же инструменты, а также могут использовать аналогичные системы категоризации, воздействия и кодирования приоритета. Это обеспечит эффективное общение при рассмотрении связанных инцидентов и проблем.
Управление проблемами работает вместе с Управлением инцидентами и Управлением изменениями, чтобы обеспечить повышение доступности и качества ИТ-услуг. Когда инциденты разрешены, информация о разрешении записывается. Со временем эта информация используется для ускорения времени разрешения и определения постоянных решений, сокращая количество и время разрешения инцидентов. Это приводит к сокращению времени простоя и прерывания работы критически важных для бизнеса систем.
Управление проблемами состоит из двух основных процессов:
Все важные детали проблемы должны должны быть записаны так, чтобы существовала полная историческая запись. Это должно быть отмечено датой и временем, чтобы обеспечить соответствующий контроль и эскалацию. Перекрестная ссылка должна быть сделана на инцидент (ы), который инициировал «Запись о проблеме»:
Проблемы могут быть разделены на категории в соответствии с их серьезностью и приоритетностью так же, как и инциденты, чтобы облегчить их отслеживание, принимая во внимание влияние связанных инцидентов и их частоту возникновения. С точки зрения инфраструктуры можно спросить:
Результатом исследования проблемы будет диагностика основной причины или отчет о RCA. Решение должно быть суммой соответствующего уровня ресурсов и навыков, используемых для его поиска. Существует ряд полезных методов решения проблем, которые можно использовать для диагностики и решения проблем.
Анализ значения боли содержит более широкий взгляд на влияние инцидента или проблемы на бизнес. Вместо анализа количества инцидентов / проблем определенного типа в конкретном временном интервале метод фокусируется на глубоком анализе того, какой уровень боли был причинен бизнесу этими инцидентами / проблемами. Формула для расчета уровня боли должна учитывать:
Метод Кепнера и Трегое используется для исследования более глубоких проблем. Они определили следующие этапы:
анализ Парето или диаграмма Парето - это метод отделения важных потенциальных причин от незначительных проблем. Необходимо предпринять следующие шаги:
Причины | Процент от общего числа | Вычислений% |
---|---|---|
Сетевой контроллер | 35 | 0 + 35% = 35% |
Повреждение файла | 26 | 35% + 26% = 61% |
Серверная ОС | 6 | 61% + 6% = 67% |
После завершения расследования и временного решения ( или даже постоянное решение), необходимо создать запись об известной ошибке и поместить ее в базу данных известных ошибок, чтобы выявить и устранить подобные проблемы в дальнейшем. Основная цель - как можно скорее восстановить поврежденный сервис с минимальным влиянием на бизнес.
Хорошей практикой было бы поднять запись об известной ошибке как можно раньше в ходе расследования; после успешного тестирования обходного пути или определения основной причины.
Хорошей практикой является проверка всех основных проблем. Но это требует затрат. В ходе проверки необходимо изучить:
Знания, полученные в результате проверки, должны быть включены в обзор услуг с бизнес-заказчиком, чтобы убедиться, что заказчик осведомлен о предпринятых действиях и планах по предотвращению подобных инцидентов в будущем. Это помогает повысить удовлетворенность клиентов и обеспечить бизнесу уверенность в том, что отдел обслуживания ответственно обрабатывает серьезные инциденты и активно работает над предотвращением их повторения в будущем.