Типы событий и их обработка
Вы можете интегрировать свой экземпляр SimpleOne с любой системой активного мониторинга (AMS) для наблюдения за стабильностью и производительностью вашей системы.
Основная функция AMS состоит в том, чтобы запрашивать статусы объектов наблюдения и при необходимости генерировать оповещения. После этого с помощью механизма обмена данными между AMS и экземпляром SimpleOne на основе этих оповещений создаются события с нужным типом оповещения и параметрами, заданными правилами мониторинга. Это могут быть информационные, предупреждающие, исключительные и инструктирующие события.
На следующей схеме показан процесс мониторинга и управления событиями.
Информационные события
Информационные события охватывают однотипные некритические события, накопленные за определенный период.
Примером информационного события является уведомление об авторизации пользователя. Для создания события, требующего реакции, должно произойти много однотипных событий за заданный период. Например, десять попыток входа в систему за одну минуту от одного и того же пользователя.
Ниже приведен пример обработки информационных событий с помощью механизма корреляции событий:
- AMS отправляет сообщение о каждой неудачной попытке входа в систему.
- Модуль События и мониторинг собирает информацию о десяти попытках входа в систему за одну минуту от одного и того же пользователя.
- Система создает инцидент о подозрительной активности. В этом случае период повторной проверки не требуется.
Предупреждающие события
Предупреждающие события отслеживают, достиг ли параметр услуги или устройства порогового значения. Примером предупреждающего события может быть нехватка места на диске.
Ниже приведен пример обработки таких событий с помощью механизма корреляции событий:
- AMS выдает предупреждение, что место на диске заканчивается, осталось X Мбайт.
- На экземпляре SimpleOne в соответствии с заданными правилами мониторинга создается Предупреждающее событие, основанное на сообщении от AMS и находящееся в статусе Активно.
- В отличие от исключительных событий система не начинает обратный отсчет периода повторной проверки. В соответствии с заданными настройками, для запуска периода повторной проверки должно быть два активных предупреждающих события для данного AMS-сообщения.
- Если получено второе событие типа Предупреждающее, то тогда начинается период повторной проверки. Период должен пройти прежде чем можно будет предпринять какие-либо действия.
- По истечении периода система проверяет статус событий, связанных с сообщением (система мониторинга обновляет статус сообщений, и статус событий синхронизируются с ними):
- Если все события по-прежнему находятся в статусе Активно, сразу создается инцидент.
- Если хотя бы одно событие Неактивно, то создавать инцидент не требуется.
Исключительные события
Исключительные события определяют, достигла ли метрика услуги или компонент системы заданного значения нарушения. Примером таких событий может быть недоступность сервера или любого другого важного сервиса.
Ниже приведен пример обработки исключительных событий с помощью механизма корреляции событий:
-
AMS отправляет сообщение, что сервер недоступен.
-
На экземпляре SimpleOne в соответствии с заданными правилами мониторинга создается Исключительное событие мониторинга, основанное на сообщении и находящееся в статусе Активно.
-
Событие проверяется на соответствие правилу событий. Система начинает обратный отсчет периода повторной проверки (например, он составляет три минуты). По истечении этого периода проводится повторная проверка.
примечаниеЕсли в правиле установлен флажок Игнорировать корреляцию событий, то выполнение связанных действий происходит без повторной проверки. В отличие от других типов, связанные действия для таких исключительных событий выполняются при каждом полученном сообщении, независимо от того, выполнялись они при получении прошлого сообщения или нет.
-
По истечении периода система проверяет статус события, связанного с сообщением (система мониторинга обновляет статус сообщений, и статус событий синхронизируется с ними):
- Если событие по-прежнему находится в статусе Активно, сразу создается инфраструктурный инцидент.
- Если статус события изменился на Неактивно, то создавать инцидент не требуется.
Инструктирующие события
Инструктирующие события – это информационные события, которые фиксируют необходимость выполнения работ по инструкции, например, регламентного обслуживания.
В отличие от событий других типов, инструктирующие события не ведут к созданию инцидентов. Тем не менее, своевременное реагирование на сообщения этого типа поможет предотвратить инциденты.