Перейти к основному содержимому

Инциденты

Раздел "Инциденты" предназначен для информирования ваших пользователей о возникших проблемах в работе ваших сервисов и продуктов. Управление всеми инцидентами осуществляется в разделе "Инциденты".

При создании каждого инцидента необходимо указать следующие параметры:

  • Имя инцидента: Кратко опишите суть возникшей проблемы.
  • Статус: Определяет текущее состояние инцидента:
    • Изучение: Начальный этап, на котором команда занимается выяснением причин и области распространения проблемы.
    • Проблема локализована: Определено место возникновения проблемы и затронутые сервисы.
    • Наблюдение: Проблема устранена, ведется наблюдение за стабильностью работы сервисов.
    • Закрыт: Инцидент полностью устранен, все компоненты функционируют в штатном режиме.
  • Сообщение: Детальное описание инцидента, которое будет отображаться на странице отчета об инциденте и будет отправлено вашим подписчикам.
  • Затронутые компоненты: Выберите компоненты, на которые повлиял инцидент, и при необходимости измените их статус. При каждом обновлении инцидента вы также можете корректировать статус связанных компонентов.
  • Отправить уведомления: При создании или обновлении инцидента вы можете отключить отправку уведомлений подписчикам вашей Статус Страницы. Эта опция может быть полезна при добавлении информации о произошедших ранее инцидентах или в случаях, когда вы предпочитаете не отправлять слишком частые уведомления.

Редактирование инцидента

Вы можете вносить изменения как в активные, так и в уже завершенные инциденты. Доступны следующие возможности редактирования:

  • Имя инцидента: Чтобы изменить название, дважды щелкните по нему, и появится поле для редактирования.
  • Уровень критичности: По умолчанию всем инцидентам присваивается "Средний" уровень критичности. Вы можете изменить его, выбрав нужный вариант из выпадающего списка.
  • История инцидента: Редактируйте сообщения и временные метки в хронологии инцидента. Это полезно для уточнения времени определенных событий или добавления более подробной информации в сообщения.

Постмортем

Для завершенных инцидентов вы можете подготовить и опубликовать постмортем (Postmortem) или анализ первопричин (Root Cause Analysis, RCA). Когда происходят сбои, вашим пользователям важно не только знать о недоступности сервиса, но и понимать причины произошедшего, а также какие меры вы предпринимаете для предотвращения подобных ситуаций в будущем. Постмортемы предоставляют эту информацию, превращая негативный опыт в возможность для укрепления доверия и демонстрации зрелости ваших процессов.

Чтобы написать постмортем, нажмите кнопку "Написать постмортем" или выберите соответствующий пункт в меню редактирования закрытого инцидента. Постмортем поддерживает Markdown-форматирование.

Больше информации о постмортемах вы найдете в нашем блоге.

Прошедший инцидент

Вы можете добавлять в систему информацию об инцидентах, которые уже произошли и были закрыты. Это полезно для ведения полной истории инцидентов, анализа прошлых сбоев или информирования пользователей о событиях, произошедших до того, как вы начали использовать эту систему для управления инцидентами.

Для создания прошедшего инцидента выполните следующие шаги:

  • Выберите нужную Статус Страницу
  • В вкладке "Инциденты" нажмите кнопку "Открыть инцидент"
  • Вверху вы увидите переключатель - "Прошедший инцидент"

Создать прошедший инцидент в Pingera

Обновления

Вы можете создать "Обновления", которые отражают хронологию инцидента. Для каждого обновления необходимо выбрать хотя бы один компонент и добавить сообщение. Не забудьте указать верное время и статус обновления.

warning

Если ваше последнее обновление не будет иметь статус "Закрыт", то инцидент останется открытым и статусы компонентов будут изменены.

Уведомления

Отключите отправку уведомлений, если вы не хотите информировать подписчиков о прошедшем событии. Это особенно актуально для старых инцидентов, чтобы избежать ненужных оповещений.

Если отправка уведомлений включена, то подписчики Статус Страницы получать уведомления с данным последнего Обновления инцидента.

Добавление прошедших инцидентов помогает поддерживать актуальную и полную картину стабильности ваших сервисов, даже если информация о них не была внесена в систему в реальном времени.

API

Для автоматизированного управления инцидентами используйте API. Детальное описание доступно в документации.