Инциденты
Раздел "Инциденты" предназначен для информирования ваших пользователей о возникших проблемах в работе ваших сервисов и продуктов. Управление всеми инцидентами осуществляется в разделе "Инциденты".
При создании каждого инцидента необходимо указать следующие параметры:
- Имя инцидента: Кратко опишите суть возникшей проблемы.
- Статус: Определяет текущее состояние инцидента:
- Изучение: Начальный этап, на котором команда занимается выяснением причин и области распространения проблемы.
- Проблема локализована: Определено место возникновения проблемы и затронутые сервисы.
- Наблюдение: Проблема устранена, ведется наблюдение за стабильностью работы сервисов.
- Закрыт: Инцидент полностью устранен, все компоненты функционируют в штатном режиме.
- Сообщение: Детальное описание инцидента, которое будет отображаться на странице отчета об инциденте и будет отправлено вашим подписчикам.
- Затронутые компоненты: Выберите компоненты, на которые повлиял инцидент, и при необходимости измените их статус. При каждом обновлении инцидента вы также можете корректировать статус связанных компонентов.
- Отправить уведомления: При создании или обновлении инцидента вы можете отключить отправку уведомлений подписчикам вашей Статус Страницы. Эта опция может быть полезна при добавлении информации о произошедших ранее инцидентах или в случаях, когда вы предпочитаете не отправлять слишком частые уведомления.
Редактирование инцидента
Вы можете вносить изменения как в активные, так и в уже завершенные инциденты. Доступны следующие возможности редактирования:
- Имя инцидента: Чтобы изменить название, дважды щелкните по нему, и появится поле для редактирования.
- Уровень критичности: По умолчанию всем инцидентам присваивается "Средний" уровень критичности. Вы можете изменить его, выбрав нужный вариант из выпадающего списка.
- История инцидента: Редактируйте сообщения и временные метки в хронологии инцидента. Это полезно для уточнения времени определенных событий или добавления более подробной информации в сообщения.
Постмортем
Для завершенных инцидентов вы можете подготовить и опубликовать постмортем (Postmortem) или анализ первопричин (Root Cause Analysis, RCA). Когда происходят сбои, вашим пользователям важно не только знать о недоступности сервиса, но и понимать причины произошедшего, а также какие меры вы предпринимаете для предотвращения подобных ситуаций в будущем. Постмортемы предоставляют эту информацию, превращая негативный опыт в возможность для укрепления доверия и демонстрации зрелости ваших процессов.
Чтобы написать постмортем, нажмите кнопку "Написать постмортем" или выберите соответствующий пункт в меню редактирования закрытого инцидента. Постмортем поддерживает Markdown-форматирование.
Больше информации о постмортемах вы найдете в нашем блоге.
Прошедший инцидент
Вы можете добавлять в систему информацию об инцидентах, которые уже произошли и были закрыты. Это полезно для ведения полной истории инцидентов, анализа прошлых сбоев или информирования пользователей о событиях, произошедших до того, как вы начали использовать эту систему для управления инцидентами.
Для создания прошедшего инцидента выполните следующие шаги:
- Выберите нужную Статус Страницу
- В вкладке "Инциденты" нажмите кнопку "Открыть инцидент"
- Вверху вы увидите переключатель - "Прошедший инцидент"

Обновления
Вы можете создать "Обновления", которые отражают хронологию инцидента. Для каждого обновления необходимо выбрать хотя бы один компонент и добавить сообщение. Не забудьте указать верное время и статус обновления.
Если ваше последнее обновление не будет иметь статус "Закрыт", то инцидент останется открытым и статусы компонентов будут изменены.
Уведомления
Отключите отправку уведомлений, если вы не хотите информировать подписчиков о прошедшем событии. Это особенно актуально для старых инцидентов, чтобы избежать ненужных оповещений.
Если отправка уведомлений включена, то подписчики Статус Страницы получать уведомления с данным последнего Обновления инцидента.
Добавление прошедших инцидентов помогает поддерживать актуальную и полную картину стабильности ваших сервисов, даже если информация о них не была внесена в систему в реальном времени.
API
Для автоматизированного управления инцидентами используйте API. Детальное описание доступно в документации.