ИИ-функции (Agency)
UpRadar использует искусственный интеллект для ускорения диагностики инцидентов: автоматически анализирует историю проверок, выявляет аномалии до полного падения сервиса и генерирует структурированные постмортемы. Это сокращает время на расследование и помогает команде сосредоточиться на устранении проблемы, а не на её поиске.
Функция доступна на тарифе Agency
ИИ в UpRadar
Инструменты на основе ИИ встроены непосредственно в рабочий процесс обработки инцидентов и не требуют отдельной настройки. После подключения тарифа Agency они активируются автоматически для всех мониторов аккаунта.
Доступные возможности:
- Анализ первопричин (Root Cause Analysis) — автоматический разбор истории проверок после завершения инцидента и предположение о его причине.
- Обнаружение аномалий — раннее предупреждение о деградации производительности до наступления полного сбоя.
- ИИ-постмортем — готовый структурированный отчёт об инциденте, доступный сразу после его закрытия.
Анализ первопричин
Когда инцидент завершается (монитор переходит в статус «Онлайн»), UpRadar автоматически запускает анализ первопричин. ИИ изучает историю проверок за период инцидента: коды ответов, времена отклика, заголовки, тайм-ауты — и формулирует наиболее вероятную причину сбоя.
Типичные диагнозы, которые ставит система:
- DNS timeout — имя хоста не разрешается; вероятны проблемы с DNS-провайдером.
- Connection refused — сервис не принимает соединения на порту; возможно, процесс упал.
- Slow DB — время ответа резко выросло, а затем вернулось к норме; характерный паттерн деградации базы данных.
- TLS handshake failed — ошибка SSL-квитирования; вероятно, истёк сертификат или неверна конфигурация.
- 5xx cascade — последовательность ошибок 502/503/504; признак проблем с балансировщиком или бэкендом.
Результат анализа отображается в карточке инцидента под заголовком «Вероятная причина» и сопровождается уверенностью в процентах.
Аномальная активность
Система обнаружения аномалий непрерывно наблюдает за временем ответа каждого монитора и сравнивает текущие значения с исторической базовой линией. Если время ответа резко выходит за пределы нормы — даже при том, что монитор технически ещё «онлайн» — UpRadar показывает предупреждение на дашборде монитора.
Предупреждение об аномалии отображается жёлтым индикатором рядом со статусом монитора. Это сигнал к тому, что пора проверить сервис до наступления полного инцидента.
Аномалии особенно полезны для сервисов с выраженной суточной нагрузкой: система учитывает временны́е паттерны и не поднимает ложную тревогу во время предсказуемого дневного пика трафика.
ИИ-постмортем
После закрытия инцидента UpRadar автоматически генерирует структурированный постмортем — документ, описывающий произошедшее. Постмортем доступен на странице инцидента в разделе «ИИ-анализ» и содержит следующие блоки:
- Что произошло — краткое описание хода инцидента: время начала, симптомы, динамика.
- Продолжительность воздействия — точный интервал недоступности сервиса.
- Вероятная причина — гипотеза на основе анализа данных мониторинга.
- Предлагаемые меры — конкретные рекомендации по предотвращению повторения: от добавления health-check эндпоинта до настройки алертов на время ответа.
Постмортем можно скопировать в буфер обмена или экспортировать в формате Markdown — это удобно для публикации в Confluence, Notion или корпоративном вики.
ИИ-постмортем — это отправная точка для команды, а не финальный документ. Рекомендуем дополнять его контекстом из внутренних систем и человеческой оценкой перед публикацией.