SYSTEM STATUS · REAL TIME
Всё работает.
Всё работает.
Без подвоха.
Live-метрики наших production-сервисов. История инцидентов — тоже здесь, мы их не прячем.
All systemsOPERATIONAL
Eva SaaS API
99.97%
p95 142ms
LLM Router
99.94%
p95 318ms
Channels Gateway
99.99%
p95 87ms
Voice Gateway
99.81%
p95 492ms
CRM Sync
99.96%
p95 234ms
Vector DB
100.00%
p95 24ms
Web Dashboard
99.98%
p95 168ms
Operational
Degraded performance
Outage
Last 90 days · 1 bar = 1 day
ЗА ПОСЛЕДНИЕ 90 ДНЕЙ
Сводка по всему стеку.
UPTIME
99.96%
target 99.9% · SLA
REQUESTS
4.2M
за 90 дней
INCIDENTS
3
2 minor · 1 degraded
MTTR
18m
среднее время восстановления
INCIDENT LOG · LAST 90 DAYS
Что ломалось.
Архив за год
Что ломалось.
Что мы починили.
Voice Gateway · повышенная latency на ESL UA
12 мая 2026 · 14:30 → 16:48 EET
ElevenLabs API регион EU испытывал повышенную нагрузку, что увеличило synthesis latency с ~250ms до ~1.2s. Переключили UA-голос на MiniMax fallback. После стабилизации ElevenLabs — вернулись.
14:30Monitoring alert: voice synthesis p95 > 800ms
14:42Идентифицирована причина: ElevenLabs EU region degraded
14:58Переключение на MiniMax fallback (UA voice)
16:48ElevenLabs восстановлен, возврат на primary. Resolved.
Eva API · короткий outage на deployment
28 апреля 2026 · 03:14 → 03:23 EET
При rolling deployment v2.3.8 неправильно настроен health-check timeout, что вызвало short-lived 503 на ~40% запросов. Откатились на v2.3.7 за 9 минут, починили health-check, заново задеплоили без инцидента через 3 часа.
03:14Deployment v2.3.8 начался
03:16Alert: 503 rate > 5%. On-call paged.
03:21Rollback на v2.3.7 инициирован
03:23Rollback завершён. Сервис восстановлен.
CRM Sync · задержки KeyCRM webhook'ов
15 марта 2026 · 11:00 → 11:42 EET
KeyCRM webhook endpoint их стороны таймаутил из-за нагрузки. Включили retry-queue, добавили exponential backoff. После стабилизации со стороны KeyCRM — всё догнало без потери данных.
11:00Alert: webhook delivery failure rate > 10%
11:08Включён local retry-queue с exponential backoff
11:35KeyCRM подтвердил stabilization их endpoint
11:42Queue drained, 0 lost events. Resolved.
УВЕДОМЛЕНИЯ
Получать алерты на email.
Major incidents и планируемые maintenance. Не спам.