SYSTEM STATUS · REAL TIME

Всё работает.
Без подвоха.

Live-метрики наших production-сервисов. История инцидентов — тоже здесь, мы их не прячем.

All systemsOPERATIONAL
Eva SaaS API api.evosystem.ai/v2
99.97%
p95 142ms
LLM Router multi-provider routing
99.94%
p95 318ms
Channels Gateway TG · IG · WA · Viber · Web
99.99%
p95 87ms
Voice Gateway Asterisk · Twilio
99.81%
p95 492ms
CRM Sync KeyCRM · Bitrix · HubSpot · etc
99.96%
p95 234ms
Vector DB pgvector · knowledge base
100.00%
p95 24ms
Web Dashboard app.evosystem.ai
99.98%
p95 168ms
Operational Degraded performance Outage Last 90 days · 1 bar = 1 day
ЗА ПОСЛЕДНИЕ 90 ДНЕЙ

Сводка по всему стеку.

UPTIME
99.96%
target 99.9% · SLA
REQUESTS
4.2M
за 90 дней
INCIDENTS
3
2 minor · 1 degraded
MTTR
18m
среднее время восстановления
INCIDENT LOG · LAST 90 DAYS

Что ломалось.
Что мы починили.

Архив за год
Voice Gateway · повышенная latency на ESL UA
12 мая 2026 · 14:30 → 16:48 EET
RESOLVED · 2h 18m
ElevenLabs API регион EU испытывал повышенную нагрузку, что увеличило synthesis latency с ~250ms до ~1.2s. Переключили UA-голос на MiniMax fallback. После стабилизации ElevenLabs — вернулись.
14:30Monitoring alert: voice synthesis p95 > 800ms
14:42Идентифицирована причина: ElevenLabs EU region degraded
14:58Переключение на MiniMax fallback (UA voice)
16:48ElevenLabs восстановлен, возврат на primary. Resolved.
Eva API · короткий outage на deployment
28 апреля 2026 · 03:14 → 03:23 EET
RESOLVED · 9m
При rolling deployment v2.3.8 неправильно настроен health-check timeout, что вызвало short-lived 503 на ~40% запросов. Откатились на v2.3.7 за 9 минут, починили health-check, заново задеплоили без инцидента через 3 часа.
03:14Deployment v2.3.8 начался
03:16Alert: 503 rate > 5%. On-call paged.
03:21Rollback на v2.3.7 инициирован
03:23Rollback завершён. Сервис восстановлен.
CRM Sync · задержки KeyCRM webhook'ов
15 марта 2026 · 11:00 → 11:42 EET
RESOLVED · 42m
KeyCRM webhook endpoint их стороны таймаутил из-за нагрузки. Включили retry-queue, добавили exponential backoff. После стабилизации со стороны KeyCRM — всё догнало без потери данных.
11:00Alert: webhook delivery failure rate > 10%
11:08Включён local retry-queue с exponential backoff
11:35KeyCRM подтвердил stabilization их endpoint
11:42Queue drained, 0 lost events. Resolved.
УВЕДОМЛЕНИЯ

Получать алерты на email.

Major incidents и планируемые maintenance. Не спам.