24/7 provoz kritických platforem s MTTR pod 30 minut.
Přebíráme L2/L3 on-call, incident response, observabilitu a reporting. Zero-downtime release, předdefinované SLA a runbooky pro každý scénář.
On-call · observabilita · runbooky · post mortems · compliance
Co klienti dostanou
Od onboarding sprintu po kompletní převzetí provozu. TietoEvry i další klienti potvrzují zero downtime a měřitelné SLA.
Incident response řízený daty
Nastavujeme observabilitu, on-call rotace, runbooky a post-mortem rituály. Vše s jasnými metrikami (SLA, SLO, MTTR).
- Onboarding sprint & runbook factory
- Observabilita (metrics, logs, tracing)
- Incident command, post mortems, reporting
Rozsah spolupráce
- 24/7 on-call L2/L3 + incident command
- Monitoring & observabilita (Prometheus, Grafana, Dynatrace)
- Runbooky, eskalační matice, playbooky pro release
- Post mortems, RCA a follow-up governance
- Reporting pro management (SLA, SLO, náklady)
- Bezpečnostní a compliance požadavky (ISO, SOC2)
Case: TietoEvry – Zero-downtime 24/7 operations
Převzali jsme globální on-call pro fintech platformu s tisíci ticketů měsíčně. Nastavili jsme runbooky, automatizované eskalace a reporting pro board.
- Onboarding kritických služeb během 4 týdnů
- Runbooky pro všechny top 20 incident scénářů
- Reporting SLA/SLO + měsíční executive review
-
Týden 0–2
Discovery & audit
Runbook assessment, gap analýza, definice SLA/SLO a eskalační matice.
-
Týden 3–4
Operational readiness
On-call rotace, observabilita, komunikace s interními týmy, simulace incidentů.
-
Týden 5+
Run & kontinuita
24/7 provoz, měsíční reporting, post mortems, optimalizace nákladů a SLA.
Jak vypadá převzetí 24/7 provozu
Každý krok má jasné výstupy pro management, produkt i provozní týmy.
Runbook audit & readiness
Mapujeme služby, priority, SLA, rizika a připravujeme přechodový plán.
Observabilita & on-call
Nastavujeme monitorovací stack, alerting, eskalace, komunikaci a trénink.
Incident response
24/7 on-call, incident command, komunikace se stakeholdery, post mortems.
Optimalizace & reporting
Pravidelné review, cost governance, automatizace runbooků a bezpečnostní audity.
FAQ – 24/7 operations
Co řeší CTO, CIO nebo provozní ředitelé před předáním kritického provozu.
Jak probíhá přechod 24/7 podpory?
Začínáme discovery sprintem, mapujeme služby a připravíme runbooky. Poté přebíráme shadow režim a po schválení klientem přecházíme na plný run.
Jak zajišťujete komunikaci s managementem?
Každý incident má komunikační šablonu, status page a pravidelné reporty. Měsíčně vedeme executive review s doporučeními.
Máte zkušenosti s regulovanými odvětvími?
Ano. Splňujeme požadavky finančních institucí (audit trail, change management, bezpečnostní politiky) a pomáháme s compliance dokumentací.
Potřebujete mít jistotu 24/7 provozu?
Rezervujte si 30 minut – projdeme vaše SLA, runbooky a doporučíme kroky, jak převést provoz bez rizik.