Operations & SLA

Operação Transparente com SLAs e Reembolso Financeiro

Promessas são baratas. SLAs com penalidade financeira são caros — e por isso assumimos o risco. Se falhamos, você é reembolsado automaticamente. Métricas de uptime, response time e status page em tempo real. Operação exposta, não escondida.

99.95% Uptime (12 meses)

< 2h P1 Response

0 SLA breaches (6 meses)

100% Postmortems públicos

Nossos SLAs com Penalidade Financeira

SLA sem penalidade é promessa vazia. Nossos SLAs têm cláusula de reembolso automático. Se descumprirmos, você recebe crédito proporcional ao impacto — sem precisar solicitar.

Serviço/Métrica	SLA Comprometido	Medição	Penalidade (se descumprido)
Platform Uptime	99.9%	Mensal	10% de crédito por 0.1% abaixo do SLA
API Availability	99.9%	Mensal	10% de crédito por 0.1% abaixo do SLA
P1 Incident Response Time	< 2 horas	Por incidente	5% de crédito por hora adicional (pro-rata)
P2 Incident Response Time	< 4 horas	Por incidente	2.5% de crédito por hora adicional
P3 Incident Response Time	< 8 horas	Por incidente	1% de crédito
Support Response (Business Hours)	< 1 hora	Por ticket	Não financeiro (mas monitorado)
Data Backup Success Rate	100%	Diário	Investigação + plano de ação se falhar

🔴 P1 (Critical)

Sistema crítico completamente indisponível. Perda de dados em risco.

🟠 P2 (High)

Funcionalidade importante degradada. Workaround disponível mas difícil.

🟡 P3 (Medium)

Issue não-crítico. Workaround fácil disponível.

🟢 P4 (Low)

Questão informacional ou feature request. Sem impacto operacional.

Como o Reembolso Funciona

Cálculo: Automático ao final do mês

Aplicação: Crédito na fatura seguinte (redução de cobrança)

Limite: Máximo de 30% da mensalidade em créditos por mês

Transparência: Você recebe relatório com cálculo detalhado

Métricas de Disponibilidade e Performance

Uptime Histórico (Últimos 12 Meses)

Média de 99.95% — acima do SLA comprometido de 99.9%

Jan 2024

99.98%

Dez 2023

99.91%

Nov 2023

99.97%

Out 2023

99.95%

Set 2023

99.89%

Ago 2023

99.93%

Jul 2023

99.96%

Jun 2023

99.94%

Mai 2023

99.99%

Abr 2023

99.92%

Mar 2023

99.95%

Fev 2023

99.97%

≥ 99.9% (dentro do SLA)

99.5% - 99.89% (atenção)

Total Uptime (12 meses)

99.95%

Acima do SLA (99.9%)

~4.38 horas/ano de downtime

MTTR (Mean Time to Resolution)

2.3h

P1 incidents

Target: < 4h para P1

Incident Count (12 meses)

2 P1 / 8 P2

Total de incidentes

15 P3 (medium)

SLA Compliance Rate

100%

Últimos 6 meses

Zero breaches

API Performance

120ms

Latência P50

P95: 380ms | P99: 750ms

Support Response Time

42 min

First response (média)

Target: < 1 hora

Status em Tempo Real

Todos os Sistemas Operacionais

Última verificação: há 2 minutos

100% Uptime (24h)

API Platform

Operational

Web Application

Operational

Background Jobs

Operational

Database

Operational

Acessar Status Page Completo →

Histórico de Incidentes e Postmortems Públicos

Transparência em falhas. Todo incidente P1 ou P2 recebe postmortem público detalhando causa raiz, impacto, resolução e ações preventivas. Não escondemos erros — aprendemos com eles e compartilhamos os learnings.

Sem Incidentes P1 nos Últimos 12 Meses

Não houve incidentes críticos (P1) nos últimos 12 meses que exigissem postmortem público. Incidentes P2 (não-críticos) são documentados internamente e learnings incorporados em melhorias contínuas.

Quando houver incidentes, postmortems serão publicados aqui com total transparência.

Gestão de Mudanças e Manutenções

Scheduled Maintenance

Janelas: Domingos, 02:00 - 06:00 UTC

Frequência: Máximo 1x por mês

Notificação: 48 horas de antecedência

Duração típica: < 2 horas

Impacto: Zero downtime (blue-green deployment)

Deployment Strategy

Blue-Green Deployments: Zero downtime (90% dos deploys)

Canary Releases: Rollout gradual (5% → 25% → 100%)

Feature Flags: Rollback instantâneo

Rollback Time: < 5 minutos

Continuidade de Negócios e Recuperação de Desastres

RPO (Recovery Point Objective)

< 1 hora

Máxima perda de dados aceitável em cenário de desastre

Implementação: Backups incrementais a cada 6h + transaction logs contínuos

RTO (Recovery Time Objective)

< 4 horas

Tempo máximo para restaurar serviços após desastre

Implementação: Infraestrutura redundante, DR site ativo

Backup Strategy

Frequência

• Full backup: Diário (03:00 UTC)
• Incremental: A cada 6 horas
• Transaction logs: Contínuo

Retenção

• Hot backups: 30 dias
• Warm backups: 90 dias
• Cold backups: 7 anos

Testing

• Backup restore: Mensal
• Full DR drill: Trimestral
• Success rate: > 99%

SLA Não é Promessa. É Compromisso com Penalidade.

Se você busca fornecedor que assume risco operacional (não só joga no contrato), vamos conversar.

Ver Como Operamos Seu Setor Agendar Diagnóstico