Operação Transparente com SLAs e Reembolso Financeiro
Promessas são baratas. SLAs com penalidade financeira são caros — e por isso assumimos o risco. Se falhamos, você é reembolsado automaticamente. Métricas de uptime, response time e status page em tempo real. Operação exposta, não escondida.
Nossos SLAs com Penalidade Financeira
SLA sem penalidade é promessa vazia. Nossos SLAs têm cláusula de reembolso automático. Se descumprirmos, você recebe crédito proporcional ao impacto — sem precisar solicitar.
| Serviço/Métrica | SLA Comprometido | Medição | Penalidade (se descumprido) |
|---|---|---|---|
| Platform Uptime | 99.9% | Mensal | 10% de crédito por 0.1% abaixo do SLA |
| API Availability | 99.9% | Mensal | 10% de crédito por 0.1% abaixo do SLA |
| P1 Incident Response Time | < 2 horas | Por incidente | 5% de crédito por hora adicional (pro-rata) |
| P2 Incident Response Time | < 4 horas | Por incidente | 2.5% de crédito por hora adicional |
| P3 Incident Response Time | < 8 horas | Por incidente | 1% de crédito |
| Support Response (Business Hours) | < 1 hora | Por ticket | Não financeiro (mas monitorado) |
| Data Backup Success Rate | 100% | Diário | Investigação + plano de ação se falhar |
Sistema crítico completamente indisponível. Perda de dados em risco.
Funcionalidade importante degradada. Workaround disponível mas difícil.
Issue não-crítico. Workaround fácil disponível.
Questão informacional ou feature request. Sem impacto operacional.
Cálculo: Automático ao final do mês
Aplicação: Crédito na fatura seguinte (redução de cobrança)
Limite: Máximo de 30% da mensalidade em créditos por mês
Transparência: Você recebe relatório com cálculo detalhado
Métricas de Disponibilidade e Performance
99.95%
Acima do SLA (99.9%)
~4.38 horas/ano de downtime
2.3h
P1 incidents
Target: < 4h para P1
2 P1 / 8 P2
Total de incidentes
15 P3 (medium)
100%
Últimos 6 meses
Zero breaches
120ms
Latência P50
P95: 380ms | P99: 750ms
42 min
First response (média)
Target: < 1 hora
Status em Tempo Real
API Platform
Operational
Web Application
Operational
Background Jobs
Operational
Database
Operational
Histórico de Incidentes e Postmortems Públicos
Transparência em falhas. Todo incidente P1 ou P2 recebe postmortem público detalhando causa raiz, impacto, resolução e ações preventivas. Não escondemos erros — aprendemos com eles e compartilhamos os learnings.
Sem Incidentes P1 nos Últimos 12 Meses
Não houve incidentes críticos (P1) nos últimos 12 meses que exigissem postmortem público. Incidentes P2 (não-críticos) são documentados internamente e learnings incorporados em melhorias contínuas.
Quando houver incidentes, postmortems serão publicados aqui com total transparência.
Gestão de Mudanças e Manutenções
Janelas: Domingos, 02:00 - 06:00 UTC
Frequência: Máximo 1x por mês
Notificação: 48 horas de antecedência
Duração típica: < 2 horas
Impacto: Zero downtime (blue-green deployment)
Blue-Green Deployments: Zero downtime (90% dos deploys)
Canary Releases: Rollout gradual (5% → 25% → 100%)
Feature Flags: Rollback instantâneo
Rollback Time: < 5 minutos
Continuidade de Negócios e Recuperação de Desastres
< 1 hora
Máxima perda de dados aceitável em cenário de desastre
Implementação: Backups incrementais a cada 6h + transaction logs contínuos
< 4 horas
Tempo máximo para restaurar serviços após desastre
Implementação: Infraestrutura redundante, DR site ativo
Frequência
- • Full backup: Diário (03:00 UTC)
- • Incremental: A cada 6 horas
- • Transaction logs: Contínuo
Retenção
- • Hot backups: 30 dias
- • Warm backups: 90 dias
- • Cold backups: 7 anos
Testing
- • Backup restore: Mensal
- • Full DR drill: Trimestral
- • Success rate: > 99%
SLA Não é Promessa. É Compromisso com Penalidade.
Se você busca fornecedor que assume risco operacional (não só joga no contrato), vamos conversar.