Grupo Commande
Operations & SLA

Operação Transparente com SLAs e Reembolso Financeiro

Promessas são baratas. SLAs com penalidade financeira são caros — e por isso assumimos o risco. Se falhamos, você é reembolsado automaticamente. Métricas de uptime, response time e status page em tempo real. Operação exposta, não escondida.

99.95% Uptime (12 meses)
< 2h P1 Response
0 SLA breaches (6 meses)
100% Postmortems públicos

Nossos SLAs com Penalidade Financeira

SLA sem penalidade é promessa vazia. Nossos SLAs têm cláusula de reembolso automático. Se descumprirmos, você recebe crédito proporcional ao impacto — sem precisar solicitar.

Serviço/MétricaSLA ComprometidoMediçãoPenalidade (se descumprido)
Platform Uptime
99.9%
Mensal10% de crédito por 0.1% abaixo do SLA
API Availability
99.9%
Mensal10% de crédito por 0.1% abaixo do SLA
P1 Incident Response Time
< 2 horas
Por incidente5% de crédito por hora adicional (pro-rata)
P2 Incident Response Time
< 4 horas
Por incidente2.5% de crédito por hora adicional
P3 Incident Response Time
< 8 horas
Por incidente1% de crédito
Support Response (Business Hours)
< 1 hora
Por ticketNão financeiro (mas monitorado)
Data Backup Success Rate
100%
DiárioInvestigação + plano de ação se falhar
🔴 P1 (Critical)

Sistema crítico completamente indisponível. Perda de dados em risco.

🟠 P2 (High)

Funcionalidade importante degradada. Workaround disponível mas difícil.

🟡 P3 (Medium)

Issue não-crítico. Workaround fácil disponível.

🟢 P4 (Low)

Questão informacional ou feature request. Sem impacto operacional.

Como o Reembolso Funciona

Cálculo: Automático ao final do mês

Aplicação: Crédito na fatura seguinte (redução de cobrança)

Limite: Máximo de 30% da mensalidade em créditos por mês

Transparência: Você recebe relatório com cálculo detalhado

Métricas de Disponibilidade e Performance

Uptime Histórico (Últimos 12 Meses)
Média de 99.95% — acima do SLA comprometido de 99.9%
Jan 2024
99.98%
Dez 2023
99.91%
Nov 2023
99.97%
Out 2023
99.95%
Set 2023
99.89%
Ago 2023
99.93%
Jul 2023
99.96%
Jun 2023
99.94%
Mai 2023
99.99%
Abr 2023
99.92%
Mar 2023
99.95%
Fev 2023
99.97%
≥ 99.9% (dentro do SLA)
99.5% - 99.89% (atenção)
Total Uptime (12 meses)

99.95%

Acima do SLA (99.9%)

~4.38 horas/ano de downtime

MTTR (Mean Time to Resolution)

2.3h

P1 incidents

Target: < 4h para P1

Incident Count (12 meses)

2 P1 / 8 P2

Total de incidentes

15 P3 (medium)

SLA Compliance Rate

100%

Últimos 6 meses

Zero breaches

API Performance

120ms

Latência P50

P95: 380ms | P99: 750ms

Support Response Time

42 min

First response (média)

Target: < 1 hora

Status em Tempo Real

Todos os Sistemas Operacionais
Última verificação: há 2 minutos
100% Uptime (24h)

API Platform

Operational

Web Application

Operational

Background Jobs

Operational

Database

Operational

Acessar Status Page Completo →

Histórico de Incidentes e Postmortems Públicos

Transparência em falhas. Todo incidente P1 ou P2 recebe postmortem público detalhando causa raiz, impacto, resolução e ações preventivas. Não escondemos erros — aprendemos com eles e compartilhamos os learnings.

Sem Incidentes P1 nos Últimos 12 Meses

Não houve incidentes críticos (P1) nos últimos 12 meses que exigissem postmortem público. Incidentes P2 (não-críticos) são documentados internamente e learnings incorporados em melhorias contínuas.

Quando houver incidentes, postmortems serão publicados aqui com total transparência.

Gestão de Mudanças e Manutenções

Scheduled Maintenance

Janelas: Domingos, 02:00 - 06:00 UTC

Frequência: Máximo 1x por mês

Notificação: 48 horas de antecedência

Duração típica: < 2 horas

Impacto: Zero downtime (blue-green deployment)

Deployment Strategy

Blue-Green Deployments: Zero downtime (90% dos deploys)

Canary Releases: Rollout gradual (5% → 25% → 100%)

Feature Flags: Rollback instantâneo

Rollback Time: < 5 minutos

Continuidade de Negócios e Recuperação de Desastres

RPO (Recovery Point Objective)

< 1 hora

Máxima perda de dados aceitável em cenário de desastre

Implementação: Backups incrementais a cada 6h + transaction logs contínuos

RTO (Recovery Time Objective)

< 4 horas

Tempo máximo para restaurar serviços após desastre

Implementação: Infraestrutura redundante, DR site ativo

Backup Strategy

Frequência

  • • Full backup: Diário (03:00 UTC)
  • • Incremental: A cada 6 horas
  • • Transaction logs: Contínuo

Retenção

  • • Hot backups: 30 dias
  • • Warm backups: 90 dias
  • • Cold backups: 7 anos

Testing

  • • Backup restore: Mensal
  • • Full DR drill: Trimestral
  • • Success rate: > 99%

SLA Não é Promessa. É Compromisso com Penalidade.

Se você busca fornecedor que assume risco operacional (não só joga no contrato), vamos conversar.