“Nos informe o tamanho do seu backlog de incidentes em TI que diremos quão doente está sua empresa e quão próximo do fim ela está”.
Embora incidentes em TI serem indesejados devido ao impacto negativo nas operações de negócios e na experiência de usuários e clientes, a cultura reinante nas empresas ainda é a de permitir que eles ocorram. Ainda temos milhões de dólares, reais, euros, etc, sendo pagos para sustentar esta cultura ao invés de serem utilizados para inovações e melhorias.
O paradoxo é que quanto mais dependente de serviços digitais uma empresa for, menos tolerantes a incidentes elas deveriam ser.
Para ser a prova de futuro, todas as organizações precisam realizar negócios onde a entrega de valor e o foco na experiência dos usuários exigem agilidade e exponencialidade. O contexto digital requer que os serviços sejam entregues e suportados de forma que os usuários os acessem em qualquer horário, de qualquer local e por qualquer dispositivo. Neste contexto, incidentes quebram a entrega de valor e maltratam as experiências dos usuários, podendo reduzir o NPS (Net Promoter Score) o que levaria a perda de clientes.
Por esta razão, as organizações modernas e que já nasceram digitais, tal como Google, Spotify, Twiter, Ifood, Kindle da Amazon, entre muitas outras, criaram uma nova cultura onde incidentes não são tolerados.
Dentro deste contexto, decidimos criar o princípio do INCIDENTE ZERO. INCIDENTE ZERO é a completa eliminação de CAUSAS E PROVÁVEIS CAUSAS! O princípio do INCIDENTE ZERO requer ênfase na prática da “melhoria contínua preventiva”.
1º Foco em Prevenção:
Como?
Utilizando técnicas proativas no desenho, construção, testes, liberação e implantação.
Quais técnicas?
Entre elas destacamos:
- Arquiteura Multi-cloud: Espelhamento, Microserviços
- Pipeline CI/CD
- Análise da àrvore de falhas
- SPOF – Single Point of Failure
- CFIA – Análise de Impacto de Falha em Componentes
- Diagrama de Causa e Efeito
- Afinidade / KJ Diagrama (Jiro Kawakita)
- Votação Múltipla
- 6-3-5 Brainwriting
- Análise de Pareto
- Reversal Russa
2º Foco em Detecção e Correção
Quando incidentes não puderem ser evitados então devemos estar prontos para detectá-los preventivamente e corrigir quando não puderem ser prevenidos.
Como?
Investindo em observabilidade!
Através da monitoração e gerenciamento de eventos inteligente
A observabilidade permite praticamente uma visão 360ᵒ dos eventos e da performance que ocorrem em um sistema (aplicação, infraestrutura, processo) ou em um ambiente em que está sendo executado.
Lembre, toda empresa que quer ir para o futuro precisa ser saudável e não tolerar incidentes.
“Nos informe o tamanho do seu backlog de incidentes em TI que diremos quão doente está sua empresa e quão próximo do fim ela está”. Com o princípio do INCIDENTE ZERO, você pode ajudar sua empresa a curar-se, a se tornar saudável e mais relevante para o mercado e seus clientes.