Incidentes Zero!


“Nos informe o tamanho do seu backlog de incidentes em TI que diremos quão doente está sua empresa e quão próximo do fim ela está”.

Embora incidentes em TI serem indesejados devido ao impacto negativo nas operações de negócios e na experiência de usuários e clientes, a cultura reinante nas empresas ainda é a de permitir que eles ocorram. Ainda temos milhões de dólares, reais, euros, etc, sendo pagos para sustentar esta cultura ao invés de serem utilizados para inovações e melhorias.

O paradoxo é que quanto mais dependente de serviços digitais uma empresa for, menos tolerantes a incidentes elas deveriam ser.

Para ser a prova de futuro, todas as organizações precisam realizar negócios onde a entrega de valor e o foco na experiência dos usuários exigem agilidade e exponencialidade. O contexto digital requer que os serviços sejam entregues e suportados de forma que os usuários os acessem em qualquer horário, de qualquer local e por qualquer dispositivo. Neste contexto, incidentes quebram a entrega de valor e maltratam as experiências dos usuários, podendo reduzir o NPS (Net Promoter Score) o que levaria a perda de clientes.

Por esta razão, as organizações modernas e que já nasceram digitais, tal como Google, Spotify, Twiter, Ifood, Kindle da Amazon, entre muitas outras, criaram uma nova cultura onde incidentes não são tolerados.

Dentro deste contexto, decidimos criar o princípio do INCIDENTE ZERO. INCIDENTE ZERO é a completa eliminação de CAUSAS E PROVÁVEIS CAUSAS! O princípio do INCIDENTE ZERO requer ênfase na prática da “melhoria contínua preventiva”.

1º Foco em Prevenção:

Como?

Utilizando técnicas proativas no desenho, construção, testes, liberação e implantação.

Quais técnicas?

Entre elas destacamos:

  1. Arquiteura Multi-cloud: Espelhamento, Microserviços
  2. Pipeline CI/CD
  3. Análise da àrvore de falhas
  4. SPOF – Single Point of Failure
  5. CFIA – Análise de Impacto de Falha em Componentes
  6. Diagrama de Causa e Efeito
  7. Afinidade / KJ Diagrama (Jiro Kawakita)
  8. Votação Múltipla
  9. 6-3-5 Brainwriting
  10. Análise de Pareto
  11. Reversal Russa

2º Foco em Detecção e Correção

Quando incidentes não puderem ser evitados então devemos estar prontos para detectá-los preventivamente e corrigir quando não puderem ser prevenidos.

Como?

Investindo em observabilidade!

Através da monitoração e gerenciamento de eventos inteligente

A observabilidade permite praticamente uma visão 360ᵒ dos eventos e da performance que ocorrem em um sistema (aplicação, infraestrutura, processo) ou em um ambiente em que está sendo executado.

Lembre, toda empresa que quer ir para o futuro precisa ser saudável e não tolerar incidentes.

“Nos informe o tamanho do seu backlog de incidentes em TI que diremos quão doente está sua empresa e quão próximo do fim ela está”. Com o princípio do INCIDENTE ZERO, você pode ajudar sua empresa a curar-se, a se tornar saudável e mais relevante para o mercado e seus clientes.


Leave a Reply

Your email address will not be published. Required fields are marked *