Análise de Causa Raiz (RCA)
Identificar a causa raiz de um evento para evitar sua recorrência
flexM4I > abordagens e práticas > análise de causa raiz (RCA) (versão 2.4)
Editado por Giovana Leme (giovanaleme@usp.br) e Henrique Rozenfeld (roz@usp.br).
Conteúdo desta página
- 1 Descrição resumida
- 2 Terminologia utilizada
- 3 Quando você deveria utilizar esta prática?
- 4 Por que você deveria utilizar esta prática?
- 5 Escopo e extensão de uma análise de causa raiz
- 6 Atividades genéricas
- 7 Dicas e cuidados gerais
- 8 O que está relacionado com esta prática
- 9 O que fazer a seguir?
- 10 Informações adicionais
- 11 Referências
Descrição resumida
Vamos inicialmente resgatar do nosso glossário uma das definições do que é uma causa raiz.
Uma causa raiz é definida como um fator que causou uma não conformidade e que deveria ser permanentemente eliminada por meio de um processo de melhoria (ASQ, 2022)
No caso da Análise de Modos de Falha e seus Efeitos (FMEA), causas são os eventos ou estados que provocam os modos de falha. Como são causas potenciais para falhas potenciais, o tempo verbal não é no passado, como na definição da ASQ. Podemos utilizar métodos de análise de causa raiz na definição de causas durante o desenvolvimento de um FMEA. |
A análise de causa raiz ou root cause analysis (RCA) é um termo que descreve um conjunto de abordagens, métodos, ferramentas e técnicas utilizados para descobrir as causas raízes de eventos.
Evento
O termo “evento” é utilizado para identificar, genericamente, as ocorrências que produzem ou têm potencial de produzir problemas e impactos negativos relacionados com segurança, saúde, meio ambiente, qualidade, confiabilidade e produção resultante das operações dos processos, assim como dos produtos e serviços.
Quando um evento ocorre, pode existir uma cadeia de relações de causa-efeito que provocam este evento, ou seja, uma hierarquia de causas / efeitos / eventos de vários níveis. Se este evento for um problema que você queira resolver, é importante identificar esta cadeia de relações até chegar em uma ou mais causas raízes. Os eventos intermediários são efeitos de causas mais fundamentais e ao mesmo tempo causas de outros efeitos.
Faz parte de abordagens
A RCA faz parte do conjunto de práticas da gestão da qualidade total (TQM – total quality management) e suas variações, como o six-sigma. Ainda é uma prática atual, pois sempre temos de identificar causas raízes para solucionar problemas detectados. Aplicar a análise de causa raiz é incorporada na gestão de melhoria contínua da qualidade.
A análise de causa raiz também é uma das práticas da gestão de riscos, quando se deseja prevenir possíveis riscos (veja o tópico análise de causa raiz e gestão de riscos mais adiante).
Geralmente, a RCA está inserida em um contexto mais amplo de resolução de problemas e tomada de decisão. A RCA identifica a(s) causa(s) raiz(es), que recebe um tratamento de priorização e solução posteriormente.
Integrar com processos de resolução de problemas
Só a RCA não produz resultados, ela deve estar integrada a métodos de resolução de problemas para a melhoria da qualidade no seu sentido mais amplo, que tem consequências na melhoria da produtividade e, em última análise, da competitividade.
Alguns autores e manuais denominam RCA uma prática específica. Mas como dissemos, a RCA engloba um conjunto de métodos, ferramentas e técnicas para análise da causa raiz.
Se na sua empresa você adota uma das técnicas específicas de RCA e a denomina de técnica de RCA não é nenhum problema, pois todas as práticas listadas a seguir são de análise da causa raiz. |
Na flexM4I temos seções separadas para as seguintes práticas de RCA e complementares:
- 5 por quês (5 whys)
- Diagrama de Ishikawa (ou de espinha de peixe; causa e efeito)
- Análise de eventos e fatores causais
- Diagrama de Pareto: não é uma ferramenta de construção das relações causais, mas de priorização
- Matriz GUT (Gravidade, Urgência e Tendência): não é uma ferramenta de construção das relações causais, mas de priorização
Outras práticas, que ainda não estão sistematizadas na flexM4I, estão listadas no tópico “o que está relacionado com esta prática”.
Terminologia utilizada
Como a análise de causa raiz é aplicada em várias áreas de conhecimento, é normal que alguns termos tenham significados semelhantes. Neste tópico procuramos alinhar seus significados.
Para problemas, incidentes e ocorrências mais simples podemos trabalhar com relações de causa-efeito com os seguintes elementos (veja a próxima figura):
- sintomas são sinais que indicam que existe um problema
- causas que resultam no problema e que são efeitos de causas intermediárias
- causas intermediárias, que provocam efeitos e podem ser efeitos outras causas intermediárias ou mesmo de causas raízes
- as causas fundamentais são as causas raízes
Figura 732: esquema gráfico para representar a árvore de causa e efeito
Esses são os termos normalmente utilizados na aplicação das práticas: 5 por quês (5 whys), diagrama de Ishikawa (diagrama de causa e efeito).
No diagrama de Ishikawa o formato gráfico é outro (ver a seção correspondente). Também podemos representar este diagrama hierárquico de causa e efeito por meio de um desdobramento hierárquico, como mostra a próxima figura.
Figura 733: desdobramento hierárquico para representar relações de causa e efeito
Para problemas, incidentes e ocorrências mais graves podemos trabalhar com os seguintes elementos (veja a próxima figura):
- uma sequência de eventos, que vão sendo interligados conforme a investigação da ocorrência avança;
- testes lógicos ou temporais (TL): são usados para rastrear como foram os acontecimentos; em alguns diagramas esses testes são operações booleanas e nos mais complexos (como o MORT) indica mais operações lógicas que levaram aos eventos;
- questões e condições (Q+C): as questões são geralmente registradas no diagrama para serem esclarecidas e para identificar que novos dados são necessários na investigação relacionados com aquele evento associado; as condições são registradas na versão final do diagrama de investigação, que resultaram em novos eventos ou nas condições que levaram à ocorrência daquele evento (se forem hipóteses, tornam-se teste lógicos a serem comprovados com evidências);
- seleção de fatores causais entre os eventos;
Um fator causal é um acontecimento (um erro humano, falha de componente, material etc.), que se fosse eliminado, iria prevenir a ocorrência do problema (ou de vários eventos que levam ao problemas) ou diminuir a severidade do problema, falha etc. |
- identificação das causas raízes com base na análise das razões de ocorrência dos fatores causais.
Figura 734: esquema de uma análise de eventos e fatores causais.
Esses são os termos normalmente utilizados na aplicação da prática de análise de eventos e fatores causais, FTA (failure tree analysis), ETA (event tree analysis), MORT (management oversight and risk tree), técnica bow tie e outras.
FTA (failure tree analysis)
O FTA (failure tree analysis) ilustrado na próxima figura, utiliza operadores da lógica booleana para conectar os eventos.
Figura 542: árvore de análise de falhas (FTA)
Fonte: Fault tree analysis – Wikipedia
MORT (management oversight and risk tree)
O MORT adicionou vários outros operadores, tornando-se mais geral do que o FTA. O diagrama MORT básico está ilustrado na próxima figura.
Figura 736: diagrama básico MORT da árvore de investigação de acidentes
Fonte: Ferry (1988)
Na próxima figura está ilustrado um diagrama que apresenta os principais tipos de eventos que podem ser analisados com o MORT.
Figura 737: principais tipos de eventos que podem ser analisados com o MORT (management oversight and risk tree)
Fonte: Knox & Eicher (1992)
Termos da árvore da realidade atual
Na ferramenta da árvore da realidade atual (ARA), são utilizados os efeitos indesejados (EI), que representam disfunções do negócio, e causas raízes. Os EIs de mais alto nível são os sintomas mais aparentes ou resultantes de toda a árvore, que são os efeitos principais. Todos os outros efeitos indesejáveis são chamados de efeitos intermediários.
Veja que coincidência que tanto um efeito indesejável como um efeito intermediário poderiam ser representados pelo mnemônico EI. Mas o EI indica um efeito indesejável.
Veja a próxima figura.
Figura 735: esquema de uma árvore da realidade atual (ARA)
Na verdade, na teoria da ARA, parte da teoria das restrições, só deveria existir uma causa raiz e não múltiplas. Além disso, apesar do título “árvore”, as inter relações entre os EIs formam uma rede.
Quando você deveria utilizar esta prática?
- A ideia é utilizar da análise de causa raiz sempre que um evento não ocorrer como o esperado, ou seja, a ocorrência de um problema, seja ele grave ou não, deve estar seguida da determinação de seus motivos e possíveis soluções;
A RCA pode ser realizada para:
- satisfazer uma exigência burocrática que não agrega valor. É uma aplicação entediante, depois do evento, de preenchimento de formulários, que não muda os resultados do trabalho
- descobrir uma vulnerabilidade de um processo, produto ou serviço. É quando um time se reúne para mudar os processos e evitar que o problema ocorra novamente, prevenindo assim consequências futuras negativas. Neste caso é uma atividade motivadora e criativa.
Qual é o seu caso? Esperamos que seja pelo segundo motivo.
Por que você deveria utilizar esta prática?
- Definição assertiva de problemas;
- Identificação das possíveis causas de um problema;
- Identificação de possíveis soluções para os problemas;
- Escolha e implementação sistemática de soluções para problemas;
- Evitar a recorrência de um problema;
- Com o tempo, as causas raízes identificadas, entre tantas ocorrências, trazem oportunidades para se realizar melhorias mais significativas nos processos;
- Nas análises quantitativas podemos calcular o grau de severidade a probabilidade de ocorrência dos eventos (normalmente falhas)
Escopo e extensão de uma análise de causa raiz
A duração de uma RCA pode variar muito, como em:
- poucos dias para realizar uma análise limitada à solução de um problema bem específico, que pode ser resolvido pela mudança de uma prática com falha.
- algumas semanas quando a análise envolve um time e problemas mais complexos
- meses, se os problemas forem muito complexos, quando as soluções exigirem grandes investimentos
Um tipo especial de RCA ocorre nos casos de acidentes com danos graves à infraestrutura e pessoas, resultando em ferimentos graves e até mortes. É o caso de acidentes aéreos e marítimos, indústrias de infraestrutura (fornecimento de energia etc.), em usinas atômicas, quebra de barragens etc. Nesses casos, a análise se torna uma investigação do tipo policial. O resultado desta análise é um relatório, normalmente extenso, que deve ser realizado para evitar ocorrências do mesmo tipo no futuro.
Atividades genéricas
Como existem muitas ferramentas para se realizar a análise de causa raiz, vamos listar aqui somente as atividades genéricas. Consulte as atividades de uma ferramenta em particular para conhecer as atividades específicas da ferramenta adotada.
- Definir o problema
- Montar uma equipe para realizar a análise
- Coletar os dados
- Montar o(s) diagrama(s): identificar os eventos, efeitos, causas etc. Pode ser que no decorrer da realização desta atividade, você tenha que coletar dados adicionais.
- Identificar a(s) causa(s) raiz
- Recomendar ações para evitar a recorrência do problema, incidente, falha ou acidente
- Implementar as soluções: apesar de ser listada com última atividade da análise de causa raiz, esta atividade, em geral, faz parte de um outro método mais amplo de resolução de problemas
Se a análise chegou a recomendações vagas, do tipo “faça com que as pessoas sigam os procedimentos”, provavelmente você não encontrou a causa raiz e deve explorar mais. |
Dicas e cuidados gerais
Na apresentação das ferramentas específicas você pode ver as premissas, dicas e cuidados dessas ferramentas. Aqui apresentamos dicas gerais.
- Dê preferência em trabalhar em time, pois a multiplicidade de visões e experiências traz sempre melhores resultados;
- Mantenha o foco em corrigir e tratar as causas raízes e não apenas os efeitos intermediários / sintomas;
- No entanto, a correção de algumas causas raízes podem ser demoradas. Assim, procure quick wins, ganhos rápidos, atacando problemas e efeitos intermediários. Mas não esqueça. Sem resolver a causa raiz, o problema pode voltar a ocorrer;
- Apesar do nome desta abordagem ser “análise de causa raiz”, o que dá a conotação que existe somente uma causa, normalmente, existem diversas causas raízes associadas aos eventos em análise;
- Procure encontrar como e por que algo aconteceu; não foque em descobrir quem foi o responsável para poder punir.
O que está relacionado com esta prática
Como já citado da descrição resumida, as práticas de RCA existentes no repositório de práticas da flexM4I que são semelhantes ou complementares:
- 5 por quês (5 whys)
- Diagrama de Ishikawa (ou de espinha de peixe; causa e efeito)
- Análise de eventos e fatores causais
- Diagrama de Pareto: não é uma ferramenta de construção das relações causais, mas de priorização
- Matriz GUT (Gravidade, Urgência e Tendência): não é uma ferramenta de construção das relações causais, mas de priorização
Na versão atual da flexM4I, não tratamos das seguintes práticas, que também podem ser utilizadas para análise de causa raiz:
- Análise de mudanças: é uma técnica de análise de causa raiz que se concentra em um problema específico ou evento problemático. Esse tipo de análise busca expor qual desvio do procedimento regular, ou mudança, resultou no evento desfavorável. Este é o tipo de análise utilizada pelo pessoal de manufatura ao analisar mudanças.
- Diagrama de dispersão: representa o relacionamento entre duas variáveis com o objetivo de determinar a relação de causa e efeito entre elas. Pode ser usado de forma complementar à análise de causa raiz.
- Análise da árvore de risco: é usada para analisar os efeitos de um sistema com falha após a ocorrência de um evento adverso.
- Análise de barreiras: é um processo sistemático usado para identificar falhas de barreiras físicas, administrativas e processuais, que deveriam ter impedido a ocorrência de um evento adverso. Esta análise identifica por que as barreiras falharam e determina quais tipos de ações corretivas são necessárias para evitar que as barreiras falhem novamente no futuro.
- Árvore da realidade atual: mais apropriada para diagnóstico mais amplo de disfunções de um negócio, quando as causas e efeitos de diversas categorias estão interrelacionados.
- MORT (management oversight and risk tree): é um método antigo para investigação de acidentes, que são definidos como eventos não planejados que produzem prejuízo ou dano, ou seja, perdas. As perdas ocorrem quando um agente nocivo entra em contato com uma pessoa ou um ativo. Esse contato pode ocorrer devido a uma falha de prevenção ou, como resultado infeliz, mas aceitável, de um risco que foi devidamente avaliado e tratado (o chamado “risco presumido”). A análise MORT sempre avalia a rota de “falha” antes de considerar a hipótese de “risco assumido”. Na análise MORT, a maior parte do esforço é direcionado para identificar problemas no controle de um trabalho/processo e deficiências nas barreiras de proteção associadas a ele. Esses problemas são então analisados por suas origens no planejamento, design, política, etc. (ver informações adicionais).
- Análise de causa raiz baseada em dados: utilizada em equipamentos com coleta de dados por meio de sensores. É a aplicação de analytics e big data para poder cruzar muitos parâmetros de processo e descobrir correlações (ver informações adicionais).
- Método Kepner-Tregoe: é um método estruturado de gestão racional dividido em quatro partes: avaliação da situação; análise de problemas (que inclui a análise de causa-efeito); análise de decisão (tomada de decisão) e análise de problemas e oportunidades potenciais (futuro). Este método é bem antigo e vem sendo atualizado pela consultoria Kepner-Tregoe. É conhecido também como método de resolução de problemas e tomada de decisão ou particularmente de método K-T (veja as informações adicionais).
- Análise da árvore de falhas (FTA – failure tree analysis): é uma ferramenta dedutiva com a finalidade de descobrir causas raízes. Geralmente inicia-se com um efeito específico (efeito indesejado) e se desdobra em diferentes blocos que mostram as relações entre os eventos e falhas. É usado para entender como os sistemas podem falhar, identificando maneiras de reduzir o risco e as taxas de eventos de um acidente de segurança ou de um sistema fracassar. Sua representação gráfica é uma árvore de conectores lógicos com as probabilidades em cada nó para que se possa calcular a probabilidade da ocorrência da falha.
- Análise da árvore de eventos (ETA – event tree analysis): A análise da árvore de eventos é uma técnica de modelagem lógica avançada, de cima para baixo, tanto para o sucesso quanto para a falha, que explora as respostas por meio de um único evento inicial e estabelece um caminho para avaliar as probabilidades dos resultados e a análise geral do sistema
Tanto a FTA e a ETA são técnicas usadas na gestão de riscos para se entender as causas (FTA) e as consequências (ETA) de uma falha e as probabilidades de ocorrência. Veja uma lista ampla de técnicas utilizadas na gestão de riscos, extraídas da norma ISO/IEC 31010, no tópico “ferramentas para gestão de riscos”. Essas duas ferramentas podem ser usadas de forma integrada na construção da técnica bow tie.
A seguinte prática pode ser usada de forma complementar à RCA.
- FMEA (failure mode and effect analysis): a análise do do modo e efeito de falha é uma ferramenta usada para se prevenir a ocorrência de falhas potenciais em projetos (DFMEA onde o D significa design) ou em processos ( PFMEA onde o P significa processo). Existe ainda a extensão FMECA, que acrescenta o C com o significado de análise crítica. O lean design propôs ainda uma aplicação mais específica desta ferramenta, a DRBFM (design based on failure mode). Em um primeiro momento, parece que esta ferramenta não está relacionada com a RCA. Porém, as duas podem ser utilizadas de forma integrada. A RCA olhando para o passado e a FMEA para o futuro. Ou seja, os conhecimentos adquiridos com a aplicação da RCA devem ser sistematizados no desenvolvimento de novas soluções, que seriam avaliadas por meio da FMEA (veja informações adicionais).
O que fazer a seguir?
Depois de identificar as causas raízes e definir as recomendações, precisamos implementar as ações, que exigem desenvolvimentos específicos de acordo com a natureza das ações. E antes disso, essas ações precisam ser priorizadas.
Para isso, podemos utilizar os seguintes métodos de priorização:
- Matriz GUT (gravidade, urgência e tendência)
- Matriz de causa e efeito: utilizada para priorizar as causas potenciais (ou identificadas e que merecem ações corretivas) que devem ser tratadas posteriormente. Tipicamente, a matriz é utilizada após a aplicação do diagrama de Ishikawa (veja as informações adicionais).
- Matriz de risco: é uma ferramenta simples para se calcular de forma subjetiva a probabilidade e o impacto de um risco, que deve ter sido identificado anteriormente pela análise de causa e efeito, com o objetivo de priorizar as ações de correção (veja as informações adicionais).
Informações adicionais
Vida de produto
Este blog tem um post em português que apresenta os passos genéricos para se realizar a RCA e indica ainda as seguintes ferramentas de análise de causa raiz. https://vidadeproduto.com.br/analise-de-causa-raiz/
- 5 por quês (5 whys)
- gráfico de Pareto
- diagrama de Ishikawa
- diagrama de dispersão
- análise de árvore de falhas (FTA fault tree analysis)
ASQ
A ASQ (American Society of Quality) possui varias publicações, videos, seminarios sobre qualidade. O post “What is root cause analysis (RCA)?” traz um resumo sobre o assunto e links para outras fontes de informação. Disponível em https://asq.org/quality-resources/root-cause-analysis Acesso em 5/8/2022.
Seguem referências para você acessar informações adicionais sobre métodos e ferramentas que podem ser classificadas como de análise de causa raiz (RCA)
Matriz de causa e efeito
O post da Voitto é bem simples e didático ao apresentar a matriz de causa e efeito. https://www.voitto.com.br/blog/artigo/matriz-de-causa-e-efeito
Os dois vídeos a seguir apresentam os principais conceitos da matriz de causa e efeito. Repare a diferença entre os dois:
- o primeiro mostra uma matriz que correlaciona mais de um efeito (Y) com as variáveis (X) e faz uma ponderação composta para priorizar as variáveis (ações)
- o segundo destaca somente um problema (Y) e cria uma tabela com duas colunas para ponderar o impacto das ações vezes a dificuldade de implementação
E ambos são intitulados de matriz de causa e efeito, o que mostra a flexibilidade de aplicação desta ferramenta.
https://www.youtube.com/watch?v=RtfNobvRNoY
https://www.youtube.com/watch?v=RtfNobvRNoY
Matriz de risco
É uma ferramenta simples e muito popular e, por isso, existe muita informação sobre ela na web, selecionamos as seguintes:
https://qualyteam.com/pb/blog/matriz-de-risco/
https://ferramentasdaqualidade.org/matriz-de-riscos-matriz-de-probabilidade-e-impacto/
FTA (failure tree analysis)
A wikipedia em inglês traz um verbete muito bom com a síntese da FTA: https://en.wikipedia.org/wiki/Fault_tree_analysis
O blog vida de produto apresenta um post muito completo, em português, sobre FTA https://vidadeproduto.com.br/analise-da-arvores-de-falhas/
FMEA (failure mode and effect analysis)
Acesse a seção da flexM4i sobre FMEA – Análise de Modos de Falha e seus Efeitos.
O post de Mark Galley do site sobre confiabilidade mostra a sinergia que existe entre a FMEA e a RCA. https://blog.thinkreliability.com/how-are-fmea-and-rca-connected
MORT (management oversight and risk tree)
Leia mais sobre MORT em http://icma.org.uk/06-9_mort.html Acesso em 8/8/2022.
Este é um manual de MORT de 1992 https://www.osti.gov/servlets/purl/5254810/ do DOE (department of energy) dos USA.
Oliveira et al. (2022) aplicou o MORT na área de gestão de riscos para cadeia de suprimentos
Análise de causa raiz baseada em dados
Tableau
O tableau é uma plataforma de análise de dados que pode ser utilizada para RCA. https://www.tableau.com/pt-br/learn/articles/root-cause-analysis
Neste post do tableau podemos observar a definição geral da análise de causa raiz, com sua exemplificação de aplicação por meio dos diferentes métodos, dentre eles:
- 5 por quês (5 whys);
- análise de mudanças e
- diagrama de ishikawa.
Sua leitura permite classificar os objetivos, benefícios e princípios básicos de uma análise de causa raiz geral, além de definir as distinções entre o uso e o resultado obtido por cada um dos métodos descritos.
Visplore
Leia mais sobre este assunto sobre o Visplore, um software para apoiar a análise de causa-efeito baseada em dados:
https://visplore.com/feature/root-cause-analysis/
https://visplore.com/documentation/v2021b/gettingstarted/01_start_exploring.html
Data quality pro
Neste portal, são apresentadas 10 técnicas para se realizar análise de dados de qualidade. São destacadas as seguintes práticas:
- matriz causa-efeito
- 5 por quês (whys)
- diagrama de Pareto
- diagrama de Ishikawa
https://www.dataqualitypro.com/blog/10-techniques-for-data-quality-root-cause-analysis
Método Kepner-Tregoe
Recomendamos a leitura do livro Kepner & Tregoe (2013).
A empresa de consultoria que dá continuidade e expande este método é a Kepner-Trogoe Consulting. https://kepner-tregoe.com/
Referências
Ferry, Ted S., Modern Accident Investigation and Analysis, second edition, John Wiley and Sons, 1988.
Knox, N. W., & Eicher, R. W. (1992). Mort User’s Manual: For use with the Management Oversight and Risk Tree analytical logic diagram (No. DOE/SSDC-76-45/4-Rev. 3; SSDC-4-Rev. 3). EG and G Idaho, Inc., Idaho Falls, ID (United States). System Safety Development Center.
Kepner, C. H., & Tregoe, B. B. (2013). The new rational manager: An updated version for a new world. Kepner-Tregoe, Inc., Princeton, New Jersey
Oliveira, U. R., dos Santos, C. O., Chaves, G. E. L., & Fernandes, V. A. (2022). Analysis of the MORT method applicability for risk management in supply chains. Operations Management Research, 0123456789. https://doi.org/10.1007/s12063-021-00248-2