Tag Archives: problem solving

Root Cause Analysis

Published by:

Il mese scorso abbiamo parlato di troubleshooting, cioè del processo a ritroso nella catena di cause ed effetti, che ha lo scopo di identificare la causa o le concause che ne sono alla radice. In queste tratteremo meglio il concetto di ricerca della cause alla radice del problema.

Nel precedente articolo di marzo si è visto che le situazioni veramente problematiche sono solo una minoranza rispetto al totale delle attività manutentive e pesano circa il 10%. In particolare, nel 9% di queste, possiamo giungere ad una soluzione positiva facendo di tecniche e metodologie di problem solving, adattate al campo manutentivo. Le metodologie utilizzate sono varie, ricalcano il concetto espresso dal ciclo di Deming nel PDCA. Facendo riferimento allo schema in sette passi descritto in figura, dopo aver superato le fasi iniziali del metodo, che hanno l’obiettivo di identificare il problema, passiamo all’analisi delle informazione, allo scopo di identificare la causa o le concause alla radice del problema.

Root Cause Analysis

L’analisi per risalire alle cause alla radice di un evento (guasto, difetto, incidente) è nota col nome Root Cause Analysis o, più brevemente, RCA: con essa si può, per esempio, indagare su quali sono le cause che provocano un incendio. Un efficace attività di Root Cause Analysis porta ad evidenziare la soluzione efficace (Effective Solution), deve essere in grado di identificare almeno una causa alla radice, controllabile e realizzabile ed in grado di soddisfare gli obiettivi.

Da dove si parte per identificare le cause e le cause di fondo? Possiamo partire dalle analogie degli effetti con problemi precedentemente apparsi, analizzati e possibilmente risolti (esperienza delle persone, documentazione disponibile). Ma occorre fare attenzione poiché a effetti uguali non corrispondono sempre cause uguali, in quanto occorre sempre considerare il contesto del problema. Per identificare le cause possiamo anche partire da considerazioni tecniche derivanti, per esempio, dalla conoscenza del progetto di un prodotto, del suo processo di fabbricazione, ovvero da conoscenze scientifiche su possibili correlazioni causa-effetto. E’ importante sottolineare che un effetto (evento, guasto, difetto) avviene se le cause alla sua origine si verificano nello stesso tempo, nelle stesse condizioni, nello stesso luogo. La RCA è un processo iterativo che, partendo dall’effetto, giunge alla definizione della causa o delle cause che lo originano, le quali, a loro volta, possono essere effetti di cause a livello superiore. In questo modo, procedendo per livelli di approfondimento sempre maggiori, giunge necessariamente alla definizione della o delle cause primarie alla radice dei problemi (effetti) evidenziati dal guasto. Sul tema RCA e problem solving sono stati messi a punto, a partire dagli anni novanta, diversi sistemi di analisi, come il metodo KT di Kepner e Tregoe, il Reason® di Decision System, Apollo® di Apollo Associated Services e TapRooT® di System Improvements.

Il metodo dei 5 “perché?”

Per risalire alla causa alla radice del problema si può utilizzare il metodo dei “5 perché?”. Questo dispositivo logico è stato introdotto nell’ottica dell’individuazione delle cause incerte sulle quali avviare una diagnosi. Con il metodo dei 5 perché è possibile risalire dall’effetto alle effettive cause di un evento. Il metodo è di una semplicità disarmante ed è forse per questo motivo che molti tecnici lo trascurano. Esso richiede soltanto che, con la curiosità di una scimmia e la purezza ideologica di un bambino, il gruppo si chieda il perché di un fatto, senza accontentarsi della prima risposta. Ecco alcuni suggerimenti per utilizzare in modo efficace questo metodo.

  • Non fermarsi fino a quando esiste ancora una possibilità di domandarsi perché.
  • Non accontentarsi di espressioni generiche (scorretto, sbagliato, rotto, ecc.), in quanto a ciascuno di questi aggettivi deve corrispondere un perché.
  • Porre massima attenzione alla precisione e all’attenzione ai dettagli.
  • Non sorvolare su risposte evasive.
  • Accertarsi che le spiegazioni siano comprese e condivise da tutti.
  • Il processo di ricerca “a ritroso”, dall’effetto noto alla causa o alle concause primarie, si considera chiuso solo quando si sia individuata la causa alla radice del problema (Root Cause).
  • Trovate le cause, il processo logico chiede comunque delle risposte e delle soluzioni (realizzabili e non, definitive e provvisorie).
  • Terminare ogni riunione con un rapporto scritto e letto in presenza di tutti i componenti del gruppo di lavoro.
  • Terminare ogni riunione con un piano con le attività da fare, le tempistiche, i controlli intermedi, i compiti e le responsabilità.

Per contrastare un’anomalia è possibile, una volta individuate le sue cause determinanti, decidere e realizzare delle azioni correttive a esse corrispondenti. L’esperienza dimostra però che spesso, al fine di una cura veramente efficace e duratura, è necessario risalire più a monte. Per esempio, contro l’effetto “consumo eccessivo di olio” potremmo decidere di rabboccare l’olio, il che costituisce un’azione provvisoria; si avrà un’azione correttiva soltanto eliminando la causa del consumo eccessivo, ossia sostituendo le fasce elastiche. Avendo individuato le cause di un problema, possiamo pensare a un intervento correttivo che comporti la loro riduzione o eliminazione. Ma occorre considerare che ciascuna di queste cause è a sua volta l’effetto di un’altra causa. È pertanto opportuno chiederci nuovamente: “Perché avviene questo?”, risalendo lungo la catena causa-effetto. Nell’esempio, se la risposta è: “Le fasce sono usurate perché il motore ha più di 100.000 Km, e ciò è normale a questo chilometraggio”, allora l’analisi è finita e possiamo agire definitivamente, sostituendole. Siamo infatti giunti alla causa alla radice del problema, cioè al livello ultimo in cui, nel procedere lungo la catena causa-effetto, possiamo situare l’intervento correttivo al fine di eliminare il problema iniziale. Se invece la risposta è: “Non sappiamo quali siano con sicurezza le cause di questo effetto”, bisognerà avviare una nuova analisi, che ci potrà portare a individuare le vere cause a un livello più vicino “alla radice”, con conseguente possibilità di interventi più radicali. In effetti, molti insuccessi, anomalie o disfunzioni si ripresentano perché l’azione correttiva è stata fatta a un livello di causa insufficiente per “sradicare” definitivamente il problema. È sradicando i problemi, ossia prevenendoli alla radice, che possiamo giungere a una soluzione duratura. Soffermiamoci un attimo per riflettere e capire quale fra questi interventi è opportuno scegliere ai fini di una maggiore efficacia. A questo punto si può fare una prima constatazione: più si scende verso la radice, lungo la catena causa-effetto, più tempo bisognerà dedicare alla ricerca. Spesso il passaggio da un livello all’altro non è cosi ovvio, e a volte occorre condurre un’analisi approfondita (seguita naturalmente da una verifica) per scendere di un gradino.

Altre conseguenze della causa

Nell’esempio precedente abbiamo considerato la catena causa-effetto come lineare. In realtà, la concatenazione è spesso di tipo “reticolare”. In effetti, lo scostamento dal quale siamo partiti nell’analisi, può essere solo una delle conseguenze della causa, e ce ne possono essere altre, già avvenute oppure imminenti. È quindi opportuno, partendo dalla causa rinvenuta, chiedersi: “Quali altre conseguenze può avere avuto questa causa”? e, anche: “Quali altre conseguenze può stare per avere, qui o presso il cliente?”. Allora chiediamoci: “L’acqua salata può aver provocato altri danni all’interno dell’alternatore?”, “La mancanza di energia può aver provocato qualche altro danno a bordo?”. Partendo dalla causa rinvenuta, cerchiamo di sfruttare fino in fondo il lavoro di analisi già fatto, e controlliamo quali altre conseguenze ci possono essere state. Se non si è esperti del ramo, è opportuno chiedere a uno specialista di controllare; per identificare le altre possibili conseguenze della causa (a livello di ipotesi d’effetto), le conoscenze tecniche e l’esperienza possono infatti svolgere un ruolo determinante. In questa indagine ci può venire in aiuto lo schema funzionale del sistema, ossia la descrizione di tutti gli organi incaricati di assicurare una certa funzione all’impianto o all’organizzazione, oppure il diagramma di flusso del processo.

Applicazione della RCA

La cellula base del processo di analisi RCA è costituita dallo schema base in cui un effetto (guasto/anomalia/incidente) può essere dovuto all’azione di due cause concorrenti: una azione ed una condizione.

In tal caso per un evento di guasto, visto come effetto primario, è possibile individuare una serie di azioni negative generate dall’operatore, dal sistema di controllo, dall’ambiente, .., che possono avere generato l’effetto segnalato; a queste si possono associare in alternativa o in aggiunta delle condizioni anomale (pressioni, temperature, .., ) rispetto alle condizioni considerate di normale funzionamento. Le metodologie di analisi degli incidenti identificano azioni ed agenti (persone, cose). La loro combinazione può portare ad un risultato non programmato (indicente, guasto, difetto): la vettura sbanda, la vettura è l’agente, lo sbandamento è l’azione; il cane scappa via, il cane è l’agente ed il suo correre è l’azione.

Fonte: Trasmissioni di Potenza (Ed. Tecniche Nuove), maggio 2015

Troubleshooting

Published by:

Col termine Troubleshooting si identifica il processo di ricerca ed analisi che lega l’accertamento di uno o più sintomi di un’avaria o di un malfunzionamento, con una o più possibili cause: si tratta quindi di un processo a ritroso nella catena di cause ed effetti, che ha lo scopo di identificare la causa o le concause che ne sono alla radice.

Uno studio condotto da una importante multinazionale evidenzia che le situazioni veramente problematiche sono (per fortuna) una minoranza rispetto al totale delle attività manutentive e pesano circa il 10%. In particolare, nel 9% di queste, possiamo giungere ad una soluzione positiva facendo di tecniche e metodologie di problem solving, adattate al campo manutentivo. Solo una parte minima (1%) richiede strumenti straordinari: la complessità e la gravità degli effetti di questi casi, che generalmente impattano pesantemente sulla qualità di un prodotto o sulla salute delle persone o dell’ambiente, devono essere affrontate in modo collegiale e coordinato (task force), in quanto coinvolgono più enti e persone all’interno di una Azienda. Nei casi più frequenti di un servizio di manutenzione, la situazione problematica si presenta quando, a fronte di un guasto abbastanza grave non esistono o non sono conosciute soluzioni efficaci e definitive. Per meglio dire, non esistono né procedure di troubleshooting né esperienze dirette del personale, oppure potrebbe capitare le immediate soluzione adottate dai tecnici, in base alle loro competenze, falliscono: problema!  Al fine di evitare confusione e panico è caldamente consigliabile affidarsi ad una metodologia, cioè ad una procedura logico-analitica di approccio al problema, attraverso la sequenza di azioni logicamente correlate di seguito elencate. Le metodologie utilizzate sono varie, ma abbastanza simili, in quanto tutte ricalcano il meraviglioso concetto espresso dal ciclo di Deming nel PDCA (*), e vengono generalmente descritte attraverso schemi a blocchi come quello descritto in figura (Metodo in sette passi). Con questo primo articolo analizzeremo le varie fasi descritte nel modello che abbiamo scelto, sottolineando che la letteratura tecnica ne presenta altri, che però non variamo in modo sensibile nelle logica. Cominciamo quindi con descrivere le fasi iniziali del metodo, che hanno l’obiettivo di identificare il problema.

Identificazione del problema

Il primo passo nel cammino che conduce alla ricerca e soluzione dei guasti consiste nella definizione del vero problema, quindi si deve sapere “che cosa” è successo prima di dire “perché” è successo. In genere, quando le persone riferiscono i problemi, i fatti raccontati possono essere incompleti, poco chiari e imprecisi in troppi dettagli. Tipicamente, si tende a riferire personali interpretazioni ai problemi visti: magari a queste si aggiungono le impressioni trasmesse da altre persone presenti. La situazione peggiora quando i problemi accadono durante il turno di notte o in giornate festive, per cui si possono solo leggere le annotazioni scritte dai testimoni senza poterli ascoltare direttamente. Possiamo distinguere alcune situazioni ricorrenti.

  • Problemi semplici: la loro identificazione necessita di semplici relazioni con l’operatore. Per esempio, l’operatore potrebbe riferire che il sensore di temperatura di un impianto è andato a zero e non si muove, l’indicatore di flusso oscilla, oppure si è acceso un allarme: si tratta di informazioni chiare e inequivocabili.
  • Problemi transitori e complessi: la raccolta dei sintomi può spaziare dall’indicazione chiara a quella vaga. Queste ultime possono non essere né concise né corrette e si possono avere troppe o troppo poche informazioni, magari viziate da pregiudizi o convinzioni.
  • Livello della comunicazione: quando si definisce il problema è opportuno ascoltare con cura la persona che riporta il fatto.

L’oggetto del rapporto consiste generalmente nella descrizione di sintomi e specifiche osservazioni, sulla base dei primi tentativi di soluzione di quel problema e sulla conoscenza e competenza di chi parla. Dopo avere ascoltato attentamente conviene fare domande chiare, brevi e precise. È meglio evitare di utilizzare termini troppo tecnici o forbiti: un buon ricercatore di guasti dovrebbe parlare e comprendere la lingua delle persone che operano in quella sede. Ciò significa conoscere il processo, il layout fisico dello stabilimento, la posizione degli strumenti e delle funzioni dell’impianto, non solo con il loro termine tecnico, ma anche secondo abbreviazioni e nomignoli comunemente usati in stabilimento (l’esperienza insegna che conoscere la forma dialettale o le corrispondenti parole in gergo aiuta molto nella comunicazione con gli addetti).

  • Interpretazione soggettiva: la persona che riporta un problema può introdurre nella sua descrizione delle interpretazioni personali. Quando non emerge chiaramente una causa del problema segnalato, l’esistenza di queste interpretazioni personali diventa evidente. Per esempio, un’interpretazione comune è che si trova sempre il guasto nello strumento, quando in effetti esiste un problema collegato al processo; in questo caso lo strumento riporta semplicemente le informazione che legge. Ci si può trovare di fronte a una valutazione soggettiva perché la persona che riporta l’informazione crede, per qualunque ragione, che un certo particolare di una macchina abbia causato il problema: molti casi pratici dimostrano che certe convinzioni portano fuori strada e che la soluzione sta altrove. Gli operatori che hanno troppa fiducia negli strumenti tendono a escludere altre informazioni: in questi casi è necessario imparare a distinguere il segnale vero ed essere sicuri di non subire interferenze. In buona sostanza, vale sempre la regola: “non dire mai più di quanto non si è sicuri di sapere”. Quando si definisce il problema è buona regola considerare il grado di generalità con cui si rapporta. Per esempio, un operatore potrebbe dire che una valvola di controllo è andata in avaria, dando così un preciso e ben definito oggetto sul quale investigare. Ma se lo stesso operatore dice che “c’è un problema sul livello nel serbatoio combustibile”, fornendo così una descrizione vaga, il guasto potrebbe essere causato da una serie di problemi, riguardanti il processo stesso. I problemi transitori capitano occasionalmente, si pensi per esempio al controllo di chiusura di una stazione di lavoro che si fa soltanto nel terzo turno. La bravura del buon ricercatore di guasti consiste nell’ordinare e distinguere, fra le varie informazioni, quelle che permettono di definire adeguatamente il problema. La descrizione del problema fornisce il punto di partenza per la raccolta dati. Se non si conosce da dove partire, si può essere sommersi da troppi dati e informazioni, spesso sbagliati, e perdere di vista quelli giusti.

Riparazione provvisoria (Quick Fix)

Molto spesso sono indispensabili azioni immediate e provvisorie di riparazione e di rimessa in servizio di una macchina (quick fix), al fine di “tamponare” situazioni critiche o di emergenza, al fine di velocizzare la ripresa di un processo produttivo o di un servizio o per limitare eventuali danni a cose e persone. Non sono secondarie, anzi fanno parte della normale attività di un servizio di manutenzione: richiedono elevata professionalità, capacità di rapida analisi della situazione e resistenza allo stress. L’efficacia di un’azione di tamponamento si basa su più fattori: esperienza, strumentazione, training. L’esperienza è sicuramente una carta vincente nella ricerca guasti: si tratta di ritrovare un problema già vissuto, di cui si pensa di conoscerne la soluzione. La eccessiva fiducia sull’esperienza, però, può ridurre la capacità di vedere oltre e comprendere a fondo e completamente un fenomeno. Nondimeno investire in strumentazioni di diagnostica evolute consente di velocizzare la fase di ricerca ed identificazione di sintomi e degli effetti di un guasto e quindi di porli in immediata correlazione con le probabili cause alla radice.

In generale, comunque, l’addestramento continuo del personale, la formazione sulle modalità di individuazione e riparazione, sia provvisoria che definitiva, dei guasti, anche attraverso la simulazione di casi reali, costituiscono la forma più efficace di training, forza e patrimonio delle aziende meglio organizzate

PDCA

Il ciclo (virtuoso) di Deming o PDCA è un modello studiato per il miglioramento continuo della qualità in un’ottica a lungo raggio. Serve per promuovere una cultura della qualità che è tesa al miglioramento continuo dei processi e all’utilizzo ottimale delle risorse. Questo strumento parte dall’assunto che per il raggiungimento del massimo della qualità sia necessaria la costante interazione tra ricerca, progettazione, test, produzione e vendita. Per migliorare la qualità e soddisfare il cliente, le quattro fasi devono ruotare costantemente, tenendo come criterio principale la qualità. La sequenza logica dei quattro punti ripetuti per un miglioramento continuo è la seguente:

P – Plan (Progettazione e pianificazione)

D – Do (Esecuzione del programma, dapprima in contesti circoscritti)

C – Check (Test e controllo, studio e raccolta dei risultati e dei riscontri)

A – Act (Azione per rendere definitivo e/o migliorare il processo (estendere quanto testato dapprima in contesti circoscritti all’intera organizzazione)

Fonte: Trasmissioni di Potenza (Ed. Tecniche Nuove), marzo 2015

Ishikawa or 5-Why – Which do you prefer for Root Cause Analysis?

Published by:

Discussione sulla RCA, proposta e pubblicata su LinkedIn da  Daniel Uebbing

Il diagramma di Ishikawa è il metodo più popolare per l’analisi delle cause, perché causa principale ed effetto sono presentate in modo conciso. Quali sono i vantaggi?

  • Ottimo metodo per la raccolta dettagliata delle cause principali
  • Presentatione delle inter relazioni
  • Chiara presentazione grafica
  • Elaboratione visuale delle cause alla radice
  • Secondo l’analisi delle cause è possibile avviare misure sostenibili
  • Strutturazione generale dei processi
  • Apprendibilità

Ma non bisogna ignorare il metodo dei 5-Perché per l’analisi delle cause. Il metodo 5-Perché viene utilizzato in qualità in tutto il mondo e soprattutto è aggiuntivo al metodo Ishikawa. L’uso di 5-perché è semplice e conveniente soluzione per economizzare le risorse interne.

Quali sono i vantaggi per riprodurre tutte le procedure amministrative necessarie all’interno di un software?

  • E’ possibile avviare misure sostenibili fuori dalla analisi delle cause
  • Per avere un processo standard all’interno della società per la documentazione del CIP Workshop e misure sostenibili.
  • Si garantisce la totale trasparenza di tutte le azioni nell’ambito del processo di miglioramento continuo
  • Si effettua una panoramica a disposizione di tutte le attività presenti
  • Siete sostenuti da un sistema di promemoria che assume la e-mailing automatica di promemoria, e vi sostiene per garantire il completamento contemporaneo di misure
  • Si dispone di una panoramica di tutte le attività che rimangono ancora da completare

D.Uebbing