Il guasto: analisi e misura

L’esigenza di intervenire in modo veloce ed efficace dipende dalla professionalità del manutentore: in questo articolo analizzeremo alcuni aspetti legati al guasto ed alcuni noti indicatori necessari per la sua misura.

Definizione di guasto

Il guasto è la condizione di non realizzazione dello stato desiderato di funzionamento, ovvero, come recitano le norme UNI, la “cessazione dell’attitudine di un’entità ad eseguire la funzione richiesta”. La norma definisce inoltre come “avaria” lo “stato di un’entità, caratterizzato dalla sua inabilità ad eseguire una funzione richiesta”. Si deduce che il guasto è un evento, un passaggio da uno stato di buon funzionamento  ad un altro che non rispetta le prestazioni attese, mentre l’avaria è uno stato, una situazione stazionaria, in cui l’entità non è assolutamente in grado di operare. Il termine guasto corrisponde a failure in inglese e défaillance in francese, mentre avaria diventa rispettivamente fault e panne.

Entità

Nelle due precedenti definizioni si fa riferimento al termine entità, di cui abbiamo ovviamente una definizione ufficiale, riportata nella norma UNI 9910, che la definisce in questo modo: “ogni parte, componente, dispositivo, sottosistema, unità funzionale, apparecchiatura o sistema che può essere considerata individualmente”. Quindi un’entità, per la quale valgono anche i sinonimi “elemento” e “bene”, è tutto ciò che può essere descritto e considerato in modo individuale, sia che si tratti di un’attività, un processo, un prodotto, ma anche di un’organizzazione, un sistema, una persona o un gruppo. Nel campo della manutenzione, a un’entità può essere attribuito un valore economico, sociale o anche artistico, come per esempio impianto, linea, sistema e macchina, gruppo funzionale, assieme, sottoassieme, componente oggetto dell’attività di manutenzione. Il linguaggio tecnico anglosassone come al solito semplifica la terminologia, utilizzando due termini ben noti: equipment ed item, senz’altro più noti e diffusi del nostro “entità”!

Guasti di un’entità

Tutte le cose prodotte dall’uomo sono soggette a guasto, per quanto siano ben costruite e affidabili: si tratta solo di definire quando e come si guasteranno nel corso della loro vita utile. Capire come un guasto accade è la caratteristica principale dell’attività di ricerca dei guasti. Capire quando un guasto accade, o quando potrebbe accadere, è la caratteristica principale della manutenzione preventiva. Un guasto può accadere a fronte della rottura, o avaria, di un componente, coinvolgendo la struttura (hardware) dell’oggetto, oppure per un errore di programma (software), oppure per un errore umano. Un sistema può sempre avere un difetto funzionale quando, pur lavorando regolarmente, è chiamato a fare qualcosa per cui non è stato progettato oppure è esposto a condizioni transitorie che causano il momentaneo guasto. La prima attività nella ricerca guasti consiste nel trovare che cosa si è rotto, in modo da ripararlo e renderlo di nuovo disponibile. Ciò significa conoscere le condizioni operative di un processo e identificare la causa principale del guasto. Le origini di un guasto possono poi derivare da cause interne oppure da cause esterne. Se la causa è interna a un componente, questa ne è generalmente anche la causa principale; nel momento in cui il componente sarà riparato o sostituito, il problema sarà conseguentemente risolto. Se il problema capita troppo spesso, l’affidabilità del componente viene messa in discussione, per cui bisogna ricercare un’altra causa all’origine dell’avaria. Tale situazione porta a iniziare una fase importantissima di analisi nota con il termine di problem solving che, attraverso vari strumenti e metodologie mutuati dalla Total Quality, portano all’identificazione della, o delle, cause prime all’origine di una situazione problematica. Essa è nota anche con la sigla RCA (Root Cause Analysis), ossia analisi di ricerca della radice dei problemi. Se invece la causa è esterna al componente, i motivi del guasto non sono così ovvi: infatti, anche se possiamo ancora riparare o sostituire il componente fuori uso, dobbiamo necessariamente cercare la radice del problema in modo da non ricadere nello stesso problema.

Ciclo di vita

Il ciclo di vita dei componenti elettronici e meccanici segue la ben nota curva di affidabilità o probabilità di guasto, detta a vasca da bagno (bathtub curve). La curva può essere divisa in tre fasi: il periodo iniziale  (infanzia o rodaggio), il periodo di vita utile e il periodo finale o  vecchiaia. Il periodo iniziale è caratterizzato dal fenomeno della mortalità infantile, che appunto si riscontra all’inizio della vita operativa di un componente, normalmente nelle prime settimane o nei primi mesi, generalmente nel periodo di messa a punto e collaudo di un nuovo impianto.

I problemi nascono principalmente da difetti sui materiali, di lavorazione delle parti e di montaggio durante l’installazione, ma possono derivare spesso da errori nella conduzione e nella manutenzione, causati generalmente dall’inesperienza del personale: in particolare proprio nella fase iniziale di uso di un nuovo processo si possono evidenziare veri e propri errori di progettazione. Molti difetti di lavorazione vengono rilevati prima del montaggio della macchina presso il cliente, attraverso prove e collaudi eseguiti dal fornitore nelle fasi fondamentali del suo processo di fabbricazione. Gli errori di montaggio sono più difficili da controllare e possono essere ridotti attraverso ispezioni e tabelle di controllo definite in specifiche procedure operative. La seconda fase della vasca da bagno corrisponde al periodo di vita utile nel quale il tasso di guasto casuale rimane costante: il fatto che il tasso di guasto resti basso deriva da una efficace politica di manutenzione svolta dall’utilizzatore. La terza fase della curva vede poi un progressivo aumento della probabilità di guasto, a causa della crescente obsolescenza fisica e tecnica delle entità: un gruppo o un componente che entra in questa può comunque essere revisionato e recupera la propria affidabilità, prolungando in genere la propria vita utile.

KPI

Gli indicatori chiave delle prestazioni (noti anche con l’acronimo kpi – key performance indicator) sono utili per descrivere e comprendere i fenomeni tecnici e organizzativi durante un guasto di un’entità e stabilire quindi la misura dell’affidabilità durante il periodo di vita utile. I principali kpi utilizzati sono i seguenti:

MTTF (Mean Time To Failure): questo indicatore indica il tempo di vita operativa medio di un’entità non riparabile: è l’inverso del tasso di guasto (1/τ) nel periodo considerato.

Il MTTF non è legato alla vita utile dello strumento, che è il tempo che intercorre tra la fine del periodo di mortalità infantile e quello di logoramento. Un sistema potrebbe avere un MTTF di 100.000 ore, ma una vita utile di soli 3 anni. Ciò significa che, durante i 3 anni di vita utile, è improbabile che il componente si rompa, così come potrebbe rompersi rapidamente una volta che entri nel periodo di logoramento. Per illustrare la differenza fra MTTF e vita utile, consideriamo che, per gli esseri umani, il tasso di mortalità nei primi 30 anni è stimato pari a 1,1 morti per 1.000 persone all’anno, il che equivale ad avere un MTTF pari a 909 anni. Questo è molto più del tempo di vita utile di un uomo che, in genere, è inferiore ai 100 anni. In altre parole, gli esseri umani sono delle macchine molto affidabili nei primi 30 anni di vita, ma successivamente, con l’avanzamento dell’età, la loro affidabilità decresce rapidamente. Un altro esempio pratico lo si ritrova sul disco rigido di un computer fornito di un MTTF di un milione di ore, ma con una vita utile di soli 5 anni. All’interno della sua vita utile il disco è molto affidabile, ma dopo 5 anni incomincia a deteriorarsi e la sua affidabilità decresce rapidamente. Il disco con un MTTF di un milione di ore potrebbe essere comunque più affidabile rispetto a un altro disco con un MTTF di 500.000 ore, a parità di vita utile.

MTBF (Mean Time Between Failure): rappresenta il tempo medio di funzionamento di un’entità riparabile. Si deduce che per una macchina complessa, cioè costituita da vari componenti, ipotizzandone la riparabilità a fronte di un’avaria, si parlerà di MTBF, pari ad una media di n ore di funzionamento tra un guasto e l’altro, senza distinguere la tipologia dei guasti. Per ogni suo componente si parlerà di MTTF, nell’ipotesi in cui il componente stesso venga sostituito per guasto e non riparato, o di MTBF nel caso alternativo in cui il componente venisse sostituito e riparato.

MTTR (Mean Time To Restoration): definito come “valore atteso del tempo al ripristino” (UNI 9910), rappresenta il tempo medio necessario per ripristinare il buon funzionamento, calcolato dall’istante in cui interviene il guasto. Il tempo al ripristino o di rimessa in servizio è l’intervallo di tempo durante il quale l’entità si trova in uno stato di indisponibilità a causa di un guasto (UNI 9910). Si noti come l’ente unificatore raccomandi espressamente di abbandonare la più diffusa, e ampiamente usata, interpretazione di MTTR come Mean Time To Repair . Il motivo della segnalazione deriva dall’ambiguità di interpretazione del concetto di riparazione: lo stato di guasto intercorre da quando è percepito a quando è rimosso. Il puro tempo tecnico di riparazione non è descrittivo dell’impatto reale del guasto sulla produttività. La conseguenza effettiva di un guasto è generalmente superiore a quella del semplice intervento di manutenzione e risente di altri tempi passivi, quali ritardi di segnalazione, emissione di documentazione, scarico degli impianti ed eventuale pulizia, raccolta informazioni e quant’altro non direttamente controllabile dalla manutenzione, ma comunque attivato da un guasto e messo quindi in conto al medesimo. Il MTTR sarà un indicatore fondamentale della misura della prestazione di un intervento di manutenzione correttiva; infatti esso è composto da più fasi, di cui quella di ricerca guasti è molto spesso la più impegnativa in termini temporali. Per monitorare il tempo medio di riparazione a fronte di un guasto si utilizza quindi l’indicatore MRT (Mean Repair Time), la misura di quella parte del tempo attivo di manutenzione correttiva, esclusa la fase di ricerca guasti, durante il quale vengono eseguite azioni di riparazione su un’entità.

Fonte: Trasmissioni di Potenza (Ed. Tecniche Nuove), gennaio 2015