Post on 15-Feb-2019
transcript
Scuola Politecnica e delle Scienze di Base Corso di Laurea in Ingegneria Informatica
elaborato di laurea
Analisi Predittiva e Apprendimento Automatico
Anno Accademico 2016/2017 relatore
Ch.mo Prof. Filippo Neri candidato Giovanni Tondo matr. N46002390
Alla mia bicicletta veloce
Analisi predittiva e apprendimento automatico
Indice
Indice .................................................................................................................................................... 3
Introduzione ......................................................................................................................................... 4
Capitolo 1: Previsione di eventi futuri da dati storici.................................................................... 5
1.1 Analisi predittiva ................................................................................................................... 5
1.2 Apprendimento automatico ................................................................................................... 6
Capitolo 2: Ambiti di applicazione ............................................................................................... 8
2.1 Ambiti di applicazione .......................................................................................................... 8
Capitolo 3: Le fonti ..................................................................................................................... 10
3.1 I dati ..................................................................................................................................... 10
3.2 Big Data ............................................................................................................................... 11
3.2.1 Crescita tridimensionale ............................................................................................... 12
Capitolo 4: Tecniche predittive ................................................................................................... 14
4.1 Tecniche .............................................................................................................................. 14
4.1.1 Reti Neurali ....................................................................................................................... 14
4.1.2 Alberi di Decisione ........................................................................................................... 16
4.1.3 Regressione ....................................................................................................................... 17
4.1.4 Support Vector Machine(SVM) ........................................................................................ 17
4.1.5 Simulazione Monte Carlo ................................................................................................. 18
Capitolo 5: Tecnologie disponibili .............................................................................................. 20
Capitolo 6: Un caso di studio: manutenzione predittiva .................................................................... 22
6.1 Manutenzione classica ......................................................................................................... 22
6.2 Cos’è la manutenzione predittiva ........................................................................................ 22
6.3 Obiettivi della manutenzione predittiva .............................................................................. 23
6.4 Come avviene la manutenzione predittiva .......................................................................... 23
Conclusioni ........................................................................................................................................ 26
Sviluppi Futuri ................................................................................................................................... 27
Bibliografia ........................................................................................................................................ 29
Analisi predittiva e apprendimento automatico
4
Introduzione
Conoscere il futuro è considerato da sempre per l’uomo un sogno. Dall’alba dei tempi oracoli e
visionari hanno tentato di provare che è possibile avere un’anteprima degli eventi futuri:
interpretando i cambiamenti del clima, osservando il volo degli uccelli, interpellando divinità e dei.
Uno dei primi esperimenti scientifici seri di analisi predittiva fu quello di Norbert Wiener per
prevedere il comportamento dei piloti tedeschi con l’obiettivo di colpirli in volo. Il metodo
consisteva nel prendere come input la traiettoria del velivolo in base al movimento osservato,
considerare le manovre più probabili fatte dal pilota e prevedere dove l’aereo si sarebbe diretto in
modo che un proiettile potesse colpirlo. Dal 1940 i computer sono diventati molto più veloci ed i
dati storici a disposizione molto maggiori. La sfida di oggi è sempre di più conoscere in anticipo
gli eventi, i comportamenti ed i loro mutamenti o come dice Eric Siegel saper “Chi clicca, compra,
mente o muore”. Questo lavoro vuole essere una fotografia dello stato dell’arte sulla tecnologia che
apprende dall’esperienza (dati) per prevedere il comportamento futuro e fornire una guida per dare
un supporto a decisioni efficaci e migliori.
Analisi predittiva e apprendimento automatico
5
Capitolo 1: Previsione di eventi futuri da dati storici
1.1 Analisi predittiva L’analisi predittiva utilizza i dati insieme ad analisi, tecniche di apprendimento automatico e
statistiche per creare un modello predittivo per la previsione di eventi futuri. È chiara la definizione
di Eric Siegel, secondo cui i Predictive Analytics sono una tecnologia che apprende dall’esperienza
per predire il comportamento futuro di individui, eventi e fenomeni in modo da ottenere decisioni
migliori. Il termine "analisi predittiva" non descrive una particolare tecnica statistica o di
apprendimento automatico, ma, piuttosto, l'applicazione di una tecnica per creare una previsione
quantitativa per il futuro. Frequentemente, le tecniche di apprendimento automatico con
supervisione vengono utilizzate per prevedere un valore futuro (ad esempio, la temperatura domani
sarà 30°) o stimare una probabilità (ad esempio, la probabilità di pioggia domani è del 75 %).
L’analisi predittiva è spesso discussa nel contesto dei Big Data considerando che le imprese
applicano algoritmi per ricavare spunti da grandi insiemi di dati. Questi modelli predittivi possono
essere applicati per la produzione in un ambiente IT o in un sistema embedded.
L’analisi predittiva consente di utilizzare modelli statistici per attività di forecasting: serve, in
pratica, a fare stimare ciò che accadrà nel futuro. Ovviamente, non si può avere una certezza
assoluta, ma si tratta di uno studio probabilistico. Gli Advanced Predictive Analytics o APA, come
vengono definiti da IDC, sono strumenti potenti, inseriti in svariati processi, che a partire dai dati a
disposizione permettono agli utilizzatori di modellare, simulare e prevedere andamenti futuri, con
Analisi predittiva e apprendimento automatico
6
una certa probabilità. Oggi il mercato richiede soluzioni che abbiano completezza e velocità.
L’evoluzione tecnologica, software e hardware degli ultimi anni ha abilitato soluzioni fino a pochi
anni fa impensabili, in grado di eseguire query a una velocità notevole, su enormi volumi di dati.
Queste soluzioni rendono i principali processi aziendali molto più veloci, mettendo a disposizione
funzionalità di analisi e reporting molto più rapide ed affidabili rispetto ai vecchi metodi ed offrono
un supporto alle decisioni intelligenti e rapide basate su un patrimonio di informazioni e dati
disponibili. Fino a non molti anni fa gli strumenti utilizzati erano complicati da utilizzare ed erano
richieste particolari competenze: conoscenze matematiche e statistiche per creare, utilizzare e
aggiornare i modelli analitici. Oggi, molte delle attività sono velocizzate da strumenti completi,
efficaci ed efficienti che semplificano enormemente il lavoro. I modelli di predizione vengono
creati in modo automatico e ottimizzato, utilizzabili da subito all’interno dei processi di business.
Gli APA aiutano a prevedere i mutamenti, permettendo di pianificare e realizzare strategie mirate
ed efficaci per migliorare ed ottimizzare performance, per prevedere fenomeni disastrosi.
Grazie agli APA, quindi, si può avere una migliore e più profonda comprensione di fenomeni ed
eventi rispetto a quanto possibile con gli strumenti classici, perché si possono prevedere
comportamenti e performance in diversi campi e settori.
1.2 Apprendimento automatico In questo studio si vuole dare particolare rilievo alle tecniche di apprendimento automatico.
È proprio attraverso questo processo che i dati si rivelano una risorsa potentissima.
L’apprendimento automatico (Machine Learning) è un campo dell’intelligenza artificiale che tratta
algoritmi che consentono ad un agente di apprendere in modo autonomo.
Analisi predittiva e apprendimento automatico
7
Emerge la necessità di creare dei modelli che abilitino gli agenti a produrre output di dati futuri in
modo autonomo a partire da una serie di dati di input.
La figura seguente dà un’idea di come sia fondamentale nel processo di predizione il Machine
Learning
Figura 1 Purtroppo (o fortunatamente) è doveroso notare il limite del Machine Learning rispetto ad una
mente umana: un agente programmato dall’uomo infatti potrà solo dare degli output elaborando
dati già visti in precedenza mentre l’uomo, grazie alla capacità del tutto umana è in grado di
giungere a conclusioni ragionando per similitudini, associazioni, pensieri ed associazione di
situazioni, anche solo simili in minima parte a quelle oggetto di valutazione.
Analisi predittiva e apprendimento automatico
8
Capitolo 2: Ambiti di applicazione
2.1 Ambiti di applicazione
L’analisi predittiva trova spazi in molteplici ambiti e settori, sia in quelli della ricerca scientifica
sia in quelli commerciali di mercato. Nel settore dell'energia, tipicamente si prevede la richiesta di
elettricità per il futuro dimensionando opportunamente i fabbisogni necessari, la previsione è
comunemente utilizzata dagli operatori della rete al fine di garantire un’adeguata programmazione
della generazione di energia per soddisfare la richiesta degli utilizzatori.
Nei mercati Banking e Finance sono fondamentali i punteggi di affidabilità di solvibilità creditizia
e di rating, in ambito industriale e di produzione sono tematiche fondamentali e strategiche quelle
che riguardano la manutenzione predittiva di macchinari e veicoli.
In ambito commerciale la previsione di vendita al dettaglio e all’ingrosso consente di gestire con
efficienza le scorte di materiale, nel marketing è possibile per esempio, sapere in anticipo quali
saranno i clienti che l’organizzazione potrà perdere nel prossimo futuro, quali servizi aggiuntivi
potranno essere venduti ai clienti attuali o quali nuovi prodotti saranno maggiormente apprezzati
sul mercato per affinare una opportuna strategia commerciale. In questo modo, si possono sfruttare
al meglio i dati già disponibili nei sistemi dei CRM (Customer Relationship Management) per
migliorare le previsioni della domanda o degli acquisti per ottimizzare le performance.
Oggi ogni azienda competitiva che fa marketing, controllo di gestione e monitoraggio del ciclo di
Analisi predittiva e apprendimento automatico
9
vita dei propri servizi, necessita di confrontarsi con strumenti più o meno evoluti di Predictive
Analytics in tutta le aree aziendali a cominciare da quelle di vendita, dei crediti, dei rischi degli
approvvigionamenti.
I settori in cui la competitività si misura sul valore che ogni cliente apporta al business sono i primi
che si doteranno di soluzioni di analisi predittiva: Retail, GDO (grande distribuzione organizzata)
fino al manufacturing. È possibile inoltre effettuare un’analisi sul rischio di abbandono dei singoli
clienti, analisi che ha consentito di costruire una “classifica” dei clienti più “a rischio” che sono
stati poi opportunamente gestiti in anticipo rispetto a una decisione di abbandono, consentendo di
innescare un processo virtuoso di fidelizzazione.
Vi sono settori che sono da anni soliti utilizzare strumenti di Predictive Analytics, e sono quei
settori in cui le attività di vendita e produzione sono essenzialmente basate sulle previsioni. Tra
questi sicuramente ci sono il fashion, il food & beverage e il retail specializzato, le banche ed i
provider di telecomunicazioni. Altro settore dove l’analisi predittiva è di grande utilità è quello
medico sanitario all’interno del quale possiamo osservare una grande diffusione delle cosiddette
applicazioni di Electronic Health care Predictive Analytics (e-HPA). Un esempio è APACHE
(Acute Physiology and Chronic Health Examination) un sistema per attribuire una misura del
rischio di mortalità nei reparti di cure intensive. Con le applicazioni e-HPA si identificano invece
quelle pratiche in cui l’analisi di grandi quantità di dati e l’utilizzo di sofisticati modelli matematici
rendono necessario l’affiancamento di un computer al medico.
Analisi predittiva e apprendimento automatico
10
Capitolo 3: Le fonti
3.1 I dati
Le fonti di dati utilizzate per creare modelli predittivi spesso includono database SQL, file di log di
attrezzature, immagini, video, audio e dati raccolti dai sensori. La diffusione dei canali digitali
(mobile, web, social…) avvenuta negli ultimi anni ha aumentato enormemente la quantità di dati
disponibili, il numero delle fonti e la complessità dei dati da analizzare: i dati sono oggi interni ed
esterni alle organizzazioni, possono essere strutturati e non strutturati, si trovano offline o online.
Avere tanti dati a disposizione non è un valore di per sé, ma lo è invece la loro combinazione:
l’analisi predittiva mette in relazione dati che possono sembrare non correlati tra loro e genera
nuove conoscenze, che a loro volta possono generare nuove opportunità. Una volta, la difficoltà
principale era disporre di adeguate quantità di dati e di informazioni storiche per poi poterle
gestire. Oggi web-social, multicanalità, assieme alla diffusione di strumenti anche open source in
grado di maneggiare big data, rendono le funzioni d’analisi predittiva alla portata di chi ne
comprende l’importanza. Gli APA sono in grado non solo di analizzare grandi volumi di dati per
approfondire la conoscenza di eventi e fenomeni ma garantiscono anche risultati significativi a
condizione che i dati su cui operano siano affidabili.
La sfida maggiore per l’analisi predittiva è integrarsi nell’architettura delle informazioni già
esistente nelle organizzazioni, con gli ERP, la BI e le altre applicazioni utilizzate. La difficoltà
maggiore rimane quindi la reperibilità di dati storici affidabili, il miglioramento della qualità del
dato risulta essere un tema fondamentale per l’utilizzo di tecniche di previsione per il buon esito di
Analisi predittiva e apprendimento automatico
11
un sistema adeguato. L’utilizzo di tecniche di Predictive Analytics risulta tanto più di successo
quanto migliore è la visualizzazione del risultato in maniera dinamica e intuitiva, questo campo
tende quindi a essere intimamente collegato con la visual analytics che vede fiorire tool di
presentazione e visualizzazione dei dati grazie a cruscotti e report specifici proprio perché la
velocità dell’occhio umano consente di cogliere collegamenti, schemi e raggruppamenti in maniera
veloce anche con enormi quantità di dati. La raccolta minuziosa di dati storici rappresenta uno
snodo significativo tra il tentare di comprendere i fenomeni attraverso l’analisi dei dati con un
approccio euristico e l’affidarsi a un procedimento algoritmico basato sulla statistica e su tecniche
di esplorazione automatica del dato.
3.2 Big Data L’enorme potenzialità degli APA è dovuta anche alla possibilità di poter usufruire di una grande
mole di dati, che oggi si ha a disposizione grazie al fenomeno dei Big Data.
La mole e la complessità di dati vecchi e nuovi rappresentano una ricchezza ed un’opportunità, ma
anche una grande sfida per le organizzazioni per quanto concerne i sistemi IT e lo sfruttamento ed
utilizzo delle informazioni.
Con il termine Big Data si intende una raccolta di dati di enormi dimensioni, la cui dimensione e
complessità è tale da non poter essere trattata con i normali strumenti per l’analisi dei dati.
La nascita dei Big Data è dovuta al forte incremento di dati che si hanno a disposizione grazie alle
tecnologie usate oggi. Basti pensare ai dati prodotti dai social network, dalle carte di credito, dai
sensori utilizzati nelle industrie.
Analisi predittiva e apprendimento automatico
12
3.2.1 Crescita tridimensionale I Big Data sono nati grazie a tre caratteristiche peculiari che li distinguono:
-volume -varietà -velocità
Figura 2
La prima di queste indica che si tratta di un’enorme mole di dati da trattare. Il volume di dati è
estremamente grande, grazie alle informazioni ottenute dalle tecnologie utilizzate in ogni ambito.
Un esempio è avere a disposizione i dati registrati quotidianamente o addirittura più volte al giorno
dai sensori di un’industria, oppure trattare i dati che produce Twitter quotidianamente, così come
Facebook o Instagram.
Analisi predittiva e apprendimento automatico
13
La varietà è dovuta al fatto che i dati raccolti sono molto diversi l’uno dall’altro, una sfida dei Big
Data è quindi riuscire a trovare il modo di analizzarli nonostante l’eterogeneità, si pensi ad esempio
a dati strutturati e non-strutturati.
In quest’ambito sono generalmente utilizzati i cosiddetti database NoSQL.
La velocità dipende dalla produzione rapida e continua di nuove informazioni da salvare e
analizzare.
Analisi predittiva e apprendimento automatico
14
Capitolo 4: Tecniche predittive
4.1 Tecniche
Le principali tecniche utilizzate nell’analisi predittiva sono le seguenti:
• Regressione lineare e non lineare
• Simulazioni Monte Carlo
• Reti neurali
• Macchine a vettori di supporto (SVM)
• Strutture ad alberi di decisione
4.1.1 Reti Neurali
Le reti neurali sono una tecnica utile per ottenere predizioni sia nel caso di una relazione lineare tra
predittori e obiettivo (in questo caso il risultato si avvicinerà molto a quello di un modello lineare
tradizionale), sia in presenza di una relazione non-lineare.
La topologia della rete è un grafo orientato con nodi, neuroni artificiali, archi e pesi sinaptici.
Una rete neurale si costruisce prendendo come esempio il modo di elaborare informazioni del
cervello. Si compone di diversi strati:
• Strato di input
• Uno o più strati nascosti
• Strato di output
Analisi predittiva e apprendimento automatico
15
Allo strato di input sono associate le unità che rappresentano i campi di input, allo strato di output
quindi sono associate le unità che rappresentano i campi obiettivo.
Alla connessione tra unità è sempre associato un peso che stabilisce un’intensità di connessione. I
dati di input passano al primo strato e i valori vengono propagati allo strato successivo, alla fine si
otterrà un risultato nello strato degli output.
La rete apprende correggendo i pesi ogni volta che sbaglia previsione. All’inizio i pesi saranno
assegnati casualmente e saranno presentati in maniera iterata degli esempi di cui si conosce
l’output per poter ottenere un confronto con il risultato ottenuto, modificando gradualmente i pesi.
In questo modo può avvenire l’apprendimento, al termine del quale si potranno presentare al
modello casi sconosciuti ottenendo una predizione plausibile.
Un esempio di una rete neurale applicata per una predizione in ambito clinico è rappresentata nella
figura seguente:
Analisi predittiva e apprendimento automatico
16
Figura 3
Per l’implementazione di soluzioni di questo tipo generalmente si utilizza il linguaggio di
programmazione Python, un linguaggio ad alto livello orientato agli oggetti.
4.1.2 Alberi di Decisione
Le strutture ad alberi di decisione sono modelli utilizzati per ottenere strumenti di classificazione
che, una volta ottenute le regole decisionali, permettono di prevedere osservazioni future.
L’apprendimento automatico consiste nel riuscire ad estrapolare un albero di decisione da un set di
esempi costituiti da input e output, ovvero il training set. Questo algoritmo permette di classificare
nuove situazioni in modo autonomo.
Questa tecnica risulta particolarmente utile quando si desidera visualizzare le partizioni di dati in
sottoinsiemi pertinenti per il problema create dagli attributi all'interno dei dati. La presentazione di
insiemi di regole si rivela utile quando si desidera visualizzare la relazione tra un determinato
gruppo di elementi e una conclusione specifica.
Analisi predittiva e apprendimento automatico
17
Anche per sfruttare questa tecnica si può utilizzare il linguaggio di programmazione Python, dato
che questo linguaggio permette una facile implementazione di questo tipo di funzioni.
4.1.3 Regressione
La tecnica della regressione è un potente mezzo statistico che permette di effettuare predizioni.
Questa tecnica si concentra sullo studio della relazione presente tra una variabile risposta o di
output o dipendente, ed una serie di variabili indipendenti di input, i regressori appunto. La
relazione può essere rappresentata nel seguente modo:
Alla funzione f che si può chiamare componente sistematica, si aggiunge un termine dato dalla
presenza di un errore imprevedibile.
Si è in presenza di una regressione lineare se la funzione è di tipo lineare, altrimenti si tratta di
regressione non-lineare. Il linguaggio R risulta essere il più utilizzato per analisi statistiche di
questo tipo.
4.1.4 Support Vector Machine(SVM)
Support Vector Machine (SVM) è una tecnica di classificazione e regressione robusta. Risulta
particolarmente utile nel caso in cui si hanno un numero di campi predittore molto elevato
(nell’ordine delle migliaia).
SVM mappa i dati a uno spazio di funzioni altamente dimensionale in modo che sia possibile
categorizzare i punti dati, anche quando i dati non sono separabili linearmente in altro modo. Viene
trovato un separatore tra le categorie e quindi i dati vengono trasformati in modo che il separatore
Analisi predittiva e apprendimento automatico
18
possa essere tracciato come un iperpiano. In seguito, è possibile utilizzare le caratteristiche dei
nuovi dati per prevedere il gruppo al quale deve appartenere un nuovo record.
Di seguito è riportata la rappresentazione dei dati prima e dopo la trasformazione:
Figura 4
La retta ottenuta si chiama iperpiano del margine massimo. SVM è quindi l’algoritmo utilizzato per
trovare i vettori di supporto e utilizzarli per trovare l’iperpiano.
SVM è molto utilizzato per algoritmi di riconoscimento facciale, riconoscitore di grafia. Per
utilizzare questa tecnica si può usufruire di una libreria chiamata LIBSVM, scritta in C++ e
contenente anche un wrapper Python.
4.1.5 Simulazione Monte Carlo
La simulazione Monte Carlo si basa su un principio: valutare il comportamento statistico di
campioni casuali attraverso il processo empirico di estrarre molti campioni e osservando il loro
comportamento.
La simulazione avviene approssimando il contesto reale d’interesse con un modello controllabile
che ne sintetizza gli aspetti più rilevanti.
In questo modo si può accrescere la comprensione del comportamento del contesto studiato,
verificando o negando ipotesi su di esso.
Analisi predittiva e apprendimento automatico
19
Analisi predittiva e apprendimento automatico
20
Capitolo 5: Tecnologie disponibili
Il mercato degli APA è in fermento. Sono numerose le acquisizioni delle aziende leader di mercato
di altre aziende che hanno sviluppato soluzioni avvincenti di analisi predittiva. Ad esempio, SAP
ha acquisito KXEN, formando la base dell’offerta di “InfiniteInsight”. Altre acquisizioni sono state
fatte come parte di una strategia più globale legata ai Big Data, come nel caso di Dell che ha
acquisito “StatSoft”. Un’altra tendenza importante è l’aumento di strumenti, linguaggi e ambienti
open source (come R, Weka o Mahout) significativo per la diffusione della tecnologia APA in
generale. Infine, secondo IDC, la diffusione degli strumenti di visual data discovery e altri
strumenti semplificati APA promuoveranno l’adozione dell’analisi predittiva in un pubblico più
vasto di business, perché forniscono meno flessibilità dei tool più potenti per la modellizzazione,
ma hanno un’interfaccia utente grafica di più facile comprensione per gli utenti. Una tecnologia
presente sul mercato è Accenture Analytics Applications Platform che permette di offrire
applicazioni specifiche per mercato e per processo di business in grado di fornire supporto
quotidiano ai decision maker e ai business user, in modo da rendere le Predictive Analytics
utilizzabili in automatico e in tempo reale per raggiungere importanti obiettivi come la riduzione
dei costi e l’aumento dei ricavi. Anche IBM è presente sul mercato con il prodotto IBM SPSS
Modeler, una piattaforma di Predictive Analytics per inserire l'intelligence predittiva nel processo
decisionale gestito da persone, gruppi, sistemi e aziende.
In Zucchetti sono state sviluppate le Infinity Analytics, funzionalità avanzate di business
intelligence, che si possono integrare a tutti gli applicativi di gestione aziendale, per estrarre i dati
generati dall’impresa e trasformarli in informazioni utili a prendere decisioni.
Analisi predittiva e apprendimento automatico
21
Vi è poi sempre più la tendenza di sfruttare gli strumenti previsionali per valutare quali sono le
nuove linee di prodotto o i nuovi mercati. Sinfo One ad esempio supporta questa linea di tendenza
con una soluzione basata su tecnologia Oracle Hyperion.
Analisi predittiva e apprendimento automatico
22
Capitolo 6: Un caso di studio: manutenzione predittiva
Si vuole ora riportare un’applicazione dell’analisi predittiva nel mondo industriale, in particolare
per ciò che riguarda l’organizzazione della manutenzione.
6.1 Manutenzione classica
La manutenzione classica si basa su quella correttiva e preventiva:
• la correttiva consiste nella riparazione dei componenti guasti al termine del servizio del mezzo
• la preventiva riguarda le operazioni previste con scadenze fisse, in genere temporali
Gli svantaggi di questo tipo di manutenzione sono diversi. Innanzitutto, si subiscono gli effetti dei
guasti che saranno riparati successivamente, inoltre le scadenze date dalla manutenzione preventiva
possono raggruppare attività non omogenee.
6.2 Cos’è la manutenzione predittiva
La Manutenzione predittiva è un tipo di manutenzione preventiva che viene effettuata a seguito
dell'individuazione di uno o più parametri che vengono misurati ed estrapolati utilizzando
appropriati modelli matematici allo scopo di individuare il tempo residuo prima del guasto.
Riuscire ad individuare precocemente le anomalie consentirebbe una migliore gestione
dell'esercizio e delle manutenzioni, evitando importanti ripercussioni di tipo economico ed
Analisi predittiva e apprendimento automatico
23
ambientale. Per tale motivo, è necessario associare alle tradizionali pratiche manutentive nuove e
più innovative strategie basate su azioni predittive.
L'analisi dello stato di salute del macchinario consente non solo di anticipare il verificarsi di un
guasto, ma anche di indirizzare efficacemente le risorse di manutenzione là dove il macchinario lo
richiede. Il risultato finale è l'ottimizzazione delle risorse economiche ed il miglioramento
dell'indice di efficienza complessiva economica.
6.3 Obiettivi della manutenzione predittiva
I principali obiettivi che si pone l’approccio della manutenzione predittiva sono una riduzione dei
costi di manutenzione, un aumento della affidabilità e della disponibilità.
Questi obiettivi si possono raggiungere tramite gli effetti dell’applicazione dell’analisi predittiva.
In particolare, attraverso il miglioramento nella gestione dei guasti nel processo manutentivo, il
superamento delle scadenze di tempo o chilometri con modifiche strutturali ai piani di
manutenzione, ed infine una diminuzione sostanziale dei guasti in esercizio.
6.4 Come avviene la manutenzione predittiva
Per poter applicare una manutenzione predittiva sono necessarie le installazioni di strumenti
opportuni.
Gli interventi di Trenitalia per il proprio progetto di manutenzione predittiva ad esempio, sono
stati:
• l’installazione di strumenti di telediagnostica di bordo in grado di trasmettere i propri dati
• l’installazione negli impianti di manutenzione di strumenti per la diagnosi
Analisi predittiva e apprendimento automatico
24
• un nuovo sistema di gestione della manutenzione, il Dynimic Maintenance Management
System
In questo modo sui treni sono installati computer connessi agli strumenti di bordo e dotati di
collegamento dati cellulare in grado di trasmettere con scarico dati diagnostici a terra.
Ai dati generati dalla strumentazione di bordo si aggiungono le informazioni generate da centinaia
di sensori.
La manutenzione predittiva può essere approcciata in due modi diversi:
• classificare situazioni di anormalità e monitorarne con continuità la distanza
• identificare la normalità e misurarne con continuità lo scostamento
Nel primo caso le anomalie sono classificate sulla base dei ritorni di esperienza: riserve,
accudienze che hanno provocato problemi in esercizio. Il sistema ricerca se ci sono condizioni sui
dati di processo ripetute.
Nel secondo si possono identificare le configurazioni più probabili e trovarne gli scostamenti.
L’analisi predittiva avviene consultando due insiemi di indicatori:
• indicatori di salute
• indicatori di vita residua
Si tiene conto dello stato funzionale attuale attraverso le misure di parametri specifici. La
manutenzione viene fatta quando tali indicatori escono dal range di normale funzionamento.
Tali indicatori sono elaborati a partire dalle misure che arrivano dagli strumenti integrate con
quelle dei sistemi diagnostici di terra più dati che vengono da altre fonti (ad esempio sistemi di
circolazione, sistemi rilevazione meteo etc.).
Sulla base di questi indicatori il sistema Big Data incrocia la salute e la vite dei componenti
proiettando la vita residua dei componenti nel dominio dell’indicatore prescelto.
Analisi predittiva e apprendimento automatico
25
L’algoritmo di predizione può essere implementato tramite le reti neurali, utilizzando ad esempio
l’ambiente di lavoro Matlab. Di seguito si riporta una figura come esempio di sessione di lavoro su
Matlab per l’analisi dei dati da sensori adoperando la tecnica di apprendimento delle reti neurali.
Figura 5
Analisi predittiva e apprendimento automatico
26
Conclusioni
Lo svolgimento dell’elaborato ha permesso di fare diverse osservazioni.
Innanzitutto, si è notato che tra le varie possibili tecniche per l’analisi predittiva non ce n’è una
migliore delle altre, ma ognuna di queste può risultare la più utile in base al contesto di utilizzo.
Nel caso della manutenzione predittiva, ad esempio, è stata la tecnica delle reti neurali la più
conveniente per creare un modello predittivo utilizzando i dati trasmessi dai sensori industriali.
Si è inoltre osservato che al momento vi sono molte discussioni in merito ad un problema etico
dell’intelligenza artificiale: gli strumenti dell’analisi predittiva devono necessariamente rimanere
esclusivamente un supporto alle decisioni dell’uomo, dato che un’analisi etica non può essere
demandata ad una macchina. Dovrà essere sempre il progettista il responsabile di questo tipo di
decisioni.
Analisi predittiva e apprendimento automatico
27
Sviluppi Futuri
I principali sviluppi dei sistemi di predizione andranno verso un più capillare utilizzo ed una
maggiore diffusione di questi strumenti che avranno un notevole miglioramento delle prestazioni in
termini di affidabilità e di precisione dei dati prodotti. In seguito ad un’analisi svolta
dall’università Bocconi di Milano è risultato che la diffusione dei Predictive Analytics è ancora
parziale, circa il 24% delle aziende ne fa utilizzo. È prevista però una diffusione tale da
raddoppiare questa percentuale entro un anno.
Dal punto di vista della ricerca, la strada che si sta percorrendo è concentrata verso la Knowledge
Augmentation, ossia un percorso di ottimizzazione e miglioramento mediante moderni e più
evoluti motori di Machine Learning.
In effetti, ancora si registrano dei bug nelle applicazioni di intelligenza artificiale, tali bug in alcuni
casi potrebbero far sorridere, in altri potrebbero essere responsabili di conseguenze fatali. Per
esempio, in molti test dei veicoli senza conducente il sistema di AI ha interpretato erroneamente
della segnaletica stradale a causa di alcune imperfezioni che all’occhio umano sarebbero passate
inosservate.
Risulta necessario, quindi, effettuare un miglioramento delle tecniche e dei sistemi per poter ridurre
il margine di errore. Infatti, il futuro che si prospetta vede una forte presenza delle macchine e
Analisi predittiva e apprendimento automatico
28
intelligenze artificiali a supporto dell’uomo, causando un grande impatto nel mondo lavorativo,
creando ad esempio nuove tipologie di competenze e nuove tipologie di lavori.
29
Bibliografia
[1] Eric Siegel, Predictive Analytics: the power to predict who will click, buy, lie or die, wiley,
2013 , 1-11
[2] A.Waller S.Fawcett, Data Science,Predictive Anaytics: a revolution that wil transform supply
chain design and management, Journal of buisness logistics, 2013, 77-84
[3] Philip Russom, Big Data Anaytics, Fourth Quarter 2011
[4] Toby Segaran, Programming Collective Intelligence, 2007, O’Reilly
[5] www.ibm.com, https://www.ibm.com/analytics/data-science/predictive-analytics , 1/02/2018
[6] www.gartner.com,
https://www.gartner.com/technology/home.jsp?utm_expid=.ZOWJVOSPSSa8IBKZs6ZG3A.0&ut
m_referrer=, 10/02/2018
[7] www.datamanager.it, http://www.datamanager.it/2015/02/predire-futuro-si-puo/ , 2/02/2018
[8] www.sas.com, https://www.sas.com/it_it/insights/big-data/what-is-big-data.html , 5/02/2018
[9] www.idc.com , https://www.idc.com/home.jsp , 25/01/2018
[10] www.cifi.it , http://www.cifi.it/ (collegio ingegneri ferroviari itliani) , 18/02/2018
30
Figura 1 tratta da Predictive Analytics: the power to predict who will click, buy, lie or die, wiley,
2013
Figura 2 tratta da http://bigobject.blogspot.it
Figura 3, Figura 4 tratte da www.ibm.com
Figura 5 tratta da it.mathwork.com