Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Ing. Claudio Camuto
1
Obiettivi
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
E se si trovasse un modo di predire le crisi epilettiche dall’EEG?
Certo, come no! L’EEG è solo un ammasso di dati incomprensibili che ti da informazioni solo quando è troppo tardi!!!E se si potesse usare anche
per scoprire i soggetti epilettici anche se non hanno mai avuto crisi? Fantascienza!!! E poi son
tanti dati…sono 900000 record a seduta per paziente! Li guarderai ad uno ad uno?Data mining ed
entropie!!!
Data…che? Entro… cosa? Mah…son un po’ scettico….
Vedrai!!!
L’epilessia breve introduzione
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
«Ictal», che rappresenta l’intervallo durante il quale avviene la crisi epilettica ;
«Perictal», che rappresenta ciò che precede e segue la crisi, rispettivamente «Preictal» e «postictal»;
«Interictal», che rappresenta l’intervallo fra una crisi e l’altra.
Fasi epilettiche:
Durante le fasi di «interictal» e «perictal» il tracciato è molto, almeno in apparenza, a quello di un paziente sano;
Durante la fase di «ictal» il tracciato diventa molto irregolare
Caratterizzazione tracciato EEG epilettico:
Tracciato dell’elettrodo Fp1 di un paziente epilettico, evidenziate le crisi
La sorgente: il tracciato EEG
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
«L’elettroencefalogramma (EEG),è una misura del flusso di corrente extracellulare che viene generato dalla somma delle attività di un elevato numero di neuroni»
Costituisce un esame semplice da seguire e poco invasivo
Fornisce diverse informazioni visibili ad occhio nudo
Largamente utilizzato nell’analisi delle dinamiche celebrali
Si ritiene che contenga delle informazioni celate utilizzabili a fini diagnostici
Il segnale è ricavato dalla sovrapposizione dei segnali dei vari strati
attraversati;
Presenta degli artefatti, per cui sono necessarie post-elaborazioni
Perché preferirlo ad altri esami:
Problemi da affrontare:
Strumenti: Il data mining
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Descrittivo, descrive e classifica i dati;
Predittivo, utilizza le informazioni ricavate dal mining descrittivo per cercare di
predire l’andamento futuro dei dati;
Tipi di mining:
«Con il termine “data mining” si intendono tutte quelle tecniche atte ad estrarreinformazioni nascoste da un insieme vasto di dati; tali informazioni non sonooccultate o criptate ma, semplicemente, non direttamente visibili all’utente»
Perche servono?
La quantità di dati da analizzare è notevole in quanto un EEG si compone dei segnali di 21 elettrodi, una seduta dura 30 minuti e il segnale ha una freq. di 500Hz quindi una sola seduta genera di un solo paziente genera 900000 record di almeno 21 campi
Strumenti: Il data mining
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Utilizzabile solo quando si conoscono già le classi del sistema, per questa ragione viene chiamato «supervised learning»;
Genera un modello dei dati da utilizzare per classificare i nuovi dati; tale modello è spesso un albero decisionale con struttura IF…ELSE;
Necessita di un insieme di dati di apprendimento detto training set per generare il modello;
Necessita di un insieme di dati detto test set per verificare il modello creato.
Classificazione:
Tecnica per classificare i dati in ingresso rispetto a delle classi predefinite (ovvero
raggruppamenti di oggetti con caratteristiche simili):
Si tratta di un decision tree;
Calcola ad ogni iterazione l’attributo che maggiormente separa i dati, ne crea
quindi una diramazione; procede ricorsivamente sui rami creati;
Provvede ad eseguire il pruning dei dati.
Algoritmo J48:
Strumenti: Il data mining
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Utilizzato principalmente quando non si conoscono a priori le classi da creare;
Deve essere possibile calcolare la distanza fra due dati;
Un dato può appartenere ad un solo cluster, a cui è vicino, e deve essere distante dagli altri;
Non deve essere rilevante l’ordine con cui vengono forniti i dati;
Le classi ricavate, con i relativi elementi, non hanno etichetta, bisogna comprendere ciò che l’algoritmo ha classificato.
Clustering:
Tecnica per raggruppare i dati in ingresso in categorie, dette cluster, in base a
caratteristiche comuni, senza conoscere a priori le classi:
Algoritmo Simple K-Means:
Dato il numero K di cluster inizialmente crea K cluster scegliendo a caso fra i dati un elemento da assegnare a ciascuno che diventa temporaneamente il centro;
Per ogni dato calcola la sua distanza dal centro del cluster, lo assegna al più vicino e ne ricalcola il centro facendo una media fra i dati del cluster.
Strumenti: Le entropie
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Le entropie sono funzioni utilizzate per misurare il grado di disordine si un sistema; ne
esistono varie formulazioni fra cui la più nota è Shannon; sono state provate an Tsallis,
Renyi, Permutation Entropy (al variare degli indici P e M).
Perche servono?
Dalle analisi effettuate in campo medico si è visto che prima della crisi il cervello che solitamente è un sistema altamente caotico diventa più «ordinato»; come meccanismo di sicurezza, per ripristinare il «caos» originale viene generata la crisi e quindi uno strumento che calcola il livello di disordine è sicuramente utile
Strumenti: WEKA
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Tool opensource, liberamente utilizzabile, scritto in java, le classi e i metodi sono
realizzati in modo tale da essere facilmente integrati nel codice di altri software
EEG-entropie-mining
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Lavoro svolto:
Caricamento dei dati da file su database;
Utilizzando WEKA: Classificazione fra crisi e stato normale (test mining);
Utilizzando pl/sql e i dati forniti: Estrazione dei «precrisi» dei vari pazienti;
Utilizzando pl/sql e i dati forniti: Estrazione degli intervalli fra le «crisi» dei vari
pazienti;
Utilizzando WEKA: Clustering dei vari «precrisi»;
Utilizzando WEKA: Clustering dei vari intervalli fra le «crisi»;
Utilizzando WEKA: Confronto sani / epilettici con Clustering a tre classi;
Software;
Test su altri EEG: Alzheimer.
EEG-entropie-miningClustering segnale «precrisi» di tutti i campioni – prima crisi
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Estrazione del «precrisi» della prima crisi, preictal, e analisi con Clustering a due classi su tutti i pazienti epilettici:
I valori calcolati sul campione N. 14 rispetto alle entropie, in ordine:
P1M3,
P1M4,
P2M3,
P2M4
In rosso il segnale, in verde l’esordio crisi, in blu il segnale classificato in una categoria differente
EEG-entropie-miningClustering segnale «precrisi» di tutti i campioni – crisi successive
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Estrazione del «precrisi» delle crisi successive alla prima, interictal, e analisi con Clustering a due classi su tutti i pazienti epilettici:
I valori calcolati sul campione N. 5 rispetto alle entropie, in ordine:
P1M3,
P1M4,
P2M3,
P2M4
In rosso il segnale, in verde l’esordio crisi, in blu il segnale classificato in una categoria differente
Software
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Motivazioni:
Fornire un punto di accesso alle tecniche di mining anche a personale non informatico;
Creare una rete di utenti in grado di condividere le analisi effettuate e di effettuarne altre approfondendo e verificando i risultati ottenuti;
Estendere le ricerche anche ad altri ambiti (es. Alzheimer).
Tecnologia: Java + Framework Hibernate + jQuery + jFreeChart + WEKA lib;
Oracle + Tomcat.
Caratteristiche:
Web Application con profilazione utente;
Procedure guidate (wizard) per agevolare l’inserimento dei dati, la commissione di nuove analisi da effettuare, la creazione di grafici;
Scheduling delle attività con avviso per e-mail del completamento per non sovraccaricare il server (alcune elaborazioni richiedono ore);
Generazione grafici png e jpeg;
Integrazione delle tecniche di mining di WEKA.
Software
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Conclusioni
Caratterizzazione Entropica di tracciati EEG epilettici mediante tecniche di data mining
Conclusioni sui dati elaborati:
Le potenzialità di questa combinazione Mining-Entropie sono evidenti;
Spesso è stato possibile trovare un segnale prima della crisi interpretabile come
precrisi;
Tutti i pazienti vanno analizzati singolarmente per trovare l’entropia e le
caratteristiche del segnale precrisi;
In tutti i casi è stato possibile separare pazienti epilettici (senza crisi) da sani.
Possibili applicazioni:
Se i dati ricavati fossero confermati da un test set maggiore sarebbe possibile
diagnosticare la patologia epilettica anche in pazienti apparentemente sani;
Se i dati ricavati fossero confermati sarebbe possibile mettere a punto dei sistemi
in grado di rilevare la crisi prima che si verifichi ed intervenire per evitarla;
Grazie per la vostra cortese attenzione