ICA per analisi di gruppo
Simone Romano1
1Università degli Studi di Salerno
Elaborazione di segnali ed immagini biomedicheProf. Fabrizio Esposito
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 1 / 19
Introduzione
L’utilizzo dell’ICA è molto diffuso per lo studio di resting-state fMRIcon il GLM è possibile studiare attivazioni con un protocollodefinitol’ICA è utilizzata per analisi multivariate data-driven
Diverse soluzioni utilizzano l’ICA peranalisi singoleanalisi di gruppo
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 2 / 19
ICA per analisi di gruppo
Analisi di gruppo con l’ICAICA su dati aggregati di tutti i soggettiICA eseguita singolarmente su ogni soggetto e aggregazione deirisultati
ProblemaEffettuata l’ICA su ogni soggetto, come mettiamo in corrispondenza lecomponenti estratte per i vari soggetti?
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 3 / 19
Aggregazione componenti
Diversi approcciIndependent component analysis of fMRI group studies byself-organizing clustering [1] [2]clustering delle componenti dei vari soggetti rispetto a deitemplate
si crea un cluster per ogni templatesi calcola uno score (GOF o altri) per ogni componente rispetto adogni templateogni componente è associata al cluster relativo al template con cuiha score maggiore
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 4 / 19
Idea proposta
Approccio alternativo presentatoICA singolarmente per ogni soggetto (50 componenti)aggregazione dati in un’unica matriceclustering su tutti i datigenerazione di un file per ogni cluster contenente la componente di ognisoggetto associata a quel cluster (se presente) più la componente media
Un punto fondamentale della Cluster analysisdefinizione di una misura di similarità o di distanza tra gli oggetti
Dipende molto dalla tipologia di dati
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 5 / 19
Clustering
Algoritmi di clustering utilizzatikmeans - distanza euclideakmeans - Pearsonkmedoids - Pearsonkmedoids - Spearman
Validazione risultatiPer la scelta del k è stato utilizzato il coefficiente della Silhouette.
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 6 / 19
Clustering vincolato
Nei risultati del clustering possono presentarsi le seguenti condizioni:1 un cluster non contiene componenti di un soggetto
si può assumere che quel soggetto non possiede quellacomponente
2 un cluster contiene più componenti di uno stesso soggettoprobabilmente il clustering ha raggruppato più componenti similidello stesso soggetto
Con il clustering si vogliono unire le componenti simili dei vari soggettiogni cluster deve al massimo una componente per ogni soggetto
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 7 / 19
Clustering vincolato - 1
È stata realizzata una funzione per vincolare i risultati del clusteringinput
vettore con indice del cluster per ogni osservazionematrice delle distanze di ogni punto da ogni centroidevettore di vincoli CL (coppie di elementi che non possono starenello stesso cluster)
outputnuovo vettore con indice del cluster per ogni osservazione
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 8 / 19
Clustering vincolato - 2
L’alogoritmo:foreach cluster C do
foreach coppia ∈ CL dolascia nel cluster l’elemento più vicino al centroide
endend
Miglioramento risultatiDopo aver aggiunti i vincoli ai risultati del clustering è possibileeliminare da ogni cluster le componenti lontane dalla componentemedia del cluster.
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 9 / 19
Dataset e procedura
L’approccio descritto è stato applicato ad un dataset di 11 soggettiICA a partire dai VTC di ogni paziente (50 componenti)vettorizzazione di ogni componente e aggregazione di tutte lecomponenti di tutti i soggetticlustering con gli approcci descrittirimozione da ogni cluster degli elementi che non rispettano ivincoligenerazione di un file .ica per ogni cluster contenente:
la componente di ogni soggetto (se presente) associata a quelcluster (ordinati per distanza dal centroide)componente media del cluster
visualizzazione risultati in BrainVoyager utilizzando un VMR inTalairach
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 10 / 19
Scelta del k
Risultati della Silhouette per ogni tipologia di clustering utilizzata:
5 10 15 20 25 30-0.01
0
0.01
0.02
0.03
0.04
0.05
0.06
Silhouette PamPearsonSilhouette PamSpearmanSilhouette KmeansEuclideanSilhouette KmeansPearson
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 11 / 19
Qualità cluster
Risultati della Silhouette per kmeans con distanza euclidea:
0
0.2
0.4
kmeansEuclidean 5
0
0.2
0.4
kmeansEuclidean 10
0
0.2
0.4
kmeansEuclidean 15
0
0.2
0.4
kmeansEuclidean 20
0
0.2
0.4
kmeansEuclidean 25
0
0.2
0.4
kmeansEuclidean 30
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 12 / 19
Qualità cluster - 1
Risultati della Silhouette per kmeans con correlazione di Pearson:
0
0.2
0.4
kmeansPearson 5
0
0.2
0.4
kmeansPearson 10
0
0.2
0.4
kmeansPearson 15
0
0.2
0.4
kmeansPearson 20
0
0.2
0.4
kmeansPearson 25
0
0.2
0.4
kmeansPearson 30
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 13 / 19
Qualità cluster - 2
Risultati della Silhouette per Pam con correlazione di Spearman:
-0.10
0.10.20.3
PamSpearman 5
-0.10
0.10.20.3
PamSpearman 10
-0.10
0.10.20.3
PamSpearman 15
-0.10
0.10.20.3
PamSpearman 20
-0.10
0.10.20.3
PamSpearman 25
-0.10
0.10.20.3
PamSpearman 30
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 14 / 19
Qualità cluster - 2
Risultati della Silhouette per Pam con correlazione di Pearson:
00.10.20.3
PamPearson 5
00.10.20.3
PamPearson 10
00.10.20.3
PamPearson 15
00.10.20.3
PamPearson 20
00.10.20.3
PamPearson 25
00.10.20.3
PamPearson 30
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 15 / 19
Risultati
Componente media - cluster 5 Pam Pearson:
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 16 / 19
Risultati - 1
Componente media - cluster 7 Pam Pearson:
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 17 / 19
Risultati - 2
Componente media - cluster 4 Pam Spearman:
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 18 / 19
Riferimenti I
Esposito et al.Independent component analysis of fMRI group studies byself-organizing clustering.Neuroimage 25 193-2015, 2005.http://u.cs.biu.ac.il/~louzouy/courses/seminar/ica2.pdf
E. Quattrocki Knight et al.Self-organizing group level Independent Component Analysisreveals task-related activity as well as resting state networksduring auditory stimulation.Proc. Intl. Soc. Mag. Reson. Med. 19, 2011.http://cds.ismrm.org/protected/11MProceedings/files/1595.pdf
S. Romano (Università degli Studi di Salerno) ICA per analisi di gruppo January 15, 2016 19 / 19