AMD
Analisi Fattoriale
Modelli Fattoriali
Marcello Gallucci
Milano-Bicocca
Modello Fattoriale dell’ACP
Lezione: IV
V15V14V11 V12 V13
Fattore 1 Fattore 2
V20Variabilità osservata
Variabilità catturata (spiegata)
AF
.735 unicità unicità unicità unicità .438Variabilità non condivisa
440. 266.538.−522.
Fattori funzione degli items
Nell’ACP gli item formano i fattori
3211 131211 vavavaF FvFvFvi ++=
3212 232221 vavavaF FvFvFvi ++=
3213 333231 vavavaF FvFvFvi ++=
Esempio 3 items
Matrice di componentia
.717 -.022 -.697
.609 -.659 .441
.592 .705 .390
v1v2v3
1 2 3Componente
Metodo estrazione: analisi componenti principali.3 componenti estrattia.
3592.2609.1717.1 vvvF i ++=
3705.2659.1022.2 vvvF i +−+−=
3390.2441.1697.3 vvvF i ++−=
Varianza e comunalità
Nell’ACP la comunalità iniziale è 1 (100%)
Dunque si assume che tutta la varianza di ogni item può essere spiegata
Anche se poi ne spiegheremo solo una parte
Comunalità
1.000 .4311.000 .2821.000 .2691.000 .6761.000 .4321.000 .4301.000 .4691.000 .5491.000 .735
v1 Scherzosov2 Estroversov3 Espansivov4 Divertentev5 Coloritov13 Diligentev14 Previdentev15 Serenov17 Stabile
Iniziale Estrazione
Metodo di estrazione: Analisi componenti principali.
Varianza spiegabile
Varianza spiegata
Per ogni item
Varianza e comunalità
Nell’ACP la comunalità iniziale è 1 (100%)
Dunque si assume che tutta la varianza di ogni item può essere spiegata
Anche se poi ne spiegheremo solo una parte
v2v1
v4
v3
v3 v2
Varianza spiegabile
Per item v2 (ad esempio)
Varianza e comunalità
Nell’ACP la comunalità iniziale è 1 (100%)
Dunque si assume che tutta la varianza di ogni item può essere spiegata
Anche se poi ne spiegheremo solo una parte
v2v1
v4
v3
v3 v2
Varianza spiegata
F1
F2
Per item v2 (ad esempio)
Il problema della ACP
Il problema dell’ACP è che si assume che tutta la varianza di ogni item possa essere spiegata
Ciò comporta l’estrazione di fattori “in cerca” di varianza non spiegabile
v2v1
v4
v3
v3 v2
Varianza spiegata non condivisa con nessun item
Se una parte di varianza di un item non è condivisa con nessun item, non potrà essere condivisa con un fattore
che accomuna gli item
Ma allora perché provare a spiegarla?
Il problema della ACP
Il problema dell’ACP è che si assume che tutta la varianza di ogni item possa essere spiegata
Ciò comporta l’estrazione di fattori “in cerca” di varianza non spiegabile
v2v1
v4
v3
v3 v2
Varianza non condivisa con nessun item
Non ha molto senso cercare un fattore che spieghi parti di varianza non
condivise
F1
Un altro problema della ACP
un problema più teorico dell’ACP è che si assume i fattori siano la risultante degli items
V5V4V1 V2 V3
Fattore 1 Fattore 2
V6
Items formano il fattore
3211 131211 vavavaF FvFvFvi ++=
Al variare degli item, varia il fattore
Un altro problema della ACP
un problema più teorico dell’ACP è che si assume i fattori siano la risultante degli items
V5V4V1 V2 V3
Fattore 1 Fattore 2
V6
I fattori dovrebbero formare gli item
211 2111 FaFav FvFvi +=
Al variare dei fattori, varia l’item
Sarebbe più logico che gli items variassero al
variare della dimensione sottostante
Items come indicatori del fattore
In un modello più logico gli items rispecchiano la variabilità dei fattori
V1 V2 V3
EstroversioneTanto più uno è
estroverso
Tanto più risponderà con punteggio alto agli
aggettivi di estroversione
Gli items indicano il fattore
Analisi Fattori Comuni
Il modello fattoriale che assume i fattori come formativi degli items si può stimare mediante vari algoritmi (minimi quadrati, massima verosimiglianza, assi principali) facenti parte della famiglia dell’analisi fattori comuni
Per stimare tali modelli bisogna prima aver deciso quanti fattori estrarre (ad esempio con ACP)
Il tipo di informazione in output è la stessa dell’ACP
La soluzione può essere soggetta alle rotazioni
I risultati tendono ad essere peggiori dell’ACP
Ma più veritieriV1 V2 V3
Estroversione
AFC (analisi a fattori comuni)
AFC produce K fattori da noi scelti che formano gli item osservati
V5V4V1 V2 V3
Fattore 1 Fattore 2
V6
I fattori formano gli item
211 2111 FaFav FvFvi +=
Al variare dei fattori, varia l’item
AFC
L’AFC suddivide la varianza degli item in unica (non spiegabile), spiegata e di errore
La varianza spiegata risulterà più veritiera
v2v1
v4
v3
v2
Varianza non condivisa con nessun item= unica
Varianza condivisa non spiegata=Varianza di errore
F1
Varianza condivisa con
items e fattori= spaigata
Il problema della comunalità iniziale
Per calcolare la varianza spiegata e quella di errore, dobbiamo prima sapere quanto è la varianza spiegabile
Ma per sapere quanto è la varianza spiegabile, dobbiamo sapere quanto è la varianza spiegata e quella di errore
Ciò crea un circolo vizioso che va risolto stimando precedentemente una quantità plausibile di varianza spiegabile ed iterare il procedimento di calcolo dei fattori finché tale quantità soddisfa alcuni criteri
Ogni algoritmo di calcolo (minimi quadrati, massima verosimiglianza, etc) usa un criterio diverso
Noi vediamo la logica sottostante
Correlazioni
1 .084 .154 .242*.409 .126 .015
100 100 100 100.084 1 .514** .231*.409 .000 .021100 100 100 100
.154 .514** 1 .588**
.126 .000 .000100 100 100 100
.242* .231* .588** 1
.015 .021 .000100 100 100 100
Correlazione di PearsonSig. (2-code)NCorrelazione di PearsonSig. (2-code)NCorrelazione di PearsonSig. (2-code)NCorrelazione di PearsonSig. (2-code)N
a1
a2
a3
a4
a1 a2 a3 a4
La correlazione è significativa al livello 0,05 (2-code).*.
La correlazione è significativa al livello 0,01 (2-code).**.
Comunalità iniziale
Ma se tutta la varianza di un item non è inclusa nell’analisi, la
matrice di correlazione iniziale non potrà avere 1 sulla diagonale
Matrice di correlazione
Esempio calcolato su un campione di 100 persone
Varianza totale item= comunalità iniziale nella ACP
Correlazioni
1 .084 .154 .242*.409 .126 .015
100 100 100 100.084 1 .514** .231*.409 .000 .021100 100 100 100
.154 .514** 1 .588**
.126 .000 .000100 100 100 100
.242* .231* .588** 1
.015 .021 .000100 100 100 100
Correlazione di PearsonSig. (2-code)NCorrelazione di PearsonSig. (2-code)NCorrelazione di PearsonSig. (2-code)NCorrelazione di PearsonSig. (2-code)N
a1
a2
a3
a4
a1 a2 a3 a4
La correlazione è significativa al livello 0,05 (2-code).*.
La correlazione è significativa al livello 0,01 (2-code).**.
Comunalità iniziale
Dovremmo stimare la quantità di varianza spiegabile ( che sarà poi
divisa in spiegata ed errore)
Matrice di correlazione
Esempio calcolato su un campione di 100 persone
Varianza spiagabile dell’item= comunalità iniziale nella AFC
?
?
?
?
Stima iniziale della comunalità
Se la parte spiegabile di varianza di un item deve essere comune agli item e ai fattori, sicuramente non potrà essere più piccola della parte di varianza che l’item condivide con gli altri item
v2v1
v4
v3
v2
Varianza non condivisa con nessun item= unica
Varianza condivisa non spiegata=Varianza di errore
F1
Varianza condivisa con
items e fattori= spaigata Varianza condivisa con altri item
Stima iniziale della comunalità
La varianza condivisa con tutti gli altri item è una buona stima della varianza spiegabile
Dunque possiamo usare tale stima al posto degli 1 nella matrice di correlazione
v2v1
v4
v3
v2
Varianza condivisa con altri item
R2 multiplo
Quanto è tale varianza?
Dallo studio della regressione sappiamo che la varianza condivisa da un set di variabili indipendenti ed una dipendente è dato dall’R2 della regressione
v2v1
v4
v3
v2R2 ottenuto facendo una regressione con v2 come
dipendente, e tutte gli altri item come variabili indipendenti
Correlazioni
1 .084 .154 .242*.409 .126 .015
100 100 100 100.084 1 .514** .231*.409 .000 .021100 100 100 100
.154 .514** 1 .588**
.126 .000 .000100 100 100 100
.242* .231* .588** 1
.015 .021 .000100 100 100 100
Correlazione di PearsonSig. (2-code)NCorrelazione di PearsonSig. (2-code)NCorrelazione di PearsonSig. (2-code)NCorrelazione di PearsonSig. (2-code)N
a1
a2
a3
a4
a1 a2 a3 a4
La correlazione è significativa al livello 0,05 (2-code).*.
La correlazione è significativa al livello 0,01 (2-code).**.
R2 come comunalità iniziale
Ripetendo tale stima per tutti gli items, abbiamo una stima iniziale
delle varianze spiegabili per ogni item
Matrice di correlazioneVarianza spiagabile dell’item= comunalità iniziale nella AFC
Ra12
?Ra22
Ra32
Ra42
Fattorializzazione
A questo punto i vari metodi di AFC:
estraggono i fattori
calcolano le nuove comunalità sulla base dei fattori estratti
riestraggono i fattori sulla base della matrice con le nuove
comunalità
fin quando il criterio stabilito (e.s minimo errore, massima
verosimiglianza) è soddisfatto
Esemplificazione del processo di fattorializzazione
Correlazioni
1 .084 .154 .242*.409 .126 .015
100 100 100 100.084 1 .514** .231*.409 .000 .021100 100 100 100.154 .514** 1 .588**.126 .000 .000100 100 100 100.242* .231* .588** 1.015 .021 .000100 100 100 100
Correlazione di PearsonSig. (2-code)NCorrelazione di PearsonSig. (2-code)NCorrelazione di PearsonSig. (2-code)NCorrelazione di PearsonSig. (2-code)N
a1
a2
a3
a4
a1 a2 a3 a4
La correlazione è significativa al livello 0,05 (2-code).*.
La correlazione è significativa al livello 0,01 (2-code).**.
.5
.6
.3
.2
I vari R2
211̂ 21 FaFav viFviFi +=
Calcolo delle saturazioni e varianze fattori
Calcolo delle criterio (esempio mimimizzare la differenza fra
variabili riprodotte e osservate)
minimo11̂ =− ii vv 211̂ 21 FaFav viFviFi +=
Stima delle variabili riprodotte dai fattori
22
21)1̂var( viFviFi aav +=
Calcolo nuove comunalitàRicomincia il ciclo
AFC
Conduciamo un AFC sui soliti items con il metodo minimi quadrati
AFC
Definiamo le variabili su cui fare l’analisi
Andiamo a metodo “estrazione”
AFC
Selezioniamo metodo “minimi quadrati” ed il numero di fattori
prescelto
Per il resto procediamo come per ACP
Metodi di estrazione
SPSS fornisce diversi metodi di estrazione dei fattor comuni
Tutti i metodi hanno pregi e difetti
La miglior strategia è provarne vari e trovare quello che propone una struttura migliore
Il metodo degli ASSI PRINCIPALI e MASSIMA VERISIMIGLIANZA sono i metodi più usati
Quando i risultati di questi due metodi sono assurdi (ad esempio nel caso con troppe variabili e pochi soggetti), si può usare MINIMI QUADRATI
Risultati: Comunalità
Notiamo che la comunalità iniziale non è 1 ma varia tra item ad item
La comunalità finale (“estrazione”) è la comunalità risultalte dall’iterazione che ha estratto i fattori prescelti
Comunalità
.077 .203
.055 .100
.048 .093
.175 .254
.090 .171
.110 .170
.105 .158
.177 .438
.089 .069
v1 Scherzosov2 Estroversov3 Espansivov4 Divertentev5 Coloritov13 Diligentev14 Previdentev15 Serenov17 Stabile
Iniziale Estrazione
Metodo di estrazione: Minimi quadrati non pesati.
Generalmente, ma non necessariamente, la comunalità estratta è maggiore di quella di
partenza
Risultati: Varianza spiegata
Varianze spiegate dai fattor comuni, prima e dopo la rotazione
Notiamo che la varianza spiegata non coincide con gli autovalori, che sono calcolati con ACP
ACP che non ci interessa AFC non ruotata AFC ruotata
Risultati: Saturazioni
Saturazioni prima e dopo la rotazione VARIMAX
AFC non ruotataAFC ruotata
AFC vs ACP
Modello teorico
V1 V2 V3
Componente
ACP
V1 V2 V3
Fattore 1
AFC
AFC vs ACP
Decomposizione della varianza di ogni item
ACP AFC
v2
v3
v2F1
Comune
v2
v3
v2F1
Unica
Errore
AFC vs ACP
Comunalità
ACP AFC
v3
Iniziale
Finale
Errore
F1 v2v3
F1 v2
AFC vs ACP
Comunalità
ACP AFC
Comunalità
1.000 .4311.000 .2811.000 .2691.000 .4031.000 .3601.000 .3781.000 .3621.000 .5431.000 .187
v1 Scherzosov2 Estroversov3 Espansivov4 Divertentev5 Coloritov13 Diligentev14 Previdentev15 Serenov17 Stabile
Iniziale Estrazione
Metodo di estrazione: Analisi componenti principali.
Comunalità
.077 .179
.055 .095
.048 .086
.175 .783
.090 .210
.110 .201
.105 .158
.177 .372
.089 .221
v1 Scherzosov2 Estroversov3 Espansivov4 Divertentev5 Coloritov13 Diligentev14 Previdentev15 Serenov17 Stabile
Iniziale Estrazione
Metodo di estrazione: Minimi quadrati non pesati.
AFC vs ACP
Estrazione dei fattori
ACP
Prima tutti, poi un certo numero
Autovalori= varianza spiegata
% varianza totale spiegata non cambia
AFC vs ACP
Estrazione dei fattori
AFC
Ignoriamo ACPVarianza spiegata è
diversa dagli autovalori
% totale non cambia dopo la rotazione
AFC vs ACP
Saturazioni fattoriale non ruotate
ACP AFC
Matrice fattorialea
.153 .424
.195 .249
.149 .267
.482 .146
.281 .303
.380 -.161
.371 -.141
.584 -.312
.257 -.054
v1 Scherzosov2 Estroversov3 Espansivov4 Divertentev5 Coloritov13 Diligentev14 Previdentev15 Serenov17 Stabile
1 2Fattore
Metodo estrazione: minimi quadrati non pesati.2 fattori estratti. 4 iterazioni richieste.a.
Matrice di componentia
.251 .607
.310 .430
.254 .452
.622 .126
.430 .419
.511 -.342
.503 -.329
.612 -.411
.398 -.169
v1 Scherzosov2 Estroversov3 Espansivov4 Divertentev5 Coloritov13 Diligentev14 Previdentev15 Serenov17 Stabile
1 2Componente
Metodo estrazione: analisi componenti principali.2 componenti estrattia.
AFC vs ACP
Saturazioni fattoriale ruotate
ACP AFC
AFC
AFC rappresenta un modello più sofisticato dei dati
E’ preferibile AFC (rispetto a ACP) quando
Il modello teorico è forte
Si conosce il numero di fattori a priori
Si intende stimare un modello realistico
I risultati dell’AFC sono quasi sempre in linea con quelli dell’ACP
Tendono ad essere “peggiori” in termini di varianze spiegate e saturazioni
Tendono ad essere più realistici e più verosimili
Fine
Fine della Lezione