+ All Categories
Home > Documents > Appunti di analisi fattoriale -...

Appunti di analisi fattoriale -...

Date post: 15-Feb-2019
Category:
Upload: phunghanh
View: 245 times
Download: 1 times
Share this document with a friend
39
Corso di Statistica per il Management Prof.ssa Paola Vicard 1 Appunti di analisi fattoriale (i presenti appunti sono principalmente basati sul libro “Statistica per le Scienze Applicate” di Ornello Vitali disponibile presso la biblioteca della Facoltà di Economia) Introduzione allo scopo dell’analisi fattoriale L’analisi fattoriale costituisce una delle metodologie più utilizzate della statistica multivariata per la riduzione dei dati. In molte campi applicativi (tra i quali certamente le rilevazioni aziendali e di marketing) viene spesso rilevato un numero ingente di variabili. Diventa quindi necessario analizzare un’enorme quantità di informazioni. Inoltre l’informazione rilevata si può trasformare in una pericolosa “fonte di confusione” divenendo, quindi, difficile trasformarla in conoscenza ossia in strumento di supporto a decisioni corrette.
Transcript
Page 1: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

1

Appunti di analisi fattoriale (i presenti appunti sono principalmente basati sul libro “Statistica per le Scienze Applicate” di Ornello Vitali

disponibile presso la biblioteca della Facoltà di Economia)

Introduzione allo scopo dell’analisi fattoriale L’analisi fattoriale costituisce una delle metodologie più utilizzate della statistica multivariata per la riduzione dei dati.

In molte campi applicativi (tra i quali certamente le rilevazioni aziendali e di marketing) viene spesso rilevato un numero ingente di variabili. Diventa quindi necessario analizzare un’enorme quantità di informazioni.

Inoltre l’informazione rilevata si può trasformare in una pericolosa “fonte di confusione” divenendo, quindi, difficile trasformarla in conoscenza ossia in strumento di supporto a decisioni corrette.

Page 2: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

2

Quando le variabili sono molte può accadere che alcune di esse vadano, sebbene indirettamente, a rilevare lo stesso tipo di informazione, ossia può succedere che i contributi informativi di due o più variabili si possano parzialmente sovrapporre.

Le tecniche statistiche di riduzione dei dati (tra cui l’analisi fattoriale) servono proprio a distinguere il contributo informativo proprio di ciascuna variabile dal contributo informativo “condiviso” con le altre variabili.

In particolare, queste tecniche sfruttano la correlazione esistente tra le k

variabili osservate (originarie) per creare un numero m più ridotto (m<k) di variabili latenti (o fattori latenti) dati da combinazioni lineari delle variabili originarie.

Page 3: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

3

Vantaggi e svantaggi (in breve) dell’analisi fattoriale

+ Sicuramente un vantaggio è proprio dato dal fatto che l’analisi fattoriale consente di effettuare una riduzione dei dati e, quindi, di estrarre più facilmente informazione da data set di dimensioni consistenti.

+ Un altro vantaggio è che i fattori estratti possono essere di per sé utili come input per ulteriori successive analisi statistiche.

– Uno svantaggio è invece dato dal fatto che quando si effettua una riduzione dei dati, c’è una (ovvia) conseguente perdita di parte dell’informazione originaria (e l’introduzione di alcune componenti di errore).

Page 4: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

4

Il modello statistico di analisi fattoriale

Sia X una variabile multidimensionale a k componenti X1,...Xk con vettore di medie µ.

Le variabili X1,...Xk sono variabili osservabili (o indicatori, direttamente rilevabili su un campione di unità statistiche). Introduciamo l’ipotesi che le k variabili osservabili possano essere scritte come funzione (lineare) di m (m < k) fattori latenti (ossia variabili non direttamente osservabili sulle nostre unità statistiche). Il modello che viene ipotizzato è il seguente

Page 5: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

5

1 1 11 1 12 2 1 1

1 1 2 2

m m

k k k k km m k

X f f f u

X f f f u

µ λ λ λ

µ λ λ λ

= + + + + +

= + + + + +

1, , kf f… sono i fattori comuni

1, , ku u… sono i fattori specifici

1, , , 1, ,j jm

j kλ λ =… … , sono i pesi fattoriali (o factor loadings).

Si noti che i fattori specifici 1, , ku u… hanno nel modello un ruolo di variabili essenzialmente residuali.

non osservabili

Page 6: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

6

Lo stesso modello può essere scritto in modo più compatto utilizzando il linguaggio delle matrici.

( )

( )

( )

( )( )

1

1 1

21 1

21

dove ha i seguenti vettori di medie e matrice di var/cov:

vettore delle medie

matrice di varianze e

k

k k

k'

k k

X

X X

X

E X

E X

E X

E X X

µ

µ

µ

σ σ

µ µ

σ σ

=

= = = =

Σ = − − = =

� �

� � �

covarianze

Page 7: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

7

11 12 11 1

21 22 2

1 2

m

m

m k

k k km

f u

f u

f u

λ λ λ

λ λ λ

λ λ λ

= Λ = =

�� �

� � � �

.

Pertanto il modello di analisi fattoriale può essere scritto sinteticamente così:

X f uµ= + Λ +

Page 8: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

8

Per definizione sappiamo che E(X) = µ, quindi da E(X) = µ + ΛE(f ) + E(u) ricaviamo che:

E(f ) = 0

E(u) = 0

Page 9: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

9

Ipotesi alla base del modello Vediamo innanzitutto le ipotesi minimali che è necessario introdurre per la definizione del modello. 1. omoschedasticità e incorrelazione dei fattori (Var(fh)=1, h = 1,...,m)

Var(fh) = 1 h = 1,..., m (omoschedasticità)

Cov(fh, fl) = 0 h, l = 1,..., m h ≠ l (incorrelazione)

( )E 'm

ff I=

2. Var(uj) = Ψj, j = 1,..., k

Cov(uj,ut) = 0, j ,t= 1,..., k, j ≠ t , incorrelazione dei fattori specifici

Page 10: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

10

In termini matriciali, indichiamo con Ψ la matrice di varianze e covarianze dei fattori specifici; questa è diagonale in quanto gli elementi al di fuori della diagonale rappresentano le covarianze che sono qui assunte nulle. Possiamo scrivere

( ) ( ) ( )1 0

Var =E ' diag 0 0

0j

k

u uu

Ψ Ψ = = Ψ =

Ψ

3. incorrelazione tra fattori comuni e fattori specifici

Cov(fh, uj) = 0, h=1,…,m e j=1,…,k

In termini matriciali, E(f u’) = 0.

Page 11: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

11

Le ipotesi sopra elencate possono essere integrate a fini inferenziali. È infatti necessario fare delle assunzioni di carattere distribuzionale. Le ipotesi aggiuntive sono:

4. f è una v.a. multinormale: ( )0,m m

f MN I∼

5. u è una v.a. multinormale: ( )0,k k

u MN Ψ∼

6. f e u sono indipendenti

( ),k

X MN µ Σ∼

poiché la combinazione lineare di variabili aleatorie normali indipendenti è ancora una normale.

Page 12: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

12

Il ruolo dei pesi fattoriali. Nel modello di analisi fattoriale un ruolo molto importante è esercitato dai pesi fattoriali. Questi, vedremo, sono direttamente collegati alla variabilità delle Xj, j = 1,..., k.

Dall’incorrelazione tra fattori comuni (ipotesi 1) e dei fattori comuni con i fattori specifici (ipotesi 3) ne deriva che

( ) ( ) ( ) ( ) ( )

( ) ( ) ( ) ( )1 1 2 2

2 2 21 1 2 2

2 2 2 21 2

1

j j j jm m j

j j jm m j

m

j j jm j jh j

h

Var X Var f Var f Var f Var u

Var f Var f Var f Var u

λ λ λ

λ λ λ

λ λ λ λ=

= + + + + =

= + + + + =

= + + + + Ψ = + Ψ∑

1 1

1 Ψj

cj

Page 13: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

13

2

1

m

j jh

h

c λ=

=∑ è detta comunalità e rappresenta la parte delle varianza di Xj

spiegata dai fattori comuni Ψj è, invece, la varianza specifica (ossia la parte di varianza non

spiegata dai fattori comuni) ed ha natura residuale.

Osservazione: abbiamo visto, quindi, che la varianza di ogni indicatore (ossia di ogni variabile osservata o item) ha due “cause”:

i) la varianza condivisa con gli altri indicatori attraverso i fattori latenti comuni f;

ii) la varianza dovuta al fattore specifico u.

Page 14: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

14

Anche la covarianza tra due generiche variabili osservate, ad es. Xj e Xt, può essere espressa in termini di factor loadings:

( )

( ) ( ) ( ) ( )

( ) ( )

( )

1 2 1 2

1 2

1 2 1 2

1 2 1

1 1

1 1 1 1

1 1

1

, ,

, , , ,

, ,

m m

j t jh h j th h t

h h

m m m m

jh th h h jh h j th h t j t

h h h h

m m

jh th h h jh th h h

h h h h

m

jh th h

h

jh th

h

Cov X X Cov f u f u

Cov f f Cov f u Cov f u Cov u u

Cov f f Cov f f

Var f

λ λ

λ λ λ λ

λ λ λ λ

λ λ

λ λ

= =

= = = =

= = ≠

=

=

= + + =

= + + + =

= + =

= =

=

∑ ∑

∑∑ ∑ ∑

∑ ∑∑

1

m

∑La covarianza tra due variabili osservabili è dovuta ai fattori comuni.

Per le ipotesi 1, 2 e 3 del modello di analisi fattoriale.

0 0 0

0

Page 15: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

15

Alcune osservazioni:

Il modello di analisi fattoriale cerca di spiegare la struttura di dipendenza lineare tra le variabili osservabili in termini di fattori comuni.

L’idea alla base di questo ragionamento è che l’associazione tra due generiche variabili ci sia perché queste due variabili dipendono da uno stesso fattore latente. È auspicabile che il numero dei fattori sia piccolo rispetto al numero degli indicatori. Ciò per un principio di parsimonia.

Page 16: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

16

I risultati che abbiamo visto sulla varianza e covarianza delle variabili osservate, possono essere riassunti in forma matriciale: 'Σ = ΛΛ + Ψ Problema: c’è una indeterminazione in quanto la matrice Λ non è

identificata.

Cosa significa “non identificata”? Vediamo innanzitutto quando una matrice si dice identificata. La matrice Λ (ossia tutti i suoi elementi) si dice identificata se, date Σ e Ψ (cioè date le varianze 2

jσ e le covarianze jtσ delle variabili osservate

X e date le varianze j

Ψ dei fattori specifici u), essa è univocamente

determinata dalla relazione Σ = ΛΛ’ + Λ. Ciò purtroppo non succede nel caso dell’analisi fattoriale.

Page 17: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

17

Vediamo perché:

Sia Q una matrice ortogonale (ossia tale che Q’ = Q-1) di ordine m.

Sia Λ* = ΛQ una trasformazione ortogonale di Λ.

Si fissino Σ e Ψ.

Λ*Λ*’ = ΛQQ’Λ’ = ΛΛ’

Σ = Λ*Λ*’ + Ψ

Quindi alle stesse matrici Σ e Ψ corrispondono diverse matrici Λ (ossia diverse matrici di pesi fattoriali) legate fra loro da trasformazioni ortogonali.

Pertanto Λ risulta identificata solamente a meno di una post-moltiplicazione per una matrice ortogonale.

QQ’ è uguale alla matrice identità Im per l’ortogonalità

Page 18: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

18

Il problema della non identificazione di Λ può essere superato imponendo vincoli su Λ. I vincoli riguardano la struttura della matrice e hanno come fine l’eliminazione della possibilità di effettuare trasformazioni ortogonali.

______________________________________________________________________

Di seguito trovate quelli più diffusi.

• Un vincolo molto usato è

1

11 2

0

' 0 0

0m

m

b

B b b b

b

Λ Ψ Λ = = > > >

� �

• Un altro vincolo usato si basa su Σ. In particolare, a partire da ( )

21

2

0

diag 0 0

0k

σ

σ

Σ =

,

considera

Page 19: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

19

( )( )11

2

1 0

diag 0 0

0 1k

σ

σ

Σ =

Il vincolo per Λ quindi è:

( )( )11

21 2

0

' diag 0 0

0m

m

b

B b b b

b

Λ Σ Λ = = > > >

� �

Nota: della matrice B si specifica solo la struttura ma non i suoi valori. Infatti B serve solo a

stabilire che 1' −Λ Ψ Λ o ( )( )1

2' diag−

Λ Σ Λ devono avere una certa struttura (in modo

da eliminare la possibilità di effettuare trasformazioni ortogonali). _____________________________________________________________________________

Page 20: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

20

Invarianza del modello di analisi fattoriale Il modello di analisi fattoriale è invariante per cambiamenti di unità di misura. Vediamo che significa. In generale cambiare l’unità di misura di una variabile, diciamo Xj, significa moltiplicarla per un generico numero reale positivo aj che esprime il passaggio da un’unità di misura all’altra *

j j jX a X= . 1

Nel caso multivariato in cui si hanno k variabili, scriviamo il cambiamento di unità di misura così:

X* = AX

dove X* è il vettore delle variabili osservabili trasformate. 1 Ad esempio se la variabile Xj esprime una statura in metri e decidiamo, invece, di voler esprime la statura in centimetri, si avrà la variabile trasformata Xj

* che sarà 100⋅Xj cioè aj = 100.

Page 21: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

21

Pertanto a partire dal modello X f uµ= + Λ + , si giunge al nuovo modello premoltiplicando tutti i suoi membri per la matrice A:

*X AX A A f Auµ= = + Λ +

Ossia, ponendo * * *, e A A Au uµ µ= Λ = Λ = , * * * *

X f uµ= + Λ +

Quindi, con un cambiamento di unità di misura si ha che la matrice dei

factor loadings viene trasformata nello stesso modo in cui era stata

trasformata la X, cioè la j-esima riga di Λ viene moltiplicata per aj.

Vediamo che succede alla matrice di varianze e covarianze di X*:

( )

��* *'

*

* *' *

' ' '

' ' '

A A A A

A A A AΛ Λ

Σ = Σ = ΛΛ + Ψ =

= Λ Λ + Ψ = Λ Λ + Ψ

Matrice di var/cov di u*.

Page 22: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

22

Stima dei parametri del modello mediante il metodo

della massima verosimiglianza Ai fini dell’utilizzo del modello è necessario stimarne i parametri ossia µ, Σ, Λ, Ψ. Introduciamo l’ipotesi di multinormalità di u e di f da cui deriva (come visto) la multinormalità di X. Indichiamo con:

1 , , nX X⋅ ⋅… le n osservazioni campionarie di X (ossia sulle sue k componenti)

1 , , nx x⋅ ⋅… le n determinazioni campionarie di X (ossia sulle sue k componenti)

1 , , nX X⋅ ⋅… sono n vettori aleatori indipendenti e identicamente distribuiti secondo una multinormale di vettore delle medie µ e matrice di varianze e covarianze Σ.

Page 23: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

23

Per ciascuna , 1, ,iX i n⋅ = … , vale il modello i i iX f uµ⋅ = + Λ +

fi è il vettore aleatorio dei fattori comuni (ha m componenti, ossia gli m fattori latenti) relativo alla variabile , 1, ,iX i n⋅ = … .

1, , nf f… sono tutti indipendenti e hanno la stessa distribuzione di f.

ui è il vettore aleatorio dei fattori specifici relativo alla variabile , 1, ,iX i n⋅ = … .

1, , nu u… sono tutti indipendenti e hanno la stessa distribuzione di u.

Come è noto il vettore µ delle medie e la matrice Σ possono essere stimate rispettivamente con:

Page 24: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

24

2 2 21 1 12 1

2 2 22 21 2 2

2 2 21 2

k

k

k k k k

X S S S

X S S SX S

X S S S

= =

� � � � �

dove

( )

( )( )

1

22

1

2

1

11, ,

11, ,

1, 1, ,

n

j ij

i

n

j ij j

i

n

jt ij j it t

i

X X j kn

S X X j kn

S X X X X j t k j tn

=

=

=

= =

= − =

= − − = ≠

Page 25: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

25

_____________________________________________________________________________ (facoltativo) Consideriamo il metodo della massima verosimiglianza. La funzione di verosimiglianza assume la seguente forma:

( )( )

( ) ( )12 2

1

1 1, , exp '

22 | |

n

i ink ni

L x xµ µ µπ

⋅ ⋅=

Λ Ψ = − − Σ −

Σ ∑

Σ non appare tra i parametri rispetto ai quali si studia la verosimiglianza in quanto è definito a partire da ,Λ Ψ mediante 'Σ = ΛΛ + Ψ . Assumiamo che Λ sia identificata (a questo fine usiamo la condizione di identificazione

11

0

' 0 0

0m

b

B

b

Λ Ψ Λ = =

).

è uno scalare in quanto prodotto di tre matrici di dimensione rispettivamente: 1×k, k×k, k×1

Page 26: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

26

Sappiamo che per qualunque Σ, lo stimatore di massima verosimiglianza di µ è dato da X .

Pertanto rimangono da stimare i parametri ,Λ Ψ .

A tal fine occorre massimizzare ( ), ,L µΛ Ψ o, equivalentemente la sua trasformazione

logaritmica ( ), , µΛ Ψ� che è data da

( ) ( ) ( ) ( )

( ) ( )

1

1

1

1, , ln 2 ln | | '

2 2 2

ln 2 ln | | tr2 2 2

n

i i

i

nk nx x x

nk n nS

π µ µ

π

⋅ ⋅

=

Λ Ψ = − − Σ − − Σ − =

= − − Σ − Σ

∑�

Page 27: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

27

Quest’ultimo passaggio si ha perché:

( ) ( ) ( )( )( )1 1' tr 'i i i i

x x x x x x x x− −

⋅ ⋅ ⋅ ⋅− Σ − = Σ − −

quindi

( ) ( ) ( )( )( ) ( )( )

( )( )

n n1 1 1

1 1 1

n1

1

' tr ' tr '

tr '

n

i i i i i i

i i i

i i

i

x x x x x x x x x x x x

x x x x

− − −

⋅ ⋅ ⋅ ⋅ ⋅ ⋅= = =

⋅ ⋅=

− Σ − = Σ − − = Σ − − =

= Σ − −

∑ ∑ ∑

Sappiamo che ( )( )n

1

1'i i

i

S x x x xn

⋅ ⋅

=

= − −∑

Quindi ( )( ) ( ) ( )n

1 1 1

1

tr ' tr tri i

i

x x x x nS n S− − −

⋅ ⋅

=

Σ − − = Σ = Σ

E quindi abbiamo mostrato che

( ) ( ) ( )1, , ln 2 ln | | tr2 2 2

nk n nx Sπ −Λ Ψ = − − Σ − Σ�

__________________________________________________________

Page 28: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

28

Per stimare i factor loadings (gli elementi della matrice Λ) e le varianze

jΨ dei fattori specifici occorre minimizzare la seguente espressione

( ) ( )1, ln | | trG S−Λ Ψ = Σ + Σ

Gli stimatori Λ̂ e Ψ̂ non sono ricavabili in forma esplicita. Λ̂ e Ψ̂ devono soddisfare le due seguenti condizioni matriciali

( )

( ) ( )

1 1ˆ ˆ ˆ ˆ ˆ ˆ ˆdove '

ˆ ˆ ˆdiag ' diag

mI B S B

S

− −Λ + = Ψ Λ = Λ Ψ Λ

ΛΛ + Ψ =

Dalla seconda condizione vediamo che abbiamo trovato in chiave campionaria quanto era stato dimostrato per la popolazione e cioè

2j j j

c σ+ Ψ = .

Page 29: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

29

Infatti, dalla seconda condizione si ha che se ˆ , 1, , e 1, ,jh

j k h mλ = =… … ,

è lo stimatore (di massima verosimiglianza) di jhλ e se ˆ , 1, ,j

j kΨ = … , è lo

stimatore (di massima verosimiglianza) di j

Ψ allora posso ricavare lo

stimatore (di massima verosimiglianza) della comunalità cj come segue:

2

1

ˆˆ 1, ,m

j jh

h

c j kλ=

= =∑ …

Infatti (facoltativo)

( )

11 12 1 11 21 1

21 22 2 12 22 2

1 2 1 2

2 2 211 12 1

2 2 221 22 2

2 21 2

ˆ ˆ ˆ ˆ ˆ ˆ

ˆ ˆ ˆ ˆ ˆ ˆˆ ˆdiag ' diag

ˆ ˆ ˆ ˆ ˆ ˆ

ˆ ˆ ˆ 0 0

ˆ ˆ ˆ0 0

ˆ ˆ0 0

m k

m k

k k km m m km

m

m

k k

λ λ λ λ λ λ

λ λ λ λ λ λ

λ λ λ λ λ λ

λ λ λ

λ λ λ

λ λ

ΛΛ = =

+ + +

+ + +=

+

� �

� �

� � � � � � � �

� �

2k̂mλ

+ + �

Page 30: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

30

Dall’equazione matriciale ( ) ( )ˆ ˆ ˆdiag ' diag SΛΛ + Ψ = ottengo per la

generica j-esima componente (ossi la variabile osservabile Xj) che 2 2

1

ˆ ˆ 1, ,m

jh j j

h

S j kλ=

+ Ψ = =∑ …

e quindi

2ˆˆ 1, ,j j j

c S j k+ Ψ = = …

Cioè abbiamo trovato in chiave campionaria quanto era stato dimostrato per la popolazione ossia 2

j j jc σ+ Ψ = .

Page 31: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

31

Il ruolo dei pesi fattoriali Assumiamo dato il numero di fattori. La procedura di stima è di tipo iterativo e si articola nei seguenti passi:

1. sulla base delle correlazioni tra le variabili originarie (indicatori) si effettua una stima iniziale dei pesi fattoriali

2. sulla base di questa stima iniziale si possono stimare le varianze specifiche

3. mediante il metodo della massima verosimiglianza, sulla base delle stime delle

jΨ ottenute nel passo precedente, si possono ottenere

nuove (aggiornate) stime dei pesi fattoriali 4. mediante il metodo della massima verosimiglianza, sulla base delle

stime dei factor loadings ottenute nel passo precedente, si possono ottenere nuove (aggiornate) stime delle

5. si ritorna al passo 3. e si procede iterativamente finché le stime dei factor loadings e delle

jΨ sono sufficientemente stabili.

Page 32: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

32

Verifica di ipotesi sul numero di fattori Assumiamo la multinormalità di f e u e quindi di X. Occupiamoci della verifica di ipotesi sul numero di fattori comuni da usare. L’ipotesi nulla è:

H0: Σ = ΛΛ’+Ψ per un valore m specificato a priori.

Con questa ipotesi si verifica se bastano m fattori per spiegare completamente la struttura relazionale (insita in Σ) delle k variabili osservate. L’ipotesi alternativa è la seguente:

H1: Σ ≠ ΛΛ’+Ψ

ossia m fattori non bastano per spiegare la struttura di interdipendenza tra le variabili.

Page 33: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

33

_____________________________________________________________________________ (facoltativo) Per effettuare questa verifica di ipotesi il test più comunemente usato è quello del rapporto delle massime verosimiglianze (LRT). Sotto H0 la verosimiglianza è data da:

( )( )

( ) ( )12 2

1

1 1, , exp '

22 | |

n

i ink ni

L x xµ µ µπ

⋅ ⋅=

Λ Ψ = − − Σ −

Σ ∑

Sotto H1 la verosimiglianza è data da:

( )( )

2 2

1, , exp

22 | |nk n

nkL

π

Λ Ψ = −

Indichiamo con ˆˆ ˆ e L L le funzioni di verosimiglianza sotto H1 e sotto H0 calcolate in corrispondenza delle rispettive stime di massima verosimiglianza.

La statistica del LRT è data da ˆ̂ ˆL L. Non è nota la distribuzione di tale rapporto, ma si può dimostrare che

( )ˆ̂ ˆ2log L L− ha, per n che tende a infinito, distribuzione asintotica χ2 con gradi di libertà

( ) ( )21

2g k m k m = − − +

_____________________________________________________________________________

Page 34: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

34

Procedimento di verifica

Generalmente si inizia con un numero basso m* di fattori (per es. m = 1). Si esegue il test LRT

2 per verificare se il numero dei fattori è m*. Il test

ha distribuzione asintotica χ2 con ( ) ( )21

2k m k m − − +

gradi di libertà

• Se si accetta l’ipotesi nulla la procedura si ferma;

• se si rifiuta l’ipotesi nulla allora si fissa a m*+1 il numero dei fattori e si esegue il LRT per verificare se il numero dei fattori è m*+1.

Il procedimento si ferma non appena si verifica una delle due situazioni seguenti:

� il numero dei gradi di libertà diviene zero � al primo valore di m per il quale si accetta H0.

In entrambi i casi si prende come numero di fattori comuni l’ultimo m per il quale si è accettata H0.

2 Illustrato nella pagina (facoltativa) precedente.

Page 35: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

35

Come interpretare i fattori?

Nell’interpretazione dei fattori un ruolo fondamentale è giocato dai pesi fattoriali stimati.

Infatti basta pensare al significato dei pesi fattoriali:

jhλ è il peso del fattore fh nel determinare la variabile osservata Xj.

Perché?

Consideriamo la definizione del modello di analisi fattoriale:

1 1 2 2j j j j jm m jX f f f uµ λ λ λ= + + + + +�

E ricordiamo che i fattori specifici e quelli comuni sono incorrelati e che Var( fh ) = 1, h = 1,..., m.

Ne segue che jh

λ formalmente è la covarianza tra fh e Xj.

Page 36: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

36

Infatti

( ) ( ) ( ) ( ) ( ) ( )( )

1 1 2 2, , , , , ,

,

j h j h j h jh h h jm m h j h

jh h h jh

Cov X f Cov f f Cov f f Cov f f Cov f f Cov u f

Cov f f

λ λ λ λ

λ λ

= + + + + + =

= =

Nota: si noti che se le variabili sono standardizzate allora i pesi fattoriali coincidono con i coefficienti di correlazione.

Il significato sostanziale dei fattori latenti deriva dalle variabili

osservate a cui il fattore è maggiormente correlato.

Situazione ideale: per ogni variabile osservata Xj ci sono pochi pesi fattoriali elevati in valore assoluto.

Purtroppo questa situazione si verifica raramente.

Page 37: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

37

In generale non si osserva grande differenza nel valore dei pesi fattoriali.

E allora come fare?

Si effettua una trasformazione ortogonale (ossia una rotazione) passando da f a Q'f f=� , dove Q è una matrice ortogonale.

da Λf si passa a fΛ�� con QΛ = Λ� (perché QQ'f f fΛ = Λ = Λ�� ).

ˆ ˆ QΛ = Λ�

, cioè si effettua la medesima trasformazione ortogonale sulla matrice delle stime dei pesi fattoriali.

Page 38: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

38

Q può essere scelta in molti modi diversi.

Uno dei metodi più usati è il metodo varimax (proposto da Kaiser).

Il metodo consiste nel determinare la matrice Q in modo da massimizzare la somma delle varianze dei quadrati dei pesi fattoriali trasformati.

2

2

1 1 1

1m k k

jh uh

h j ukλ λ

= = =

∑∑ ∑� �

In sostanza questo metodo lavora colonna per colonna ed è particolarmente appropriato quando

a) si vuole ottenere una netta separazione tra i fattori

b) se non si hanno criteri di riferimento

Page 39: Appunti di analisi fattoriale - host.uniroma3.ithost.uniroma3.it/facolta/economia/db/materiali/insegnamenti/577... · Corso di Statistica per il Management Prof.ssa Paola Vicard 1

Corso di Statistica per il Management Prof.ssa Paola Vicard

39

Varimax funziona meno bene se si desidera un modello uni-fattoriale (accade che la maggior parte delle variabili ottiene un punteggio elevato con conseguente difficoltà di interpretazione).

In tal caso funziona meglio il metodo quartimax che mira a stabilire la corrispondenza tra la variabile osservata (sulla riga) e uno o pochissimi fattori. Ciò significa, quindi, che con il metodo quartimax la rotazione è effettuata riga per riga.


Recommended