Post on 15-Feb-2019
transcript
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
IntroduzioneStrumenti quantitativi per l’economia e la finanza I
Alfonso Iodice D’Enzaiodicede@unicas.it
Universita degli studi di Cassino e del Lazio Meridionale
A. Iodice () Introduzione Statistica 1 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Outline
1 Metodologie per l’analisi congiunta di piu variabili statistiche
2 Metodi di Analisi Multidimensionale dei Dati: obbiettivi etecniche
3 Strutture di dati e tecniche AMD
A. Iodice () Introduzione Statistica 2 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Testo di riferimento
Il testo di riferimento eAppunti di Analisi dei Dati Multidimensionalia
adi Marco Gherghi e Carlo Lauro, RCE edizioni.
A. Iodice () Introduzione Statistica 3 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Metodologie per l’analisi congiunta di piu variabilistatistiche
Lo studio di p variabili statistiche osservate su n oggetti (ounita statistiche) puo essere effettuato mediante tecniche di
Analisi MultivariataSi assume che le p variabili seguano unadistribuzione teorica (multinormale odistribuzioni ad essa collegate): i dati inesame vengono considerati come nrealizzazioni indipendenti di un vettorep-dimensionale.
L’obbiettivo e specificare modelli per laverifica di ipotesi formulate circa ladistribuzione delle variabili considerate
Approccio analitico
Analisi confermativa
Analisi MultidimensionaleSi pone l’attenzione sulle n unitastatistiche descritte dalle p variabiliempiriche
L’obbiettivo e evidenziare la strutturalatente che caratterizza i dati in esame
Approccio geometrico: si consideraciascuna unita rappresentabile comepunto in uno spazio p-dimensionale eciascuna variabile rappresentabile comepunto in uno spazio n-dimensionale
Analisi esplorativa
Descrizione ed induzione
la descrizione dei dati empirici osservati e la formulazione diipotesi sono entrambi determinanti nel processo di acquisizionedella conoscenza.
A. Iodice () Introduzione Statistica 4 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Metodologie per l’analisi congiunta di piu variabilistatistiche
Lo studio di p variabili statistiche osservate su n oggetti (ounita statistiche) puo essere effettuato mediante tecniche di
Analisi MultivariataSi assume che le p variabili seguano unadistribuzione teorica (multinormale odistribuzioni ad essa collegate): i dati inesame vengono considerati come nrealizzazioni indipendenti di un vettorep-dimensionale.
L’obbiettivo e specificare modelli per laverifica di ipotesi formulate circa ladistribuzione delle variabili considerate
Approccio analitico
Analisi confermativa
Analisi MultidimensionaleSi pone l’attenzione sulle n unitastatistiche descritte dalle p variabiliempiriche
L’obbiettivo e evidenziare la strutturalatente che caratterizza i dati in esame
Approccio geometrico: si consideraciascuna unita rappresentabile comepunto in uno spazio p-dimensionale eciascuna variabile rappresentabile comepunto in uno spazio n-dimensionale
Analisi esplorativa
Descrizione ed induzione
la descrizione dei dati empirici osservati e la formulazione diipotesi sono entrambi determinanti nel processo di acquisizionedella conoscenza.
A. Iodice () Introduzione Statistica 4 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Metodologie per l’analisi congiunta di piu variabilistatistiche
Lo studio di p variabili statistiche osservate su n oggetti (ounita statistiche) puo essere effettuato mediante tecniche di
Analisi MultivariataSi assume che le p variabili seguano unadistribuzione teorica (multinormale odistribuzioni ad essa collegate): i dati inesame vengono considerati come nrealizzazioni indipendenti di un vettorep-dimensionale.
L’obbiettivo e specificare modelli per laverifica di ipotesi formulate circa ladistribuzione delle variabili considerate
Approccio analitico
Analisi confermativa
Analisi MultidimensionaleSi pone l’attenzione sulle n unitastatistiche descritte dalle p variabiliempiriche
L’obbiettivo e evidenziare la strutturalatente che caratterizza i dati in esame
Approccio geometrico: si consideraciascuna unita rappresentabile comepunto in uno spazio p-dimensionale eciascuna variabile rappresentabile comepunto in uno spazio n-dimensionale
Analisi esplorativa
Descrizione ed induzione
la descrizione dei dati empirici osservati e la formulazione diipotesi sono entrambi determinanti nel processo di acquisizionedella conoscenza.
A. Iodice () Introduzione Statistica 4 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Metodologie per l’analisi congiunta di piu variabilistatistiche
Lo studio di p variabili statistiche osservate su n oggetti (ounita statistiche) puo essere effettuato mediante tecniche di
Analisi MultivariataSi assume che le p variabili seguano unadistribuzione teorica (multinormale odistribuzioni ad essa collegate): i dati inesame vengono considerati come nrealizzazioni indipendenti di un vettorep-dimensionale.
L’obbiettivo e specificare modelli per laverifica di ipotesi formulate circa ladistribuzione delle variabili considerate
Approccio analitico
Analisi confermativa
Analisi MultidimensionaleSi pone l’attenzione sulle n unitastatistiche descritte dalle p variabiliempiriche
L’obbiettivo e evidenziare la strutturalatente che caratterizza i dati in esame
Approccio geometrico: si consideraciascuna unita rappresentabile comepunto in uno spazio p-dimensionale eciascuna variabile rappresentabile comepunto in uno spazio n-dimensionale
Analisi esplorativa
Descrizione ed induzione
la descrizione dei dati empirici osservati e la formulazione diipotesi sono entrambi determinanti nel processo di acquisizionedella conoscenza.
A. Iodice () Introduzione Statistica 4 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Esempio di distribuzione bivariata
Se si considerano p = 2 variabili statistiche, e possibile rappresentare gli n = 5 individui come punti su unpiano cartesiano(R2).
unita1 10 8unita2 3 5unita3 7 1unita4 5 9unita5 9 5
A. Iodice () Introduzione Statistica 5 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Esempio di distribuzione bivariata
Se si considerano p = 2 variabili statistiche, e possibile rappresentare gli n = 5 individui come punti su unpiano cartesiano(R2).
unita1 10 8unita2 3 5unita3 7 1unita4 5 9unita5 9 5
A. Iodice () Introduzione Statistica 5 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Esempio di distribuzione bivariata
Se si considerano p = 2 variabili statistiche, e possibile rappresentare gli n = 5 individui come punti su unpiano cartesiano(R2).
unita1 10 8unita2 3 5unita3 7 1unita4 5 9unita5 9 5
A. Iodice () Introduzione Statistica 5 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Esempio di distribuzione trivariata
Se si considerano p = 3 variabili statistiche, e possibile rappresentare gli n = 5 individui come punti in unospazio cartesiano tridimensionale (R3).
unita1 7 5 1unita2 8 10 4unita3 10 10 9unita4 8 5 1unita5 2 9 2
A. Iodice () Introduzione Statistica 6 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Esempio di distribuzione trivariata
Se si considerano p = 3 variabili statistiche, e possibile rappresentare gli n = 5 individui come punti in unospazio cartesiano tridimensionale (R3).
unita1 7 5 1unita2 8 10 4unita3 10 10 9unita4 8 5 1unita5 2 9 2
A. Iodice () Introduzione Statistica 6 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Esempio di distribuzione trivariata
Se si considerano p = 3 variabili statistiche, e possibile rappresentare gli n = 5 individui come punti in unospazio cartesiano tridimensionale (R3).
unita1 7 5 1unita2 8 10 4unita3 10 10 9unita4 8 5 1unita5 2 9 2
A. Iodice () Introduzione Statistica 6 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Esempio di distribuzione trivariata
Se si considerano p = 3 variabili statistiche, e possibile rappresentare gli n = 5 individui come punti in unospazio cartesiano tridimensionale (R3).
unita1 7 5 1unita2 8 10 4unita3 10 10 9unita4 8 5 1unita5 2 9 2
A. Iodice () Introduzione Statistica 6 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Esempio di distribuzione multivariata
unita1 3 5 6 7 7 8unita2 2 9 8 4 4 6unita3 7 6 5 9 3 5unita4 3 3 4 9 4 7unita5 2 7 2 6 6 7unita6 1 9 2 5 8 8unita7 8 1 7 9 4 10unita8 5 7 4 9 9 6unita9 10 4 6 7 6 9
unita10 5 9 2 9 4 2
A. Iodice () Introduzione Statistica 7 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Esempio di distribuzione multivariata
A. Iodice () Introduzione Statistica 8 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Metodi di Analisi Multidimensionale dei Dati
Tecniche fattoriali
Obbiettivo: individuare il migliorsottospazio di approssimazione dellastruttura delle relazioni tra le variabili ele unita osservate
se la dimensione dello spazio diapprossimazione e minore o uguale a 3,e possibile ottenere una visualizzazionedella soluzione
Tecniche di classificazione automatica
Obbiettivo: individuare gruppi omogeneidi unita statistiche: in altre parole, leunita statistiche appartenenti ad unostesso gruppo presentano caratteristichesimili. Il grado di similirita tra le unitaviene misurato attraverso opportuniindici, scelti sulla base della natura dellevariabili osservate.
scegliendo opportunamente il tipo dialgoritmo di classificazione automatica epossibile visualizzare la struttura in classiottenuta
A. Iodice () Introduzione Statistica 9 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Metodi di Analisi Multidimensionale dei Dati
Tecniche fattoriali
Obbiettivo: individuare il migliorsottospazio di approssimazione dellastruttura delle relazioni tra le variabili ele unita osservate
se la dimensione dello spazio diapprossimazione e minore o uguale a 3,e possibile ottenere una visualizzazionedella soluzione
Tecniche di classificazione automatica
Obbiettivo: individuare gruppi omogeneidi unita statistiche: in altre parole, leunita statistiche appartenenti ad unostesso gruppo presentano caratteristichesimili. Il grado di similirita tra le unitaviene misurato attraverso opportuniindici, scelti sulla base della natura dellevariabili osservate.
scegliendo opportunamente il tipo dialgoritmo di classificazione automatica epossibile visualizzare la struttura in classiottenuta
A. Iodice () Introduzione Statistica 9 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Metodi di Analisi Multidimensionale dei Dati
Tecniche fattoriali
Obbiettivo: individuare il migliorsottospazio di approssimazione dellastruttura delle relazioni tra le variabili ele unita osservate
se la dimensione dello spazio diapprossimazione e minore o uguale a 3,e possibile ottenere una visualizzazionedella soluzione
Tecniche di classificazione automatica
Obbiettivo: individuare gruppi omogeneidi unita statistiche: in altre parole, leunita statistiche appartenenti ad unostesso gruppo presentano caratteristichesimili. Il grado di similirita tra le unitaviene misurato attraverso opportuniindici, scelti sulla base della natura dellevariabili osservate.
scegliendo opportunamente il tipo dialgoritmo di classificazione automatica epossibile visualizzare la struttura in classiottenuta
A. Iodice () Introduzione Statistica 9 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Metodi fattoriali trattati
Analisi in componenti principali (ACP):
Analisi delle Corrispondenze Binarie (ACB)
Analisi delle Corrispondenze Multiple (ACM)
A. Iodice () Introduzione Statistica 10 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Metodi fattoriali trattati
Analisi in componenti principali (ACP):
Matrice di riferimento ACPn unita statistiche e p variabili quantitative
Analisi delle Corrispondenze Binarie (ACB)Analisi delle Corrispondenze Multiple (ACM)
A. Iodice () Introduzione Statistica 10 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Metodi fattoriali trattati
Analisi in componenti principali (ACP):Analisi delle Corrispondenze Binarie (ACB)
Matrice di riferimento ACBtabella di contingenza tra due mutabili con k e h modalita rispettivamente;
Analisi delle Corrispondenze Multiple (ACM)A. Iodice () Introduzione Statistica 10 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Metodi fattoriali trattati
Analisi in componenti principali (ACP):Analisi delle Corrispondenze Binarie (ACB)Analisi delle Corrispondenze Multiple (ACM)
Matrice di riferimento ACM: dati questionarioDati costituiti da indagini via questionario: n questionari somministrati e p mutabili o variabili suddivise inclassi.
A. Iodice () Introduzione Statistica 10 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Metodi fattoriali trattati
Analisi in componenti principali (ACP):Analisi delle Corrispondenze Binarie (ACB)Analisi delle Corrispondenze Multiple (ACM)
Matrice di riferimento ACM: dati codifica disgiuntivapresenza/assenza delle modalita relative a p variabili
A. Iodice () Introduzione Statistica 10 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Matrici strutturate
Le matrici di dati possono avere una struttura in blocchi lungole righe o le colonne; per rappresentare dati rilevati in diversiistanti di tempo, o in luoghi diversi, e possibile ricorrere amatrici a tre vie.
A. Iodice () Introduzione Statistica 11 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Trasformazione delle variabili
Raccolti i dati in tabelle compatibili con il tipo di variabiliosservate, si effettua
una trasformazione delle variabili in funzione del metodo dianalisi scelto
una omogeneizzazione delle variabili per consentirnetrattamento simultaneo
standardizzazione: se le variabili osservate sono continuecategorizzazione: se le variabili osservate sono qualitative omiste
A. Iodice () Introduzione Statistica 12 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Matrici oggetto di AMD
Le tecniche di analisi dei dati studiano le strutture delleassociazione tra variabili e quella delle relazioni tra le unita
Associazione tra variabili: matrice di correlazione relazioni tra unita: matrice di distanze
A. Iodice () Introduzione Statistica 13 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Selezione del metodo
Il seguente diagramma di flusso (Gherghi e Lauro, 2004) indicala procedura per una corretta scelta del metodo di analisi
Strategia di selezione del metodo AMD
A. Iodice () Introduzione Statistica 14 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Esempio ACP: La dieta di 16 paesi europei
Si consideri di aver rilevato le quantita di sostanze nutritiveingerite in sedici paesi europei
A. Iodice () Introduzione Statistica 15 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Rappresentazione delle variabili: il cerchio dellecorrelazioni
A. Iodice () Introduzione Statistica 16 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Rappresentazione delle unita
A. Iodice () Introduzione Statistica 17 / 18
Introduzione
A. Iodice
Metodologieper l’analisicongiunta dipiu variabilistatistiche
Metodi diAnalisi Multi-dimensionaledei Dati:obbiettivi etecniche
Strutture didati e tecnicheAMD
Rappresentazione congiunta unita/variabili
A. Iodice () Introduzione Statistica 18 / 18