+ All Categories
Home > Documents > LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E...

LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E...

Date post: 10-Aug-2020
Category:
Upload: others
View: 4 times
Download: 0 times
Share this document with a friend
52
UNIVERSITÀ DEGLI STUDI DI BERGAMO Università degli Studi di Bergamo Dipartimento di Scienze Umane e Sociali Corso di Laurea in Scienze Psicologiche Università degli Studi di Bergamo Dipartimento di Scienze Umane e Sociali Corso di Laurea in Scienze Psicologiche LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni Dott. Agostino Brugnera Dott. Nicola Palena Dott.ssa Cristina Zarbo
Transcript
Page 1: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Università degli Studi di BergamoDipartimento di Scienze Umane e SocialiCorso di Laurea in Scienze Psicologiche

Università degli Studi di BergamoDipartimento di Scienze Umane e SocialiCorso di Laurea in Scienze Psicologiche

LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA

Prof. Paolo Cazzaniga

Dott.ssa Roberta Adorni

Dott. Agostino Brugnera

Dott. Nicola Palena

Dott.ssa Cristina Zarbo

Page 2: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Importare un file datiMenù →Open →Browse →Selezionare il file

dati_originale_999.sav

Oppure richiamare il file creato nella lezione precedente

.omv

Page 3: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Calcolare una variabile

Data → Compute• Diamo un nome alla nuova

variabile• Inseriamo la formula per il

calcolo della variabile (somma)

• Elenchiamo le variabili su cui applicare la formula

ESEMPIO 1: Vogliamo calcolare il punteggio somma dei punteggi ai singoli item del questionario sulla Soddisfazione di Vita

Page 4: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Trasformare una variabile

ESEMPIO 2: Vogliamo calcolare il punteggio somma dei punteggi ai singoli item del questionario sull’Ottimismo

In questo caso è necessario ricodificare alcuni item del questionario (item 1, 3, 5), perché• Item 1, 3, 5: un punteggio alto esprime basso ottimismo• Item 2, 4, 6: un punteggio alto esprime alto ottimismoPer calcolare il punteggio somma in modo che rifletta un crescente ottimismo dobbiamo «invertire» il punteggio degli item 1, 3, 5, ricorrendo alla formula

OTTxric = 6 – OTTx

Page 5: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Trasformare una variabile

Data → Transform• Diamo un nome alla nuova variabile• Definiamo la variabile su cui applicare la trasformazione (source variable)• Definiamo il tipo di trasformazione selezionando create new tranform →

edit, poiché la formula che vogliamo usare non compare fra quelle di default

Page 6: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Trasformare una variabileNella finestra che si apre• Diamo un nome alla formula• Scriviamo la formula da applicare (usando la dicitura «$source» possiamo

usare la formula anche per altre variabili)

Page 7: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Trasformare una variabile

Ripetiamo la stessa operazione per gli altri item da ricodificare (OTTI3, OTTI5), richiamando la formula appena creata

Page 8: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Calcolare una variabileA questo punto possiamo calcolare il punteggio somma del questionario Ottimismo

Page 9: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Filtrare i datiData → Filters

Page 10: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Esercizio 1. Filtro: solo maschi

Page 11: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Aggiungere/Disattivare un Filtro

Se clicchiamo sul +

possiamo aggiungere un secondo

filtro

Possiamo disattivare il primo tramite questo pulsante in modo tale che rimanga salvato se servisse per analisi future

Page 12: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Esercizio 2. Filtro: maschi, >= 50 anni

Page 13: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Esercizio 3.

• Filtro: solo femmine che vivono da sole

• Filtro: solo maschi, coniugati, <50 anni

Esercizio 4.

Page 14: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Trasformare una variabile

ESEMPIO 3: Supponiamo di dover riclassificare la variabile ETA’, in modo da suddividere il campione in 3 o 4 fasce d’età.

• Individuiamo le fasce d’età sulla base dei terzili o dei quartili.

• Nella sezione delle statistiche descrittive (Analyses – Exploration– Descriptives) individuiamo i terziliper suddividere l’età in 3 classi, o i quartili per suddividere l’età in 4 classi

Page 15: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Trasformare una variabile scala in una variabile di più basso livello → ETA

Page 16: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Utilizziamo la funzione IF

Per dividere in 4 diversi gruppi la V ETA, secondo i quartili del campione

Attraverso il tasto compute

Page 17: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Trasformare una variabile scala in una variabile di più basso livello → ETA

Page 18: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Trasformare una variabile

Page 19: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Statistiche descrittive

Analyses → Exploration →DescriptivesSi apre il menu delle analisi

Page 20: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Grafici per DescrittiveAnalyses → Exploration, poi clicchiamo su «Plots»

Page 21: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Grafici per DescrittivePer creare grafici di qualità migliore è possibile copiare la tabella di interesse in Excel e generare il grafico

Page 22: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Grafici in Excel1. Riportare i dati

estrapolati dalle descrittive in Jamoviattraverso le Frequencytables (ad esempio per la variabile ST CIV)

2. Selezionare tutte le celle di interesse

3. Cliccare in alto su «inserisci» in modo tale che appaiano le strutture dei grafici che possono essere costruiti

Page 23: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Grafici in Excel: diagramma a barre

Selezionare il grafico desiderato, ad esempio il diagramma a barre.

Il grafico verrà inserito in modo automatico

Page 24: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Grafici in Excel: torta

Selezionare il grafico desiderato. In questo caso, il grafico a torta.

Page 25: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Operazioni possibili: aggiungere etichette

Cliccare con il tasto destro direttamente sul grafico e cliccare su «aggiungi etichette dati»

Page 26: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Operazioni possibili: aggiungere e modificare etichette

In questo modo ha aggiunto i valori corrispondenti ad ogni livello della variabile ST CIV direttamente nel grafico.

Nel caso si volessero le percentuali al posto dei valori, basta cliccare ancora con il tasto destro sul grafico e richiederlo attraverso il tasto «formato etichette dati»

Page 27: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Grafici in ExcelINOLTRE

Si può modificare il titolo del grafico inserendo il nome della variabile di

interesse. In questo caso «STATO CIVILE»

Page 28: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Descrittive: funzione «split by»

NB: solo con variabili misurate su scala nominale!

Page 29: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Descrittive: funzione «split by»

Se richiedo i grafici con la funzione split by, Jamovi creerà i grafici dividendo i dati per i livelli della variabile nominale selezionata.

In questo caso dividendo per i due livelli della variabile SEX: maschi e femmine.

Page 30: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Descrittive: grafici con la funzione «split by»

Page 31: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Ripasso: Statistiche descrittive• Il calcolo delle statistiche descrittive di una variabile

consiste nel misurare quei parametri, come la media e la deviazione standard, che sintetizzano come sono distribuiti nel campione i valori che essa può assumere

• E’ utile per verificare se i valori si distribuiscono secondo un andamento normale oppure se alcuni di essi sbilanciano la distribuzione

• Le statistiche descrittive sono una valutazione preliminare importante per controllare la “normalità”della distribuzione, necessaria per procedere in molte delle elaborazioni statistiche successive

Page 32: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Curva normale e distribuzione dei dati

• Se rappresentiamo un dato raccolto da un grafico poligonale di frequenza e la curva risultante non simula la curva di distribuzione normale (con tutte le sue caratteristiche), questi dati non sono normalmente distribuiti

• Nello specifico, cosa andiamo a valutare?

Page 33: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Indici per testare la normalità:Asimmetria e Curtosi

Asimmetria: misura l'asimmetria dei dati• Positiva o destra: coda destra più lunga• Negativa o sinistra: coda sinistra più lunga

Page 34: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Indici per testare la normalità:Asimmetria e Curtosi

Curtosi: misura il picco di distribuzione dei dati.La curtosi della distribuzione normale è 0.

Page 35: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Misure di forma della distribuzione

Skewness (asimmetria): indice che informa circa il grado di simmetria o asimmetria di una distribuzione• SK = 0 distribuzione simmetrica• SK < 0 asimmetria negativa (mediana>media)• SK > 0 asimmetria positiva (mediana<media)Kurtosis (curtosi): indice che permette di verificare se i dati seguono una distribuzione di tipo «Normale»• KU = 0 distribuzione Normale• KU < 0 distribuzione platicurtica (rispetto alla distribuzione normale ha

frequenza di densità minore per valori molto distanti dalla media)• KU > 0 distribuzione leptocurtica (rispetto alla distribuzione normale ha

frequenza di densità maggiore per valori molto distanti dalla media)

Page 36: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Misure di forma della distribuzione

Le distribuzioni delle variabili deviano fortemente dalla distribuzione normale se:

• Criterio stringente → valori di asimmetria e curtosi maggiori di |1| (Barbaranelli, 2007)

• Criterio più tollerante → valori di asimmetria maggiori di |2| e di curtosi maggiori di |7| (West, Finch, & Curran, 1995)

In questi casi è possibile trasformare i dati per «normalizzarli»

Page 37: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

• Asimmetria positiva molto elevata (> 2) = trasformazione nel reciproco (X*=1/X)

• Asimmetria positiva sostanziale (tra 1 e 2) = trasformazione logaritmo (X*=Log10(X)) o trasformazione Radice Quadrata (X*=SQRT(X))

• Asimmetria negativa molto elevata (> -2) = trasformazione nel reciproco (X*=1/(K-X))

• Asimmetria negativa sostanziale (tra -1 e -2) = trasformazione logaritmo (X*=Log10(K-X)) o trasformazione Radice Quadrata (X*=SQRT(K-X))

K è uguale al valore più alto della variabile X, + 1

Strategie per la trasformazione dei dati

Page 38: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Misure di forma della distribuzione -Jamovi

ESEMPIO 1: consideriamo la variabile «SODVITtot». La distribuzione dei dati è approssimabile a una distribuzione normale?

Seleziono questa variabile in Jamovi e richiamo le statistiche descrittive rilevanti

Page 39: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Misure di forma della distribuzione -Jamovi

Page 40: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Misure di forma della distribuzione -Jamovi

ESEMPIO 2: consideriamo la variabile «OTTItot». La distribuzione dei dati è approssimabile a una distribuzione normale?

Seleziono questa variabile in Jamovi e richiamo le statistiche descrittive rilevanti

Page 41: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Misure di forma della distribuzione -Jamovi

Page 42: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Misure di forma della distribuzione -Jamovi

ESEMPIO• Importiamo il file dati_2lezione_DNN• Calcoliamo la variabile «SODVIT – somma»Come si distribuisce questa variabile?• Richiamiamo le statistiche descrittive

Page 43: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Misure di forma della distribuzione -Jamovi

Page 44: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Misure di forma della distribuzione -JamoviCurtosi= -1.28 → Asimmetria negativa sostanziale (tra -1 e -2)• trasformazione logaritmo (X*=Log10(K-X)), oppure• trasformazione Radice Quadrata (X*=SQRT(K-X))

N.B. K = Xmax + 1nel nostro caso 35+1=36

Page 45: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Misure di forma della distribuzione -Jamovi

Page 46: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

E’ necessario:

• Standardizzare i punteggi relativi alla variabile da analizzare

• Effettuare una distribuzione delle frequenze della nuova variabile standardizzata

• Individuare i punteggi che corrispondono a un valore “z” maggiore di 3 in valore assoluto e considerarli come possibili valori anormali

Provare a fare le analisi sia senza questi possibili outliers che con i possibili outliers. Se i risultati non cambiano più di tanto si possono comunque tenere anche i punteggi definibili come outliers.

Individuare gli outliers

Page 47: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Individuare gli outliersTorniamo al filedati_originale_999

Esempio 1: consideriamo la variabile SODVITtot.

Per individuare gli outliers dobbiamo trasformare i punteggi in z, ovvero

Calcolare una nuova variabile ricorrendo alla procedura «compute variable» e scegliendo la funzione «Z»

Page 48: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Individuare gli outliersOra calcoliamo le statistiche descrittive della nuova variabile e vediamo se ci sono valori z > |3|

In questo caso non ci sono outliers da escludere dalle analisi

Page 49: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Individuare gli outliersEsempio 2: consideriamo la variabile OTTItot.

Per individuare gli outliers dobbiamo trasformare i punteggi in z, ovvero

Calcolare una nuova variabile ricorrendo alla procedura «compute variable» e scegliendo la funzione «Z»

Page 50: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Individuare gli outliersOra calcoliamo le statistiche descrittive della nuova variabile e vediamo se ci sono valori z > |3|

In questo caso ci sono valori di z < -3, quindi ci sono outliers da escludere dalle analisi

Page 51: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Individuare gli outliersL’ultimo passaggio consiste nel filtrare i dati in modo da escludere gli outliers

Attivando o disattivando il filtro, potremo confrontare le statistiche con o senza outliers

Page 52: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare

UNIVERSITÀ DEGLI STUDI DI BERGAMO

Ringraziamenti

Si ringrazia il Prof. Andrea Greco per il materiale fornito


Recommended