+ All Categories
Home > Documents > Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della...

Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della...

Date post: 18-Feb-2019
Category:
Upload: dotruc
View: 214 times
Download: 0 times
Share this document with a friend
16
Pagina 115 Distribuzione semplice di frequenze assolute del carattere X raggruppato in classi Valori centrali c 1 c 2 c i c K = = = σ =ଵ − ሻ = + +⋯+ +⋯+ Variabile divisa in classi: varianza (c i -M) 2 (c i -M) 2 n i (c 1 -M) 2 (c 1 -M) 2 n 1 (c 2 -M) 2 (c 2 -M) 2 n 2 (c i -M) 2 (c i -M) 2 n i (c K -M) 2 (c K -M) 2 n K Car. X n i (x 0 , x 1 ] n 1 (x 1 , x 2 ] n 2 (x i -1 , x i ] n i (x K -1 , x K ] n K Totale n Scarto quadrativo medio == Pagina 116 Esempio Distribuzione degli studenti di SDC frequentanti la facoltà nell’ a.a. 2001/2002 per Voto di Maturità 283 n 5 K Voto Maturità n i [60-70] 72 (70-80] 78 (80-90] 65 (90-95] 18 (95-100] 50 Totale 283 (c i - M ) 2 220,25 23,44 26,62 160,25 311,84 (c i - M ) 2 n i 15858,36 1827,94 1730,00 2884,51 15592,03 37892,84 = σ =భ 5 −ሻ = ଷଽଶ,ସ ଶଷ = ͳ͵͵,ͻͲ =ଵ −ሻ = ͳͷͺͷͺ,͵ + ͳͺʹ,ͻͶ + ͳ͵Ͳ,ͲͲ + ʹͺͺͶ,ͷͳ + ͳͷͷͻʹ,Ͳ͵ = ͵ͺͻʹ,ͺͶ = = ͳ͵͵,ͻͲ =11,57 84 , 79 M
Transcript
Page 1: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

Pagina 115

Distribuzione semplice di frequenze assolute del carattere X raggruppato in classi

Valori

centrali

c 1

c 2

…c i

…c K

��� = � = ��������� = σ�=� �� −�� = � −� � + � −� � +⋯+ �� −� �� +⋯+ �� −� ���

Variabile divisa in classi: varianza

(ci - M)2 (ci - M)2 ni

(c1 - M)2 (c1 - M)2 n1

(c2 - M)2 (c2 - M)2 n2

… …(ci - M)2 (ci - M)2 ni

… …(cK - M)2 (cK - M)2 nK

Car. X n i

(x 0, x 1] n 1

(x 1, x 2] n 2

… …(x i -1, x i ] n i

… …(x K -1, x K ] n K

Totale n

Scarto quadrativo medio= � = �

Pagina 116

EsempioDistribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Voto di Maturità

283n 5K

Voto

Maturitàn i

[60-70] 72

(70-80] 78

(80-90] 65

(90-95] 18

(95-100] 50

Totale 283

(c i - M )2

220,25

23,44

26,62

160,25

311,84

(c i - M )2n i

15858,36

1827,94

1730,00

2884,51

15592,03

37892,84

� = σ�=5 ��−� �=

, = ,�= ��−� �� = , + , + , + , + , = ,

� = � = , =11,57

84,79M

Page 2: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

Pagina 117

QuartiliPrimo quartile Q1: modalità che nella graduatoria(crescente o decrescente) bipartisce il 50% delleosservazioni con modalità più piccole o al più ugualialla Mediana

Terzo quartile Q3: modalità che nella graduatoria(crescente o decrescente) bipartisce il 50% delleosservazioni con modalità più grandi o al più ugualialla Mediana

U.S. A G I F B D L H E M C

xj 1 2 3 4 5 6 7 8 9 10 11

MeQ1Q3

Pagina 118

EsempioDistribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti

U.S. Affitto

U1 40

U2 43

U3 35

U4 33

U5 45

U6 40

U7 36

U8 36

U9 42

U10 38

U11 48

U12 51

U13 39

U14 42

U15 46

U16 59

U17 53

U18 55

U19 42

Senza ordine

Posto U.S. Affitto

1 U4 33

2 U3 35

3 U7 36

4 U8 36

5 U10 38

6 U13 39

7 U1 40

8 U6 40

9 U9 42

10 U14 42

11 U19 42

12 U2 43

13 U5 45

14 U15 46

15 U11 48

16 U12 51

17 U17 53

18 U18 55

19 U16 59

Ordine crescente

La mediana è

“42”

Primo Quartile è “38”

Terzo Quartile

è “48”

42

42

43

45

46

48

51

53

55

59

33

35

36

36

38

39

40

40

42

Affitto

Page 3: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

Pagina 119

Esempio: quartili per una distribuzione di frequenza

Distribuzione dei laureati del 2011 secondo il voto assegnato al prestigio dell’ateneo nel quale si sono laureati

VOTO n i p i N i P i

0 6 21,43 6 21,43

1 1 3,57 7 25,00

5 5 17,86 12 42,86

6 3 10,71 15 53,57

7 3 10,71 18 64,29

8 6 21,43 24 85,71

9 1 3,57 25 89,29

10 3 10,71 28 100,00

TOT 28 100,00

Primo Quartile è “1”

Terzo Quartile è “8”

La frequenza percentuale cumulata corrispondente alla modalità “1” è la prima frequenza percentuale cumulata maggiore o uguale a 25%

La frequenza percentuale cumulata corrispondente alla modalità “8” è la prima frequenza percentuale cumulata maggiore o uguale a 75%

Mediana è “6”

La frequenza percentuale cumulata corrispondente alla modalità “6” è la prima frequenza percentuale cumulatamaggiore o uguale a 50%

Pagina 120

Indici di variabilità relativaConsentono di effettuare confronti sulla variabilità di fenomeni che

presentano unità di misura differenti

pur avendo la stessa unità di misura hanno valori medi differenti e quindi distribuzioni differenti

In alcune situazioni è fuorviante utilizzare la deviazione standard per il confronto:

della variabilità di una variabile osservata su due collettivi differenti di u.s.

della variabilità di due o più variabili osservate sul medesimo collettivo di u.s.

Page 4: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

Pagina 121

Indici di variabilità relativa

Ci permettono di misurare la variabilità indipendentemente dalla grandezza e dalla scala di misura del carattere

Indici percentuali di variabilità o dispersione

Indici di variabilità o dispersione relativa

Sono numeri puri non hanno unità di misura

Pagina 122

Indici di variabilità relativaIndici percentuali di variabilità o dispersione ottenuti dividendo l’indice di variabilità (dispersione) assoluto per la media rispetto alla quale è stato calcolato

Coefficiente di variazione

100M

CV

)max(

Indici di variabilità o dispersione relativa ottenuti dividendo l’indice di variabilità (dispersione) assoluto per il valore massimo che esso può assumere in una situazione ipotetica

Deviazione standard relativa

Numero compreso tra 0 e 1

Page 5: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

Pagina 123

Esempio: due variabili diverse

In un collettivo di 91 ragazze

la media del peso è pari a 55,1 Kg e la deviazione standard è pari a 5,7 Kg

La media della statura è pari a 166,1 cm e la deviazione standard è pari a 6,1 cm

E’ maggiore la variabilità del peso o la variabilità della statura?

Le variabili misurate sono diverse perché espresse in diverse unità di misura

Pagina 124

Esempio: due gruppi con valori molto distanti

Tre neonati pesano rispettivamente 3, 4 e 5 Kg (media=4 Kg e =1 Kg)

Tre bambini di 1 anno pesano 10, 11 e 12 Kg (media=11 Kg e =1 Kg)

La variabile misurata è la stessa ma i valori medi delle osservazioni nei due gruppi sono molto distanti (le osservazioni nei due gruppi sono su diversi ordini di grandezza)

La deviazione standard è uguale nei due gruppi ma il buon senso suggerisce che la variabilità del peso sia maggiore nei neonati!!

Page 6: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

Pagina 125

Soluzione

Media Dev. Standard CV

Peso 55,1 Kg 5,7 Kg 10,3%

Statura 166,1 cm 6,1 cm 3,7%

Media Dev. Standard CV

Neonati 4 Kg 1 Kg 25%

Bambini di 1 anno 11 Kg 1 Kg 9%

La variabilità del Peso è maggiore della variabilità della Satura

La variabilità del Peso è maggiore nel collettivo dei neonati

Pagina 126

Altri indici di variabilitàCampo di Variazione� = ��� �� −��� ��

oppure� = � �� − � �Differenza Interquartilica

R 0

R=0 non c’è variabilità W rappresenta il campo di

variazione per il 50% delle unità centrali

13 QQW

Page 7: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

Pagina 127

Mutabilità

Sinonimo di eterogeneità

Le misure di mutabilità si basano sull’analisi delle frequenze

Mutabilità nulla = tutte le u.s. presentano la stessa modalità Massima omogeneità

Tutte le ni sono uguali a zero tranne una che è pari a n

Mutabilità massima = le frequenze delle varie modalità sono tutte uguali Minima omogeneità

n1= n2=…= ni=…= nK= n/K

Pagina 128

Indici di mutabilità o eterogeneità

Devono esser nulli tutte le u.s. presentano la stessa modalità

Crescere all’aumentare della mutabilità o eterogeneità

Indice di Gini

Page 8: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

Pagina 129

Indici di mutabilità o eterogeneità

Indice di GiniAssume valori tra 0 e 1-(1/K)

Indice di Gini

RelativoAssume valori tra 0 e 1

K

j

j

n

nG

1

2

1

K

G

G

G

11

)max(

Pagina 130

BoxPlot

Tasso di variazione annua della produttività del lavoro

Page 9: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

Pagina 131

Box PlotRappresentazione grafica della distribuzione di uncarattere quantitativo che mette in evidenza la suavariabilità

Elementi caratteristici

1) 1 punto che individua la posizione della media(aritmetica o mediana) della distribuzione

2) 1 rettangolo (box) la cui altezza rappresenta lavariabilità dei valori prossimi alla media scelta

3) 2 segmenti che partono dai lati maggiori delrettangolo e i cui estremi sono rappresentati dai

valori minimo e massimo della distribuzione

Pagina 132

BoxPlot

Tasso di variazione annua della produttività del lavoro

MedianaTerzo quartile

Primo quartile

Page 10: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

Pagina 133

Quale Box Plot?Box plot con mediana

1) Media = mediana

2) Altezza box = differenza interquartile W

Estremo sup.= Q3 Estremo inf.=Q1

3) Estremi dei segmenti

Superiore=valore max Inferiore=valore min

Box plot con media aritmetica

1) Media = media aritmetica

2) Altezza box = 2

Estremo sup.= M+ Estremo inf.=M-3) Estremi dei segmenti

Superiore=M+1,96 Inferiore=M-1,96

Pagina 134

Esempio

A B C D E F G H I L M

4 1 0 1 2 8 5 2 1 5 12

Distribuzione delle nascite in 11 ospedali

C B D I E H A G L F M

0 1 1 1 2 2 4 5 5 8 12

2Me 11 Q 53 Q

Distribuzione ordinata delle nascite in 11 ospedali

Page 11: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

Pagina 135

Box Plot

Terzo quartile

Mediana

Primo quartile

Box Plot con valori anomaliValori anomali:LSR + (LSR - LIR) = 5 + 1,5 (5 - 1) = 11LIR - (LSR - LIR) = 1 - 1,5 (5 - 1) = -5E’ anomalo il solo valore 12 dell’unità F!

Outlier

Unità F

Terzo quartile

Mediana

Primo quartile

Pagina 136

Page 12: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

Pagina 137

Box Plot: variabilità a confronto

Tasso di variazione annua della produttività del lavoro per tre diversi settori produttivi

La costruzione di misure relative

I rapporti statistici(capitolo 10)

Pagina 138

Page 13: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

X1 X2 … Xj … Xk

u1 x11 x12… x1j

… x1k

u2 x21 X22… x2j

… x2k

… … … … … … …

ui xi1 Xi2… xij

… xik

… … … … … … …

un xn1 xn2… xnj

… xnk

Costruire nuove variabili

I2

I12

I22

Ii2

In2

I1

I11

I21

Ii1

In1

A partire da una matrice di dati, mediante opportune operazioni compiute sui

valori delle variabili originarie, si possono ottenere nuove variabili, più

adeguate alla rappresentazione di un fenomeno

Iq

I1q

I2q

Iiq

Inq

Pagina 139

Nuove variabili

Le nuove variabili possono derivare da:

semplici trasformazioni di una sola variabile originaria

Esempi:

• Ij= Xj / max(Xj)

• Ij= Xj / Media(Xj)

• Ij= Ammontare di Xj / Numero u.s.

operazioni che tengono conto di più variabili

Esempi:

– Ij= X1/X2*100

– Ij= (X1+X2)/2

Pagina 140

Page 14: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

Variabili costruite a partire da altre: esempi di uso nella misurazione dei fenomeni

Invecchiamento della popolazione

Densità abitativa di un certo luogo

Reddito pro-capite

Indice dei prezzi al consumo

Tasso di occupazione

Share

In tutti i casi suddetti i fenomeni sono espressi mediante

“variabili” ottenute rapportando diversi valori di una singola

variabile oppure valori di variabili differenti

Per questa loro caratteristica, vengono denominati RAPPORTI

STATISTICI

Essi offrono una immediata ed efficace rappresentazione

sintetica dei fenomeni

Pagina 141

Rapporti Statistici:che cosa sono?

Sono rapporti tra due “quantità”a) tra esse esiste un nesso logico

b) almeno una delle due si riferisce ad un collettivo

NON TUTTI I RAPPORTI SONO RAPPORTI STATISTICI

circonferenza n. nati

diametro popolazione

almeno una delle due quantità poste a confronto deve riferirsi ad un collettivo

Pagina 142

Page 15: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

Esempi di rapporti statistici

Denominazione Come si calcolano

Reddito pro capite Reddito /popolazione residente

Tasso di divorzialità Divorzi /tot. popolazione*1000

Tasso di occupazione Occupati/Pop. > 15 anni *100

Tasso di scolarità Popolazione iscritta e frequentate un livello scolastico/ Pop. residente di età corrispondente *100

Tasso di mortalità infantile Morti nel I° anno di vita/nati vivi nello stesso periodo *1000

Indice invecchiamento Pop. 65 anni +/pop. *100

Indice di vecchiaia Pop. 65 anni +/pop. da 0 a 14 * 100

Densità automobilistica Autovetture immatricolate/pop.residente*1000

Pagina 143

Rapporti statistici: a cosa servono?

1. Confrontare un fenomeno su collettivi di numerosità

differente poiché sono misure “relative”:mettono a confronto variabili che esprimono intensità (es:

reddito) o frequenze (es: numero di laureati) tra diverse

unità di analisi o delle stesse unità in tempi diversi

Esempi:

comparare il livello di istruzione (o il reddito) degli

abitanti in due regioni diverse nello stesso anno

oppure

confrontare il livello di istruzione (o il reddito) degli

abitanti della stessa regione nel 2001 e nel 2011

2. Costruire nuove variabili che hanno un significato

differente da quelle originarie

Pagina 144

Page 16: Variabile divisa in classi: varianza - coris.uniroma1.it · per Voto di Maturità ... della variabilità di una variabile osservata su due collettivi differenti di u.s. della variabilità

Costruire misure relative: i rapporti statistici nella comparazione

Esempio

Analizziamo il numero di occupati nelle seguenti regioni

Fonte: Istat, Forze di Lavoro, Media 2003 *dati assoluti in migliaia

In quale regione la situazione occupazionale è migliore?

Osserviamo che il numero di occupati è influenzato innanzitutto dall’ ammontare della popolazione

nelle regioni considerate

Pagina 145

Numero occupati(*)

Valle d’Aosta 55

Lombardia 4064

Sicilia 1405

Italia 22054

Popolazione 15 anni e più

Valle d’Aosta 104

Lombardia 7877

Sicilia 4139

Italia 49208

Eliminare l’effetto della diversa numerosità della popolazione, significa relativizzare il dato assoluto: calcoliamo un rapporto statistico rapportando il numero di occupati alla popolazione in età attiva

Il rapporto, moltiplicato per 100 per facilitarne la lettura, è il tasso di

occupazione: ci indica quale valore assume O (la popolazione

occupata) per ogni 100 unità di P (Popolazione in età attiva)

Si è così eliminata l’influenza del diverso ammontare delle

popolazioni delle unità territoriali confrontate

Costruire misure relative: i rapporti statistici nella comparazione

Esempio (segue)

Pagina 146

Numerooccupati (O)

Popolazione 15 anni e più (P)

Tasso di Occupazione (O/P*100)

Valle d’Aosta 55 104 52,88

Lombardia 4064 7877 51,59

Sicilia 1405 4139 33,95

Italia 22054 49208 44,82


Recommended