Indici di Variabilità NdE Range (o campo di variabilità) Scarto medio assoluto Somma dei quadrati...

Post on 01-May-2015

229 views 0 download

transcript

Indici di Variabilità

• NdE

• Range (o campo di variabilità)

• Scarto medio assoluto

• Somma dei quadrati

• Varianza e deviazione standard

Il concetto di variabilità

• La variabilità è una misura della dispersione di una distribuzione di frequenza

• La variabilità determina il grado in cui una singola misura è rappresentativa della popolazione

65 75 85 95 105 115 125 135

0

0,25

0,5

0,75

1

1,25

1,5

1,75

2

2,25

2,5

2,75

3

Q.I.

N.

stu

den

ti

Elevata variabilità

65 75 85 95 105 115 125 135

0

1

2

3

4

5

6

7

8

9

10

Q.I.

N.

stu

den

ti

Bassa variabilità

Variabilità e statistica inferenziale

65 75 85 95 105 115 125 135

0

1

2

3

4

5

6

7

8

9

10

Gruppo 1

Gruppo 2

Q.I.

N.

Stu

den

ti

65 75 85 95 105 115 125 135

0

0,25

0,5

0,75

1

1,25

1,5

1,75

2

2,25

2,5

2,75

3

Gruppo 1

Gruppo 2

Q.I.

N.

stu

den

ti

Nell’assenza di variabilità all’interno dei gruppi è evidente che i Q.I. del primo gruppo sono più elevati rispetto a quelli del secondo gruppo

Nella presenza di una forte variabilità all’interno dei gruppi non è evidente in quale gruppo sono più elevati i Q.I.

Indici di variabilità

Due distribuzioni possono avere stessi indici di centralità (media, mediana, moda) ma essere diversamente dispersi.

Il campo di variazione o RANGE

Il campo di variazione di una distribuzione è la differenza fra il valore massimo e il valore minimo rilevati.

Range = Val max- Val min

Osservazioni: 1,2,5,7,8,9

Valore massimo: 9

Valore minimo: 1

Campo di variazione: 8

Il campo di variazione come misura della variabilità

Il campo di variazione si esprime in valori assoluti.

Non dice nulla su come i valori assunti dalla variabile sono distribuiti.

Osservazioni di altezza (mm): 1600,1520, 1720,1670, 1700

Osservazioni di peso (kg) 50, 70, 110, 73, 80 Kg.

Scarto medio assoluto dalla media aritmetica

Lo scarto medio assoluto dalla media aritmetica è la somma degli scarti dei vari dati rispetto alla loro media aritmetica considerati in valore assoluto. Lo scarto medio assoluto non è altro che la media aritmetica delle distanza di ciascun dato dalla media.

Scarto medio assoluto dalla media aritmetica

Varianza e deviazione standard

Definizione intuitiva della variabilità: la variabilità come distanza media di un’”osservazione tipo” rispetto al valore medio per la popolazione

Alcune distanze sono negative, alcune positive

La somma di tutte le distanze è pari a zero

La media delle distanze è pari a zero

Non possiamo utilizzare la somma delle distanza come misura di dispersione

65 75 85 95 105 115 125 135

0

0,25

0,5

0,75

1

1,25

1,5

1,75

2

2,25

2,5

2,75

3

Q.I.

N.

stu

den

ti

Valore medio

Distanza rispetto alla media

Somma dei quadratiLa somma dei quadrati della distanza fra la media (µ) e il valore dell’osservazione

L’utilizzo del quadratoElimina i valori negativiDa maggior peso alle osservazioni lontane dalla media

Il valore della somma dei quadrati aumenta con il numero delle osservazioni.

OsservazioneX ¼ X-¼ (X-¼)^2

1 14 15,6 -1,6 2,562 17 15,6 1,4 1,963 18 15,6 2,4 5,764 22 15,6 6,4 40,965 12 15,6 -3,6 12,966 4 15,6 -11,6 134,567 6 15,6 -9,6 92,168 30 15,6 14,4 207,369 33 15,6 17,4 302,76

10 0 15,6 -15,6 243,36

2)( X

La varianza di una popolazione

• La varianza si calcola come la media del quadrato della distanza fra il valore della singola osservazione e il valore medio per l’insieme delle osservazioni

• La varianza è una misura finalizzata alla standardizzazione delle misure di variabilità

• Il valore della varianza è indipendente rispetto al numero delle osservazioni

N

X 2)(

OsservazioneX ¼ X-¼ (X-¼)^2

1 14 15,6 -1,6 2,562 17 15,6 1,4 1,963 18 15,6 2,4 5,764 22 15,6 6,4 40,965 12 15,6 -3,6 12,966 4 15,6 -11,6 134,567 6 15,6 -9,6 92,168 30 15,6 14,4 207,369 33 15,6 17,4 302,76

10 0 15,6 -15,6 243,36Somma 1044,4N 10Varianza 104,44

La deviazione standard

• La varianza non costituisce una misura “intuitiva” dalla distanza fra una “osservazione tipica” e il valore medio

• Tale distanza è rappresentata dalla deviazione standard

• La deviazione standard di una popolazione è rappresentata dal radice quadrata della varianza della popolazione

N

X

2)(

OsservazioneX ? X-? (X-?)^2

1 14 15,6 -1,6 2,562 17 15,6 1,4 1,963 18 15,6 2,4 5,764 22 15,6 6,4 40,965 12 15,6 -3,6 12,966 4 15,6 -11,6 134,567 6 15,6 -9,6 92,168 30 15,6 14,4 207,369 33 15,6 17,4 302,76

10 0 15,6 -15,6 243,36Somma 1044,4N 10Varianza 104,44Dev. St. 10,22

Esempio

1. Calcolare la varianza e la deviazione standard del seguente insieme di dati

– 10,10,10,10,10

2. Calcolare la varianza e la deviazione standard del seguente insieme di dati

– 1,3,3,4,9

Prima esercitazione

OsservazioneX ¼ X-¼ (X-¼)^2

1 10 10 0 02 10 10 0 03 10 10 0 04 10 10 0 05 10 10 0 0

Media= 10Somma distanze 2̂ 0N 5Varianza 0Dev. St. 0

Completa assenza di variabilità

Seconda esercitazione

OsservazioneX ¼ X-¼ (X-¼)^2

1 1 4 -3 92 3 4 -1 13 3 4 -1 14 4 4 0 05 9 4 5 25

Media= 4Somma distanze 2̂ 36N 5Varianza 7,2Dev. St. 2,68

Visualizzare la deviazione standard

65 75 85 95 105 115 125 135

0

0,25

0,5

0,75

1

1,25

1,5

1,75

2

2,25

2,5

2,75

3

Q.I.

N.

stu

den

ti

=17,2

Questa osservazione è distante 1 Dev. St. rispetto alla media

La Varianza e la Deviazione Standard

La deviazione standard è l’indice normalmente utilizzato per calcolare la dispersione di una distribuzione di dati. Si può affermare che la deviazione standard calcola la “quantità” media di deviazione dalla media. E’ una misura lineare della dispersione dei dati.

La varianza è invece una media di aree e non è mai negativa.

La deviazione standard nella letteratura scientifica

Forma standardizzata di presentazione

forma breve

forma tabellare

Importante indicare la numerosità di ciascuno dei gruppi e sottogruppi

CartoonViolento ControlloMaschi M=15,72 M=6,92

Dev. St.=4,43 Dev.St.=2,26Femmine M=3,47 M=2,61

Dev. St.=1,12 Dev.DSt=0,98

“I bambini che hanno visionato il cartoon hanno mostrato un indice di aggressività (M=12,45, Dev St.=3,7) superiore rispetto al Gruppo di controllo (M=4,22, Dev. St.=1,04)”

Esempio1: distribuzione poco dispersa

Peso (kg) Fa Fa*xi scarto Scarto quadratoScarto

quadratoPonderato

48 0 0,0 -19,7 388,7 0,0

53 0 0,0 -14,7 216,5 0,0

55 0 0,0 -12,7 161,7 0,0

60 0 0,0 -7,7 59,5 0,0

65 24 1560,0 -2,7 7,4 176,8

68 60 4080,0 0,3 0,1 4,9

70 21 1470,0 2,3 5,2 109,7

74 0 0,0 6,3 39,5 0,0

78 0 0,0 10,3 105,8 0,0

80 0 0,0 12,3 150,9 0,0

84 0 0,0 16,3 265,2 0,0

105 7110,0 Somma quadrati 291,4

Media(kg)

67,7 Varianza 2,8

Dev. standard(kg)

1,7

Grafico 1: distribuzione poco dispersa

Distribuzione "concentrata"

0

10

20

30

40

50

60

70

48 53 55 60 65 68 70 74 78 80 84

Peso (kg)

Fre

qu

en

za

Esempio2: bassa dispersione

Peso (kg) Fa Fa*xi Scarto Scarto quadratoScarto quadrato

ponderato

48 0 0,0 -19,7 389,8 0,0

53 0 0,0 -14,7 217,4 0,0

55 2 110,0 -12,7 162,4 324,8

60 5 300,0 -7,7 60,0 299,8

65 17 1105,0 -2,7 7,5 127,9

68 54 3672,0 0,3 0,1 3,6

70 20 1400,0 2,3 5,1 101,9

74 5 370,0 6,3 39,2 195,8

78 2 156,0 10,3 105,2 210,4

80 0 0,0 12,3 150,2 0,0

84 0 0,0 16,3 264,3 0,0

Totale 105 7113,0 Somma quadrati 1264,1

Media (kg) 67,7 Varianza 12,0

Dev. Standard (kg) 3,5

Grafico2: bassa dispersione

Bassa dispersione

0

10

20

30

40

50

60

48 53 55 60 65 68 70 74 78 80 84

peso (kg)

fre

qu

en

za

Esempio3: alta dispersione

Peso (kg) Fa Fa*xi Scarto Scarto quadratoScarto quadrato

ponderato

48 2 96,0 -19,7 389,0 778,1

53 5 265,0 -14,7 216,8 1084,0

55 7 385,0 -12,7 161,9 1133,3

60 10 600,0 -7,7 59,7 596,6

65 15 975,0 -2,7 7,4 111,3

68 22 1496,0 0,3 0,1 1,7

70 18 1260,0 2,3 5,2 93,3

74 7 518,0 6,3 39,4 275,7

78 10 780,0 10,3 105,6 1056,0

80 5 400,0 12,3 150,7 753,5

84 4 336,0 16,3 264,9 1059,7

Totale 105 7111,0 Somma quadrati 6943,0

Media(kg)

67,7 Varianza 66,1

Dev. Standard(kg)

8,1

Grafico3: alta dispersione

Alta dispersione

0

5

10

15

20

25

48 53 55 60 65 68 70 74 78 80 84

peso (kg)

Fre

qu

en

za

Esempio4: dispersione molto elevata

Peso (kg) Fa Fa*xi scarto Scarto quadratoScarto quadrato

ponderato

48 6 288,0 -19,7 389,8 2338,7

53 8 424,0 -14,7 217,4 1738,8

55 8 440,0 -12,7 162,4 1299,0

60 9 540,0 -7,7 60,0 539,6

65 9 585,0 -2,7 7,5 67,7

68 15 1020,0 0,3 0,1 1,0

70 13 910,0 2,3 5,1 66,2

74 11 814,0 6,3 39,2 430,7

78 10 780,0 10,3 105,2 1052,1

80 8 640,0 12,3 150,2 1201,9

84 8 672,0 16,3 264,3 2114,4

Totale 105 7113,0 Somma quadrati 10850,1

Media(kg)

67,7 Varianza 103,3

Dev. Standard (kg 10,2

Grafico4: dispersione molto elevata

Molto dispersa

0

2

4

6

8

10

12

14

16

48 53 55 60 65 68 70 74 78 80 84

peso (kg)

Fre

qu

en

za

Confronto Range – Deviazione standard - Percentili

www.quadernodiepidemiologia.it