LA VARIABILITA IV lezione di Statistica Medica. Sintesi della lezione Il concetto di variabilità...

Post on 01-May-2015

218 views 1 download

transcript

LA VARIABILITA’

IV lezione di Statistica Medica

Sintesi della lezione Il concetto di variabilità Campo di variazione Differenza interquartile La varianza La deviazione standard Scostamenti medi

Il concetto di variabilità

65 75 85 95 105 115 125 135

0

0,25

0,5

0,75

1

1,25

1,5

1,75

2

2,25

2,5

2,75

3

Q.I.

N.

stu

den

ti

65 75 85 95 105 115 125 135

0

1

2

3

4

5

6

7

8

9

10

Q.I.

N.

stu

dent

i

Si definisce come l’attitudine di un fenomeno ad assumere valori diversi

65 75 85 95 105 115 125 135

0

1

2

3

4

5

6

7

8

9

10

Gruppo 1

Gruppo 2

Q.I.

N.

Stu

den

ti

65 75 85 95 105 115 125 135

0

0,25

0,5

0,75

1

1,25

1,5

1,75

2

2,25

2,5

2,75

3

Gruppo 1

Gruppo 2

Q.I.

N.

stu

den

ti

In assenza di variabilità all’interno dei gruppi è evidente che i Q.I. del primo gruppo sono più elevati rispetto a quelli del secondo gruppo

In presenza di una forte variabilità all’interno dei gruppi non è evidente in quale gruppo sono più elevati i Q.I.

Il concetto di variabilità

INDICI DI VARIABILITA’

1. Indici di variabilità assoluta

2. Indici di variabilità relativa

1. Indici di diversità

2. Indici di disuguaglianza rispetto a un valore medio

3. Indici di disuguaglianza a coppie

Requisiti di un indice di variabilità1.

2.

3.

Indici di diversità

Indici di diversità

Campo di variazione

E’ anche denominato “range” ed è espresso da:

R = xN – x1

Può essere elevato anche se la variabilità della distribuzione è prossima a zeroEs. 1 10 10 10 10 10 10 10 10 10 10 12

Indici di diversità

Differenza interquartile

Sia data una distribuzione x1, x2….xn tale indice è espresso da:

IR = Q3 – Q1

Può essere nullo anche se non è nulla la variabilità della distribuzione

Es. 1 2 10 10 10 10 10 10 10 10 11 12

dove Q1 = Q3 = 10

Indici di diversità

Scarto interquartile

Sia data una distribuzione x1, x2….xn lo scarto interquartile è

espresso dalla semidifferenza tra Q3 e Q1:

IR %Si ottiene rapportando IR alla mediana e moltiplicando il rapporto per 100:

213 QQ

IRs

100*% 13

Me

QQIR

Indici di disuguaglianza rispetto a un valore medio

Intuitivamente la variabilità è vista come la distanza media di un’”osservazione tipo” rispetto al valore medio per la popolazione

Tuttavia:65 75 85 95 105 115 125 135

0

0,25

0,5

0,75

1

1,25

1,5

1,75

2

2,25

2,5

2,75

3

Q.I.

N.

stu

den

ti

Valore medio

Distanza rispetto alla

media

01

N

nMx i

k

i

i

La varianza

La varianza si calcola come la media degli scarti al quadrato

La varianza è utilizzata per standardizzare le misure di variabilità e renderle relative

Il valore della varianza è indipendente rispetto al numero delle osservazioni

Il numeratore della varianza si chiama devianza

N

nX i 2)(

x i ni xi*ni x i-M ( x i-M)^2*nI

62 2 124 -15,5 480,566 2 132 -11,5 264,570 3 210 -7,5 168,7573 3 219 -4,5 60,7575 4 300 -2,5 2576 4 304 -1,5 979 1 79 1,5 2,2581 2 162 3,5 24,583 3 249 5,5 90,7586 2 172 8,5 144,592 1 92 14,5 210,2594 3 282 16,5 816,75

Totale 30 2325 2297,5MEDIA=77,5VARIANZA = DEVIANZA / N = 76,58

La deviazione standard

Si ottiene dalla radice quadrata della varianza della popolazione

N

nX i 2)(

Si definisce deviazione standard o scarto quadratico medio la media quadratica degli scarti dalla Media della popolazione

Formula di calcolo della varianza

22

2

2

11

2

1

2

2

MM

n

x

n

x

n

Mx

q

n

ii

n

ii

n

ii

Varianza e dev. st. di un campione

Nelle attività normali di ricerca non disponiamo di una popolazione bensì di un campione

Obiettivo della statistica inferenziale: stima dei parametri di una popolazione attraverso l’utilizzo di un campione

In generale i campioni presentano una variabilità minore rispetto alla popolazione Assenza di valori estremi ( e rari)

Nelle popolazioni poco variabili è possibile stimare i parametri della popolazione con un campione ristretto

Nelle popolazioni ad elevata variabilità è necessario un campione più grande

Varianza e dev. st. di un campione

Varianza di un campione Deviazione standard di un

campione 1

)(2

2

n

XXs

1

)(2

n

XXs

• La correzione è importante soprattutto per i campioni di piccole dimensioni

• Per i campioni molto numerosi la deviazione standard del campione si avvicina a quella della popolazione

Cosa sono i gradi di libertà?

Il numero di osservazioni libere nel campione. Con un vincolo, vi saranno n-1 g.l. Con due vincoli, vi saranno n-2 g.l. Ricordando l’esempio del voto medio di 30

studenti, le prime 29 osservazioni potranno assumere qualunque valore ma la 30-esima osservazione sarà vincolata al seguente valore:

29

1

30

30

29

1

30

1

5.77*30

5.77*3005.77

i

i

i

i

i

i

xx

xxx

Indici relativi di variabilità

Esempio

Media sqm CVgruppo 1 100 20 0.2gruppo 2 10 15 1.5

Indici di eterogeneità

Mutabilità

È la possibilità di variare per una variabile qualitativa tra una perfetta omogeneità (quando la variabile si manifesta mediante un solo attributo) e una qualche eterogeneità ( se nella popolazione vi sono almeno due attributi differenti)

Max omogeneità

Max eterogeneità

Diploma fi fiClassico 1 0.25Scientifico 0 0.25Tecnico professionale 0 0.25Altri 0 0.25Totale 1 1

La eterogeneità misura la variabilità delle frequenze relative senza coinvolgere le modalità della variabile

Max omogeneità L’indice di eterogeneità vale zero

Max eterogeneità

L’indice di eterogeneità raggiunge il massimo

L’indice di Gini

k

iifG

1

21

111max

k

kG

k

G

G

GGnorm

Rapportando G al suo massimo, otteniamo un indice che varia tra 0 ed 1:

Min eterogeneità: 0110...011 G

Max eterogeneità:kk

k

kG

k

i

111

11

21

2

Esempio

Area funzionale omogenea Ospedale A Ospedale B fiA

medica 18 23 0.333333

chirurgica 14 25 0.259259

terapia intensiva 4 20 0.074074

materno-infantile 8 22 0.148148

riabilitazione 10 9 0.185185

54 99 1