Date post: | 01-May-2015 |
Category: |
Documents |
Upload: | bonfilio-torre |
View: | 218 times |
Download: | 1 times |
LA VARIABILITA’
IV lezione di Statistica Medica
Sintesi della lezione Il concetto di variabilità Campo di variazione Differenza interquartile La varianza La deviazione standard Scostamenti medi
Il concetto di variabilità
65 75 85 95 105 115 125 135
0
0,25
0,5
0,75
1
1,25
1,5
1,75
2
2,25
2,5
2,75
3
Q.I.
N.
stu
den
ti
65 75 85 95 105 115 125 135
0
1
2
3
4
5
6
7
8
9
10
Q.I.
N.
stu
dent
i
Si definisce come l’attitudine di un fenomeno ad assumere valori diversi
65 75 85 95 105 115 125 135
0
1
2
3
4
5
6
7
8
9
10
Gruppo 1
Gruppo 2
Q.I.
N.
Stu
den
ti
65 75 85 95 105 115 125 135
0
0,25
0,5
0,75
1
1,25
1,5
1,75
2
2,25
2,5
2,75
3
Gruppo 1
Gruppo 2
Q.I.
N.
stu
den
ti
In assenza di variabilità all’interno dei gruppi è evidente che i Q.I. del primo gruppo sono più elevati rispetto a quelli del secondo gruppo
In presenza di una forte variabilità all’interno dei gruppi non è evidente in quale gruppo sono più elevati i Q.I.
Il concetto di variabilità
INDICI DI VARIABILITA’
1. Indici di variabilità assoluta
2. Indici di variabilità relativa
1. Indici di diversità
2. Indici di disuguaglianza rispetto a un valore medio
3. Indici di disuguaglianza a coppie
Requisiti di un indice di variabilità1.
2.
3.
Indici di diversità
Indici di diversità
Campo di variazione
E’ anche denominato “range” ed è espresso da:
R = xN – x1
Può essere elevato anche se la variabilità della distribuzione è prossima a zeroEs. 1 10 10 10 10 10 10 10 10 10 10 12
Indici di diversità
Differenza interquartile
Sia data una distribuzione x1, x2….xn tale indice è espresso da:
IR = Q3 – Q1
Può essere nullo anche se non è nulla la variabilità della distribuzione
Es. 1 2 10 10 10 10 10 10 10 10 11 12
dove Q1 = Q3 = 10
Indici di diversità
Scarto interquartile
Sia data una distribuzione x1, x2….xn lo scarto interquartile è
espresso dalla semidifferenza tra Q3 e Q1:
IR %Si ottiene rapportando IR alla mediana e moltiplicando il rapporto per 100:
213 QQ
IRs
100*% 13
Me
QQIR
Indici di disuguaglianza rispetto a un valore medio
Intuitivamente la variabilità è vista come la distanza media di un’”osservazione tipo” rispetto al valore medio per la popolazione
Tuttavia:65 75 85 95 105 115 125 135
0
0,25
0,5
0,75
1
1,25
1,5
1,75
2
2,25
2,5
2,75
3
Q.I.
N.
stu
den
ti
Valore medio
Distanza rispetto alla
media
01
N
nMx i
k
i
i
La varianza
La varianza si calcola come la media degli scarti al quadrato
La varianza è utilizzata per standardizzare le misure di variabilità e renderle relative
Il valore della varianza è indipendente rispetto al numero delle osservazioni
Il numeratore della varianza si chiama devianza
N
nX i 2)(
x i ni xi*ni x i-M ( x i-M)^2*nI
62 2 124 -15,5 480,566 2 132 -11,5 264,570 3 210 -7,5 168,7573 3 219 -4,5 60,7575 4 300 -2,5 2576 4 304 -1,5 979 1 79 1,5 2,2581 2 162 3,5 24,583 3 249 5,5 90,7586 2 172 8,5 144,592 1 92 14,5 210,2594 3 282 16,5 816,75
Totale 30 2325 2297,5MEDIA=77,5VARIANZA = DEVIANZA / N = 76,58
La deviazione standard
Si ottiene dalla radice quadrata della varianza della popolazione
N
nX i 2)(
Si definisce deviazione standard o scarto quadratico medio la media quadratica degli scarti dalla Media della popolazione
Formula di calcolo della varianza
22
2
2
11
2
1
2
2
MM
n
x
n
x
n
Mx
q
n
ii
n
ii
n
ii
Varianza e dev. st. di un campione
Nelle attività normali di ricerca non disponiamo di una popolazione bensì di un campione
Obiettivo della statistica inferenziale: stima dei parametri di una popolazione attraverso l’utilizzo di un campione
In generale i campioni presentano una variabilità minore rispetto alla popolazione Assenza di valori estremi ( e rari)
Nelle popolazioni poco variabili è possibile stimare i parametri della popolazione con un campione ristretto
Nelle popolazioni ad elevata variabilità è necessario un campione più grande
Varianza e dev. st. di un campione
Varianza di un campione Deviazione standard di un
campione 1
)(2
2
n
XXs
1
)(2
n
XXs
• La correzione è importante soprattutto per i campioni di piccole dimensioni
• Per i campioni molto numerosi la deviazione standard del campione si avvicina a quella della popolazione
Cosa sono i gradi di libertà?
Il numero di osservazioni libere nel campione. Con un vincolo, vi saranno n-1 g.l. Con due vincoli, vi saranno n-2 g.l. Ricordando l’esempio del voto medio di 30
studenti, le prime 29 osservazioni potranno assumere qualunque valore ma la 30-esima osservazione sarà vincolata al seguente valore:
29
1
30
30
29
1
30
1
5.77*30
5.77*3005.77
i
i
i
i
i
i
xx
xxx
Indici relativi di variabilità
Esempio
Media sqm CVgruppo 1 100 20 0.2gruppo 2 10 15 1.5
Indici di eterogeneità
Mutabilità
È la possibilità di variare per una variabile qualitativa tra una perfetta omogeneità (quando la variabile si manifesta mediante un solo attributo) e una qualche eterogeneità ( se nella popolazione vi sono almeno due attributi differenti)
Max omogeneità
Max eterogeneità
Diploma fi fiClassico 1 0.25Scientifico 0 0.25Tecnico professionale 0 0.25Altri 0 0.25Totale 1 1
La eterogeneità misura la variabilità delle frequenze relative senza coinvolgere le modalità della variabile
Max omogeneità L’indice di eterogeneità vale zero
Max eterogeneità
L’indice di eterogeneità raggiunge il massimo
L’indice di Gini
k
iifG
1
21
111max
k
kG
k
G
G
GGnorm
Rapportando G al suo massimo, otteniamo un indice che varia tra 0 ed 1:
Min eterogeneità: 0110...011 G
Max eterogeneità:kk
k
kG
k
i
111
11
21
2
Esempio
Area funzionale omogenea Ospedale A Ospedale B fiA
medica 18 23 0.333333
chirurgica 14 25 0.259259
terapia intensiva 4 20 0.074074
materno-infantile 8 22 0.148148
riabilitazione 10 9 0.185185
54 99 1