Lezione 4 1
Lezione 4
La Variabilità
Lezione 4 2
DefinizioneUn valore medio, comunque calcolato, non è
sufficiente a rappresentare l’insieme delle osservazioni effettuate (o l’insieme dei valori assunti dalla variabile statistica); è necessario quindi affiancare ad esso altri indici che siano in grado di fornire delle informazioni sulla dispersione, in pratica sulla distanza delle varie osservazioni dal valore medio che rappresenta il centro della distribuzione.
Lezione 4 3
Caratteristiche
Indicatore di variabilità è una misura che: deve annullarsi quando, e solo quando,
tutte le unità osservate presentano il medesimo stato di grandezza del carattere;deve assumere valori crescenti all'aumentare della variabilità.
Lezione 4 4
Classificazione degli Indici di Variabilità
Indici di Variabilità
Assoluti
Relativi
Campo di Variazione
Differenza Interquartile
Scosatamento Semplice Medio
Varianza
Devianza
Deviazione Standard
Differenze Medie
Coefficiente di Variazione
Rapporto di Concentrazione
Lezione 4 5
Indici di Variabilità AssolutiCampo di VariazioneÈ il più semplice da calcolare ed è dato dalla differenza fra
il maggiore e il minore dei valori rilevati. Talvolta il campo di variazione si esprime indicando, invece della differenza fra il maggiore e il minore dei valori rilevati, gli estremi dell’intervallo. Il campo di variazione è un indice molto semplice da calcolare, ma di scarsa importanza perché tiene conto solo dei valori estremi e non degli altri.
Limiti: Troppo sensibile ai valori estremiminmax xxCV −=
Lezione 4 6
Esempio
Lezione 4 7
Differenza InterquartileLa differenza interquartile è data dalla differenza tra il terzo
e il primo quartileQ=Q3-Q1
E’ una misura di variabilità analoga al campo di variazione ma tiene conto soltanto dei valori che cadono tra il 1° e 3° Quartile (cioè del 50% della distribuzione)
Limiti: E’ un indice che non tiene conto di cosa accade all’interno della distribuzione (casi centrali) e agli estremi distribuzione
Lezione 4 8
Esempio
Lezione 4 9
Lo Scostamento Semplice Medio dalla Media AritmeticaUn altro indice di variabilità è lo scostamento semplice medio, che è la
media aritmetica dei valori assoluti degli scarti da un valore medio.Esistono due tipi di scostamenti:1. Scostamento semplice medio dalla media aritmetica:
2. Scostamento semplice medio dalla mediana
∑
∑=
=
=
=
−
ni
ii
ni
iii
n
nxx
1
1
∑
∑=
=
=
=
−
ni
lii
ni
liii
n
nMex
Lezione 4 10
Esempio
Lezione 4 11
Varianza
Lezione 4 12
Proprietà della Varianza
Lezione 4 13
Esempio
Lezione 4 14
Formula Alternativa per il calcolo della VarianzaLa Varianza può essere inoltre calcolata nel
seguente modo:
2
11
2
222
⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
−=−=∑∑==
n
x
n
xMMS
n
ii
n
ii
q
Lezione 4 15
DevianzaLa quantità
Viene definita devianza
( )2
1∑=
−n
ii xx
Lezione 4 16
Scarto Quadratico Medio(Deviazione Standard)La deviazione standard è rappresentata dal radice
quadrata della varianza
La Deviazione standard viene espressa nella stessa unità di misura dei dati originari.
( )
n
xxS
n
ii∑
=
−= 1
2
Lezione 4 17
Esempio
Lezione 4 18
Indici di Variabilità RelativiTutti gli indici di variabilità sono definiti indici di
variabilità assoluta e sono espressi nella stessa unità di misura del fenomeno considerato; nel caso occorra confrontare più distribuzioni che siano espresse con diverse unità di misura, si ricorre agli indici di variabilità relativa.
Gli indici di variabilità relativa hanno quindi la caratteristica di essere dei numeri puri, indipendenti cioè dall’unità di misura prescelta, e permettono di confrontare più distribuzioni.
Lezione 4 19
Il Coefficiente di Variazione
Lezione 4 20
La ConcentrazioneLa concentrazione è un particolare aspetto della variabilità
di un fenomeno, e il suo studio è utile per vedere se il fenomeno è equamente distribuito fra tutte le unità statistiche oppure è concentrato in poche unità.
Ad esempio, si può dire che il reddito in un paese comel’Italia è poco concentrato perché non ci sono grandi
disparità di reddito tra i cittadini, mentre ad esempio in Brasile è molto concentrata perché ci sono grandi disparità di reddito tra i cittadini.
Lezione 4 21
Un carattere quantitativo trasferibile, le cui modalità ordinate sono x1, x2,…xn, si dice equidistribuito se ognuna delle N unità possiede una quota dell’ammontare del carattere pari a A/N dove
che coincide con la media aritmetica.Se non c’è equidistribuzione allora si ha concentrazione.Si ha massima concentrazione quando una sola unità del
collettivo possiedetutto l’ammontare del carattere e tutte le altre nulla, cioè:x1=…=xn-1 xn=A
N
xA
n
ii∑
= =1
Lezione 4 22
Esempio
Si hanno 100 soggetti e l’ammontare complessivo del reddito mensile è A=50.000€. Se c’è equidistribuzione ogni soggetto ha reddito pari a 500€ mentre nel caso di massima concentrazione un solo soggetto ha reddito pari a 50.000€ e gli altri soggetti non hanno reddito.
Lezione 4 23
Misurazione della concentrazione
Ammontare del carattere posseduto dalla i unità “più povere”: dopo aver ordinato i termini della distribuzione in senso non decrescente
Ammontare relativo del carattere posseduto dalla i unità “più povere”:
.
∑=
=+++=I
iiIi xxxxA
121 L
∑
∑
=
=== N
ii
I
ii
ii
x
x
AAq
1
1
Lezione 4 24
Misurazione della concentrazione
Ammontare relativo del carattere posseduto dalla i unità “più povere” nel caso (ipotetico) di equidistribuzione:
Per qualsiasi distribuzione si ha:
All’aumentare della concentrazione aumentano le differenze: pi-qi
Nel caso di massima concentrazione si ha:q1=q2=…=qn-1
Nipi =
ii qp ≥ i∀
Lezione 4 25
Rapporto di Concentrazione di GiniPer avere un indice sintetico si usa il rapporto di concentrazione di
Gini che si ottiene come rapporto tra e il suo valore massimo:
L’indice di Gini cresce al crescere del livello di concentrazione ed è sempre compreso tra 0 (nel caso di equidistribuzione) e 1 (nel caso di massima concentrazione).
( )
∑
∑−
=
−
=
−= 1
1
1
1N
ii
N
iii
p
qpR
Lezione 4 26
La Curva di LorenzUn altro strumento che permette di valutare il grado di
concentrazione è la curva di Lorenz. Si tratta di un grafico ottenuto unendo con dei segmenti i punti di coordinate (pi;qi) per i= 1,n,…, N. Maggiore è l’area tra la curva di Lorenz e la bisettrice, maggiore è la concentrazione.
Dal grafico della curva di Lorenz si può ricavare una ulteriore misura di concentrazione, denominata area di concentrazione, strettamente legata al rapporto di concentrazione di Gini. Questa è data dall’area compresa tra la curva di concentrazione e la retta di equidistribuzione:
( )( )∑=
−− −+−=N
iiiii ppqqR
1111
Lezione 4 27
Lezione 4 28
Lezione 4 29
Indici di Mutabilità
Mutabilità: Attitudine di un carattere qualitativo ad assumere differenti modalità.
Insieme Omogeneo: Tutte le unità rispetto ad un determinato carattere presentano le stesse modalità
Insieme Eterogeneo: Tutte le unità statistiche tendono a distribuirsi in maniera uniforme.
Lezione 4 30
Indice di Eterogeneità di Gini
2
1
1 ∑=
⎟⎠⎞
⎜⎝⎛−=
k
i
i
nnIE
Lezione 4 31
Proprietà dell’indice di Gini
kkIE 10 −
≤≤
IE= 0 quando il collettivo è omogeneo
IE= (k-1)/k quando ciascuna unità statistica possiede n/k unità del carattere
Lezione 4 32
Indice di Gini Normalizzato
( )k
kIE
IEIEIEn 1max −
==
Lezione 4 33
Lezione 4 34
L’indice di Mutabilità di Frosini
∑=
⎟⎠⎞
⎜⎝⎛ −=
k
i kfd
11
21
kkd 10 −
≤≤
Indice Normalizzato di Frosini
( )k
kd
dddn 1max −
==
Lezione 4 35