Lezione 4 - unina.itwpage.unina.it › simonett › sito › egst › Lezione 4.pdf ·...

Post on 07-Jun-2020

3 views 0 download

transcript

Lezione 4 1

Lezione 4

La Variabilità

Lezione 4 2

DefinizioneUn valore medio, comunque calcolato, non è

sufficiente a rappresentare l’insieme delle osservazioni effettuate (o l’insieme dei valori assunti dalla variabile statistica); è necessario quindi affiancare ad esso altri indici che siano in grado di fornire delle informazioni sulla dispersione, in pratica sulla distanza delle varie osservazioni dal valore medio che rappresenta il centro della distribuzione.

Lezione 4 3

Caratteristiche

Indicatore di variabilità è una misura che: deve annullarsi quando, e solo quando,

tutte le unità osservate presentano il medesimo stato di grandezza del carattere;deve assumere valori crescenti all'aumentare della variabilità.

Lezione 4 4

Classificazione degli Indici di Variabilità

Indici di Variabilità

Assoluti

Relativi

Campo di Variazione

Differenza Interquartile

Scosatamento Semplice Medio

Varianza

Devianza

Deviazione Standard

Differenze Medie

Coefficiente di Variazione

Rapporto di Concentrazione

Lezione 4 5

Indici di Variabilità AssolutiCampo di VariazioneÈ il più semplice da calcolare ed è dato dalla differenza fra

il maggiore e il minore dei valori rilevati. Talvolta il campo di variazione si esprime indicando, invece della differenza fra il maggiore e il minore dei valori rilevati, gli estremi dell’intervallo. Il campo di variazione è un indice molto semplice da calcolare, ma di scarsa importanza perché tiene conto solo dei valori estremi e non degli altri.

Limiti: Troppo sensibile ai valori estremiminmax xxCV −=

Lezione 4 6

Esempio

Lezione 4 7

Differenza InterquartileLa differenza interquartile è data dalla differenza tra il terzo

e il primo quartileQ=Q3-Q1

E’ una misura di variabilità analoga al campo di variazione ma tiene conto soltanto dei valori che cadono tra il 1° e 3° Quartile (cioè del 50% della distribuzione)

Limiti: E’ un indice che non tiene conto di cosa accade all’interno della distribuzione (casi centrali) e agli estremi distribuzione

Lezione 4 8

Esempio

Lezione 4 9

Lo Scostamento Semplice Medio dalla Media AritmeticaUn altro indice di variabilità è lo scostamento semplice medio, che è la

media aritmetica dei valori assoluti degli scarti da un valore medio.Esistono due tipi di scostamenti:1. Scostamento semplice medio dalla media aritmetica:

2. Scostamento semplice medio dalla mediana

∑=

=

=

=

ni

ii

ni

iii

n

nxx

1

1

∑=

=

=

=

ni

lii

ni

liii

n

nMex

Lezione 4 10

Esempio

Lezione 4 11

Varianza

Lezione 4 12

Proprietà della Varianza

Lezione 4 13

Esempio

Lezione 4 14

Formula Alternativa per il calcolo della VarianzaLa Varianza può essere inoltre calcolata nel

seguente modo:

2

11

2

222

⎟⎟⎟⎟

⎜⎜⎜⎜

−=−=∑∑==

n

x

n

xMMS

n

ii

n

ii

q

Lezione 4 15

DevianzaLa quantità

Viene definita devianza

( )2

1∑=

−n

ii xx

Lezione 4 16

Scarto Quadratico Medio(Deviazione Standard)La deviazione standard è rappresentata dal radice

quadrata della varianza

La Deviazione standard viene espressa nella stessa unità di misura dei dati originari.

( )

n

xxS

n

ii∑

=

−= 1

2

Lezione 4 17

Esempio

Lezione 4 18

Indici di Variabilità RelativiTutti gli indici di variabilità sono definiti indici di

variabilità assoluta e sono espressi nella stessa unità di misura del fenomeno considerato; nel caso occorra confrontare più distribuzioni che siano espresse con diverse unità di misura, si ricorre agli indici di variabilità relativa.

Gli indici di variabilità relativa hanno quindi la caratteristica di essere dei numeri puri, indipendenti cioè dall’unità di misura prescelta, e permettono di confrontare più distribuzioni.

Lezione 4 19

Il Coefficiente di Variazione

Lezione 4 20

La ConcentrazioneLa concentrazione è un particolare aspetto della variabilità

di un fenomeno, e il suo studio è utile per vedere se il fenomeno è equamente distribuito fra tutte le unità statistiche oppure è concentrato in poche unità.

Ad esempio, si può dire che il reddito in un paese comel’Italia è poco concentrato perché non ci sono grandi

disparità di reddito tra i cittadini, mentre ad esempio in Brasile è molto concentrata perché ci sono grandi disparità di reddito tra i cittadini.

Lezione 4 21

Un carattere quantitativo trasferibile, le cui modalità ordinate sono x1, x2,…xn, si dice equidistribuito se ognuna delle N unità possiede una quota dell’ammontare del carattere pari a A/N dove

che coincide con la media aritmetica.Se non c’è equidistribuzione allora si ha concentrazione.Si ha massima concentrazione quando una sola unità del

collettivo possiedetutto l’ammontare del carattere e tutte le altre nulla, cioè:x1=…=xn-1 xn=A

N

xA

n

ii∑

= =1

Lezione 4 22

Esempio

Si hanno 100 soggetti e l’ammontare complessivo del reddito mensile è A=50.000€. Se c’è equidistribuzione ogni soggetto ha reddito pari a 500€ mentre nel caso di massima concentrazione un solo soggetto ha reddito pari a 50.000€ e gli altri soggetti non hanno reddito.

Lezione 4 23

Misurazione della concentrazione

Ammontare del carattere posseduto dalla i unità “più povere”: dopo aver ordinato i termini della distribuzione in senso non decrescente

Ammontare relativo del carattere posseduto dalla i unità “più povere”:

.

∑=

=+++=I

iiIi xxxxA

121 L

=

=== N

ii

I

ii

ii

x

x

AAq

1

1

Lezione 4 24

Misurazione della concentrazione

Ammontare relativo del carattere posseduto dalla i unità “più povere” nel caso (ipotetico) di equidistribuzione:

Per qualsiasi distribuzione si ha:

All’aumentare della concentrazione aumentano le differenze: pi-qi

Nel caso di massima concentrazione si ha:q1=q2=…=qn-1

Nipi =

ii qp ≥ i∀

Lezione 4 25

Rapporto di Concentrazione di GiniPer avere un indice sintetico si usa il rapporto di concentrazione di

Gini che si ottiene come rapporto tra e il suo valore massimo:

L’indice di Gini cresce al crescere del livello di concentrazione ed è sempre compreso tra 0 (nel caso di equidistribuzione) e 1 (nel caso di massima concentrazione).

( )

∑−

=

=

−= 1

1

1

1N

ii

N

iii

p

qpR

Lezione 4 26

La Curva di LorenzUn altro strumento che permette di valutare il grado di

concentrazione è la curva di Lorenz. Si tratta di un grafico ottenuto unendo con dei segmenti i punti di coordinate (pi;qi) per i= 1,n,…, N. Maggiore è l’area tra la curva di Lorenz e la bisettrice, maggiore è la concentrazione.

Dal grafico della curva di Lorenz si può ricavare una ulteriore misura di concentrazione, denominata area di concentrazione, strettamente legata al rapporto di concentrazione di Gini. Questa è data dall’area compresa tra la curva di concentrazione e la retta di equidistribuzione:

( )( )∑=

−− −+−=N

iiiii ppqqR

1111

Lezione 4 27

Lezione 4 28

Lezione 4 29

Indici di Mutabilità

Mutabilità: Attitudine di un carattere qualitativo ad assumere differenti modalità.

Insieme Omogeneo: Tutte le unità rispetto ad un determinato carattere presentano le stesse modalità

Insieme Eterogeneo: Tutte le unità statistiche tendono a distribuirsi in maniera uniforme.

Lezione 4 30

Indice di Eterogeneità di Gini

2

1

1 ∑=

⎟⎠⎞

⎜⎝⎛−=

k

i

i

nnIE

Lezione 4 31

Proprietà dell’indice di Gini

kkIE 10 −

≤≤

IE= 0 quando il collettivo è omogeneo

IE= (k-1)/k quando ciascuna unità statistica possiede n/k unità del carattere

Lezione 4 32

Indice di Gini Normalizzato

( )k

kIE

IEIEIEn 1max −

==

Lezione 4 33

Lezione 4 34

L’indice di Mutabilità di Frosini

∑=

⎟⎠⎞

⎜⎝⎛ −=

k

i kfd

11

21

kkd 10 −

≤≤

Indice Normalizzato di Frosini

( )k

kd

dddn 1max −

==

Lezione 4 35