Indici di tendenza centrale o di posizioneSi può operare in due modi:
Fornire dei valori intorno ai quali si ritiene sia concentrata la variabile dando quindi un’idea sintetica del fenomeno
Valori Medi;
Scegliere alcuni valori caratteristici, “strategici” della distribuzione
Indici di Posizione o Medie lasche.
La mediaDEFINIZIONE (dovuta a Cauchy nel 1821):
Una media M è quel valore tale che NxMx 1
dove x(1) e x(N) sono il valore minimo e massimo di X.
DEFINIZIONE (dovuta a Chisini nel 1929):Una media M di un carattere X è quel valore che sostituito alle singole modalità del carattere, soddisfa la seguente uguaglianza:
volteper
21 ,,,,,,N
N MMMfxxxf
dove f è una opportuna funzione matematica.
La media aritmetica
N
iiNN xxxxxxxf
12121 ,,,
Intensità totale
E’ l’indice più noto e usato.
E’ definita come quel valore, nell’ottica di Chisini, che lascia inalterata l’intensità totale del carattere delle N unità della popolazione, cioè:
La media aritmetica
NxxxN
N volte
21 ...
N
ii
N xNN
xxx
1
21 1
Quindi sostituendo si ha:
La media aritmetica
k
iii
k
iii fxnx
N 11
1dove si ricorda
che:
1 e 11
k
ii
ii
k
ii f
N
nfnN
e xi per i=1,2,...,k sono le modalità del carattere.
Se abbiamo a disposizione una distribuzione di frequenze assolute o relative, la media si scrive:
La media aritmetica
2
~ 1 iii
xxx
k
iiinxN 1
~1
e poi si calcola la media aritmetica come nei casi precedenti,
utilizzando il valore centrale:
Media di distribuzioni per classi di valori
Se il carattere osservato è quantitativo continuo e la distribuzione
è in classi di valore non è possibile applicare direttamente la
formula precedente, ma sarà necessario sintetizzare ciascuna
classe ii xx ,1 mediante il suo valore centrale:
La media aritmetica
Come si costruiscono le classi:
Classi aperte;Classi chiuse inferiormente;Classi chiuse superiormente.
Non è necessario che le classi abbiano tutte la stessa ampiezza.
Le proprietà della media aritmetica1. La media aritmetica rappresenta il baricentro della
distribuzione, cioè quel valore per cui la sua intensità totale risulta equamente ripartita fra la totalità delle unità statistiche;
01
N
iix
0111
NNxxN
i
N
ii
N
ii
2. La somma degli scarti dalla media aritmetica è sempre nulla:
Infatti:
Le proprietà della media aritmetica
4.Sia data una variabile statistica X di media aritmetica μ, allora:
M(aX+b)= aμ+b
dove M è la media aritmetica.Infatti:
ba
N
b
N
xa
N
baxbaXM
N
i
N
ii
N
ii
111)(
Le proprietà della media aritmetica
Consideriamo le tre formulazioni della media aritmetica:
N
iixN 1
1
k
iiinxN 1
1
i
k
ii fx
1
non sono tre formule differenti ma tre modi di calcolare la media aritmetica a seconda dei dati a disposizione.
Un esempio
Data la seguente distribuzione del numero di figli in 23 famiglie di un condominio di Pescara:
Numero di figli in 23 famiglie
ni
1 10
2 8
3 3
4 1
5 1
Totale 23
Un esempio
Per il calcolo della media aritmetica ci aiutiamo con la seguente tabella:
Numero di figli in 23 famiglie
ni xini
1 10 10
2 8 16
3 3 9
4 1 4
5 1 5
Totale 23 44
Pertanto la media aritmetica è pari a:
91,123/441
1
k
iiinxN
La media aritmetica ponderata
Nella media aritmetica le modalità (quindi le unità
statistiche) concorrono alla pari nelle determinazione
della media; infatti ogni modalità vale 1/N.
Tuttavia esistono numerose situazione reali dove le unità statistiche possiedono importanza differenti tra loro.
Quindi, è necessario definire la media aritmetica ponderata.
La media aritmetica ponderata
N
ii
N
iii
p
p
px
1
1
dove pi è il peso dell’unità i-esima
Sia Nxxx ,,, 21
carattere X allora possiamo definire la media aritmetica ponderata come:
una distribuzione unitaria di un
La media aritmetica ponderata
ESEMPIO :
Sia data la seguente tabella di esami e relativi crediti dello
studente Paolo dell’Università di Chieti - Pescara
Voti e Crediti
Voto CFU
Statistica 28 5
Diritto Privato 22 6
Diritto Pubblico 24 6
Macroeconomia 25 8
Informatica 30 5
La media aritmetica ponderata
E’ ovvio che in questa situazione è necessario
calcolare la media aritmetica ponderata perché non
tutti gli esami valgono nella stessa maniera in termini
di CFU.
Voto CFU Voto*CFU
Statistica 28 5 140
Diritto Privato 22 6 132
Diritto Pubblico 24 6 144
Macroeconomia 25 8 200
Informatica 30 5 150
La media aritmetica ponderata
33,2530
766
1
1
N
ii
N
iii
p
p
px
Le medie lascheSi chiamano medie lasche quei particolari indici che, per sinterizzare l’intera distribuzione in una misura di posizione, si basano solo su alcuni valori della distribuzione.
In particolare considereremo:
il valore centrale;la mediana;i quartili ed i percentili;la moda
Il valore centraleIl valore centrale è dato dalla semisomma dei valori estremi della distribuzione:
2)(1 Nxx
C
dove ovviamente )(1 , Nxx
sono rispettivamente il più piccolo ed il più grande valore osservato.
Ovviamente C dipende esclusivamente dai due valori estremi.
La medianaLa mediana è un indice che dipende dall’ordine delle osservazioni e non dal loro valore (quindi può essere calcolata per qualsiasi carattere almeno ordinato).
Sia Nxxx ,...,, 21
popolazione secondo un carattere ordinato X.
una distribuzione unitaria di una
Si definisce mediana Me(X) la modalità che bipartisce la distribuzione ordinata in senso non decrescente
Nxxx ...21
Il calcolo della mediana
2/1)( NxXMe
Se N è dispari, alla modalità che si trova nella posizione (N+1)/2, cioè:
12/12/1 )( e )( NN xXMexXMe
Se N è pari, alle modalità che si trovano nella
posizione (N/2) e (N/2)+1, cioè:
Nxxx ...21
Se si dispone di una distribuzione unitaria ordinata
secondo un ordinamento non decrescenteallora la mediana di X corrisponde
Il calcolo della mediana
2/1 )( NxXMe 12/2 )( NxXMeSi noti che se
non coincidono, la mediana può non essere unica.
Nel caso di variabili quantitative con N pari, si
può avere anche un intervallo di valori
1)2/(2/ , NN xx che soddisfano alla definizione
di mediana. In questo caso, si può prendere il
punto medio come “mediana convenzionale”.
Un esempioConsideriamo la seguente distribuzione dei voti
ottenuti da 7 studenti nell’esame di statistica:
1x 2x 3x 4x 5x 6x 7x
30272523222019
Queste osservazioni risultano già ordinate, nel caso contrario dovremmo prima ordinarle.
Vi sono N=7 osservazioni, quindi N dispari, allora la mediana coincide con l’osservazione di posto (N+1)/2=(7+1)/2=4. Cioè:
23)( 4 xXMe
Un esempioOra consideriamo, invece, la distribuzione dei voti ottenuti
da 8 studenti nell’esame di statistica:
3029272523222019 2x 3x 4x 5x 6x 7x 8x 1x
Anche in questo caso i valori sono già ordinati. Vi sono 8 osservazioni, quindi N è pari.
2342/ xx N 2551)2/( xx N
Quindi le due modalità mediane sono
e
Il calcolo della mediana
Se non si dispone della distribuzione unitaria, ma soltanto
della distribuzione di frequenza assoluta corrispondente, si
può operare nel seguente modo.
Sia X un carattere e sia, ad esempio,
knnn ,...,21, la distribuzioni di frequenza assoluta
Allora la mediana corrisponde
Il calcolo della mediana
se N è dispari, alla modalità xi che
presenta la frequenza assoluta cumulata Ni
più piccola tale che: Ni ≥ (N +1)/2;se N è pari, alla modalità xi che presenta la
frequenza assoluta cumulata Ni più piccola tale
che: Ni ≥ N /2 e alla modalità xi che presenta la
frequenza assoluta cumulata Ni più piccola tale
che: Ni ≥ (N /2)+1 ;Nel caso con N pari si possono avere due valori
mediani distinti.
Il calcolo della mediana
Se, invece, si dispone della distribuzione di frequenza
relativa si può operare nel seguente modo.
Sia X un carattere e sia, ad esempio,
kfff ,...,21, la distribuzioni di frequenza relativa
Allora la mediana corrisponde:
alla modalità xi che presenta la frequenza
relativa cumulata Fi più piccola tale che: Fi ≥ 0,5
Il calcolo della mediana
Nel caso la variabile sia definita mediante una
distribuzione per classi di valori è possibile definire la
classe mediana, la classe cioè che contiene la mediana.
Se vogliamo trovare la mediana dobbiamo procedere nel
seguente modo.
Alcuni esempi
Sia data la seguente distribuzione di famiglie residenti per numero di componenti nella regione Abruzzo al 25/10/1981:
Famiglie residenti per n°di componenti nella regione Abruzzo
ni fi Fi
1 64119 0,16 0,16
2 92800 0,24 0,40
3 78315 0,20 0,60
4 90468 0,23 0,83
5 42093 0,11 0,94
6 e più 23455 0,06 1,00
391250 1,00
Alcuni esempi
In base alla definizione la mediana coincide la modalità xi che presenta la frequenza relativa cumulata Fi più piccola tale che: Fi ≥ 0,5
Quindi la mediana è rappresentata dalla modalità x=3, cioè Me=3
Alcuni esempi
Sia data la seguente popolazione di un comune suddivisa per classi di età:
Popolazione residente di un comune per classi di età
(xi-1 - xi) ni fi Fi
fino a 5 anni 65 0,065 0,065
5 – 14 98 0,098 0,163
15 – 19 125 0,125 0,288
20 – 39 268 0,268 0,556
40 – 59 350 0,350 0,906
60 – 74 75 0,075 0,981
75 e oltre 19 0,019 1,000
Totale 1000 1
Alcuni esempi
In base alla definizione la mediana coincide la modalità xi che presenta la frequenza relativa cumulata Fi più piccola tale che: Fi ≥ 0,5
Quindi la mediana è rappresentata dalla classe 20-39.
I quantili
I quantili sono quei valori che ripartiscono i dati,
disposti in ordine crescente, in parti uguali e
possono essere considerati delle generalizzazioni
della mediana.
Possiamo considerare, in particolare:
I quartili che suddividono in 4 parti uguali la
distribuzione. Il primo quartile è preceduto da 1/4
dei dati e così via;
I quantili
I decili che suddividono in 10 parti uguali la
distribuzione;
I centili che suddividono in 100 parti uguali la
distribuzione.
Alcuni esempi
Consideriamo lo stesso esempio precedente.Sia data la seguente distribuzione di famiglie residenti per numero di componenti nella regione Abruzzo al 25/10/1981:
Famiglie residenti per n°di componenti nella regione Abruzzo
ni fi Fi
1 64119 0,16 0,16
2 92800 0,24 0,40
3 78315 0,20 0,60
4 90468 0,23 0,83
5 42093 0,11 0,94
6 e più 23455 0,06 1,00
391250 1,00
Alcuni esempi
Ad esempio, il primo quartile è la modalità xi che presenta la frequenza relativa cumulata Fi più piccola tale che: Fi ≥ 0,25In questo caso il primo quartile è rappresentato dalla modalità x=2, cioè Q1 =2
Ad esempio, il terzo quartile è la modalità xi che presenta la frequenza relativa cumulata Fi più piccola tale che: Fi ≥ 0,75In questo caso il terzo quartile è rappresentato dalla modalità x=4, cioè Q3 =4
Alcuni esempi
Ad esempio, il primo decile è la modalità xi che presenta la frequenza relativa cumulata Fi più piccola tale che: Fi ≥ 0,10In questo caso il primo decile è rappresentato dalla modalità x=1, cioè D1 =1
Ad esempio, il terzo decile è la modalità xi che presenta la frequenza relativa cumulata Fi più piccola tale che: Fi ≥ 0,30In questo caso il terzo decile è rappresentato dalla modalità x=2, cioè D3 =2
Alcuni esempi
Si fa notare che il secondo quartile Q2 coincide con la mediana.
La moda
La moda Mo di una popolazione, distribuita secondo un carattere X, è la modalità prevalente del carattere cioè la modalità alla quale è associata la massima frequenza.
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
La moda
Se vi è una sola moda la distribuzione è detta unimodale, nel caso contrario plurimodale (bimodale, trimodale, ecc).
0
5
10
15
20
25
30
35
40
45
GI IL MC SC TK
Esempio: Consideriamo gli obiettivi di 137 fondi pensionistici classificati in 5 modalità
xi ni
GI 26
IL 42
MC 20
SC 42
TK 12
La distribuzione è bimodale
La moda
Se la distribuzione è unitaria o di frequenze, allora è facile individuare la moda; se la variabile è definita per classi di valori allora è possibile definire la classe modale, cioè la classe che presenta la massima densità di frequenza.
Un esempio
Sia data la seguente popolazione di un comune suddivisa per classi di età e si calcoli la classe modale:
Popolazione residente di un
comune per classi di età xi-1 - xi ni
fino a 5 anni 65
6 - 14 98
15 - 19 125
20 - 39 268
40 - 59 350
60 - 74 75
75 e oltre 19
Totale 1000
Un esempio
La classe modale è la classe alla quale corrisponde la
massima densità di frequenza 1
ii
ii xx
nh
Popolazione residente di un comune per classi di età
xi-1 - xi ni hi
fino a 5 anni 65 13,00
6 - 14 98 12,25
15 - 19 125 31,25
20 - 39 268 14,11
40 - 59 350 18,42
60 - 74 75 5,36
75 e oltre 19 1,27
Totale 1000
Un esempio
In questo caso la classe modale la classe 15-19.
Si fa notare che l’ampiezza dell’ultima classe è
stata posta pari a 15.
Alcune riflessioni sulle medieOSSERVAZIONE
La moda è una misura più “stabile” della media e della mediana (non si modifica quando si aggiungono dati anomali). In termini statistici si dice che la moda è robusta.
Alcune riflessioni sulle medieESEMPIO:
Se consideriamo la seguente distribuzione:
3, 4, 7, 2, 3, 1, 8, 12, 1, 3 ,5, 6, 9
Si ha che la moda è pari a 3.
Non si modifica se aggiungiamo una osservazione uguale a 1000 (o 10000!!).
Alcune riflessioni sulle medieCon gli stessi dati, dopo aver ordinato le osservazioni, otteniamo che la mediana è 4.
1, 1, 2, 3, 3, 3, 4, 5, 6, 7, 8, 9, 12
Se aggiungiamo il valore 1000, le osservazioni sono così modificate:
1, 1, 2, 3, 3, 3, 4, 5, 6, 7, 8, 9, 12, 1000Le mediane sono due, pari a 4 e 5.
Alcune riflessioni sulle medieCon gli stessi dati, otteniamo che la media è 4.92
Se aggiungiamo il valore 1000, la media diviene 76.
La variabilità
Consideriamo le tre seguenti distribuzioni di voti presi da otto studenti all’esame di statistica:
27,27,26,26,24,24,23,23A
28,28,28,28,22,22,22,22B
25,25,25,25,25,25,25,25C
La variabilitàLa media aritmetica di tutte e tre le distribuzioni è sempre uguale
25 CBA
ma le tre distribuzioni sono molto diverse tra loro.
DEFINIZIONE: Si chiama variabilità (nel caso quantitativo) e mutabilità (nel caso qualitativo) l’attitudine dei caratteri ad assumere modalità differenti.
La variabilitàUna misura della variabilità dovrebbe avere queste tre caratteristiche:
1. Indicata con IV tale misura, si dovrebbe avere:
0),...,( 1 NV xxI
2. IV è nulla se e solo se tutti i termini della distribuzione
sono uguali tra loro, pari a c, quindi cioè
se il carattere risulta concentrato in una unica modalità;
0),...,( ccIV
La variabilità
3. IV cresce all’aumentare della disuguaglianza fra i termini.
La variabilitàCategorie di indici di variabilità
1.Indici che misurano la variabilità del carattere tramite una sintesi di misure di diversità tra ogni termine della distribuzione ed una media (SCOSTAMENTI MEDI);
2.Indici che misurano la variabilità misurando la diversità fra due particolari termini della distribuzione (INTERVALLI DI VARIAZIONE).
Un indice di variabilità che è espresso nella stessa unità di misura del carattere è detto assoluto.
Gli scostamenti medi
Sia la distribuzione del carattere X e sia la media aritmetica del carattere.
Nxx ,...,1
ixDefiniamo con i valori assoluti degli scarti dalla media aritmetica.
Pertanto, è possibile definire lo scostamento quadratico medio dalla media aritmetica (standard deviation, definito da Pearson nel 1893) per distribuzione unitarie come:
N
iixN 1
21
Gli scostamenti medi
Nel caso di distribuzioni di frequenze assolute si ha:
i
k
ii nx
N
1
21
Mentre nel caso di distribuzioni di frequenze relative si ha:
i
k
ii fx
1
2
La varianza
Il quadrato dello scostamento quadratico medio dalla media aritmetica rappresenta un famosissimo indice di variabilità denominato varianza:
cioè la Var(X) è la media aritmetica dei quadrati degli scarti dalla media aritmetica. Nel caso di distribuzioni di frequenze assolute e relative si ha rispettivamente:
N
iixN
XVar1
22 1)(
1
1
22
1
22i
k
iii
k
ii fxnx
N
La varianza
OSSERVAZIONI:
La varianza è un indice assoluto ed è espresso nella
stessa unità di misura (al quadrato) del fenomeno
studiato;
• infatti gli scarti possono essere “infinitamente” lontani dalla media aritmetica.
)(0 XVar
Un esempio
Si considerino le altezze in cm del seguente collettivo costituito da 5 persone (distribuzione unitaria)
Persone Altezza in cm
1 175
2 176
3 172
4 177
5 180
Un esempio
i
1 175 -1 1
2 176 0 0
3 172 -4 16
4 177 1 1
5 180 4 16
TOT 880 34
1765
8801
n
xn
ii
ix ix 2ix
61,25
34
xi ni
18 2
19 2
20 2
21 3
22 3
23 5
24 4
25 6
26 4
27 4
28 3
29 0
30 2
Totale 40
Un esempio Si considerino i voti riportati all’esame di statistica da 40 studenti (distribuzione di frequenza).
xi ni xini (xi-) (xi-)2 (xi-)2ni
18 2 36 - 6 36 72
19 2 38 - 5 25 50
20 2 40 - 4 16 32
21 3 63 - 3 9 27
22 3 66 - 2 4 12
23 5 115 - 1 1 5
24 4 96 - - -
25 6 150 1 1 6
26 4 104 2 4 16
27 4 108 3 9 36
28 3 84 4 16 48
29 0 0 5 25 -
30 2 60 6 36 72
Totale 40 960 376
Per calcolare la varianza ci aiutiamo con la seguente tabella
La media aritmetica è pari a:
24)960(40
11
1
k
iiinxN
Pertanto la varianza è uguale a:
4,9)376(40
1)(
1
1
22
k
iii nx
N
Un’altra formula per il calcolo della varianza
22
2
22 )()(
N
nX
XMXVar
ii
Nella pratica il calcolo della varianza si effettua molto spesso con la seguente formula:
Un esempioRiprendiamo i dati dell’ESEMPIO precedente, cioè i voti riportati all’esame di statistica da 40 studenti:
xi ni
18 2
19 2
20 2
21 3
22 3
23 5
24 4
25 6
26 4
27 4
28 3
29 0
30 2
Totale 40
Un esempioPer il calcolo della varianza aiutiamoci con la seguente tabella
Voti dell'esame di statistica
xi ni xi2 xi
2ni
18 2 324 648
19 2 361 722
20 2 400 800
21 3 441 1323
22 3 484 1452
23 5 529 2645
24 4 576 2304
25 6 625 3750
26 4 676 2704
27 4 729 2916
28 3 784 2352
29 0 841 0
30 2 900 1800
Totale 40 23416
Un esempio
24)960(40
11
1
k
iiinxN
4,9242341640
11 22
1
22
k
iii nxN
La media aritmetica è sempre pari a:
La varianza calcolata con questa formula alternativa è pari a:
La variabilità relativa
Se devo eseguire confronti fra fenomeni espressi
con diverse unità di misura o sull’evoluzione di
uno stesso fenomeno rilevato in due unità
temporali o spaziali diverse non posso utilizzare
la varianza per confrontare la variabilità delle
due distribuzioni.
La variabilità relativa
Esempio: peso di un gruppo di neonati ed uno di adulti
Adulti
kg
kg
4,3
73
Neonati
kg
kg
5,0
8,3
Quale collettivo è più variabile?
Il coefficiente di variazione
Un indice molto noto è il coefficiente di
variazione, introdotto da K. Pearson nel 1905.
CV
E’ il rapporto tra la deviazione standard e la media
Il coefficiente di variazione
0,1328,3
5,00,047
73
4,3
adulti bambini
CV è “scale-free” o “numero puro” (non dipende dall’unità di misura adottata). Come tale è adatto ai confronti.
Esempio: peso di un gruppo di neonati ed uno di adulti
Adulti kg
kg
4,3
73
Neonati
kg
kg
5,0
8,3
Il coefficiente di variazione
Se 0 non è definito il CV, in quanto non
è interpretabile una variabilità negativa, né dividere un numero per zero.
Intervalli di variazione
)min()max()( XXXRange
13)( QQXRangeileInterquartIQR
Possiamo definire i seguenti indici che misurano la variabilità del carattere tra due particolari termini della distribuzione o fra due quantili:
1.Campo di variazione o range
2.Campo di variazione interquartile (terzo quartile – primo quartile)
La concentrazione
La concentrazione può essere misurata se un
carattere X è di tipo quantitativo trasferibile, cioè se è
possibile trasferire, anche solamente in via teorica,
l’ammontare del fenomeno da una unità statistica ad
una altra, tendendo o meno alla situazione di
equidistribuzione.
E’ un aspetto rilevante della variabilità di un carattere
quantitativo.
La concentrazioneEsempio: La ricchezza di un paese è tanto più concentrata quanto minore è la frazione di ricchezza posseduta dalla parte più povera della popolazione.
Si può parlare di concentrazione finanziaria, urbana, ecc.
DEFINIZIONE:
Un carattere trasferibile è equidistribuito fra le N unità del collettivo se l’ammontare complessivo A del carattere X è distribuito in parti uguali fra le N unità, cioè se ogni unità possiede la quantità A/N.
La concentrazione
Se un carattere non è equidistribuito allora
possiamo affermare che è concentrato.
La situazione di concentrazione massima si ha
quando una sola unità possiede tutto l’ammontare
del carattere e tutte le altre unità statistiche non
possiedono niente.
Indici di concentrazione
Un indice di concentrazione deve essere pari a 0 nel caso di equidistribuzione (minima concentrazione) ed aumentare fino ad un massimo assunto nel caso di massima concentrazione.
Consideriamo ora una popolazione di N elementi.
Ordiniamo le N unità secondo la loro modalità, in ordine non decrescente, del carattere X.
Indici di concentrazione
Nxxx ...21
,
dove per ragioni di semplicità espositiva si è
tralasciata la notazione x(1) per indicare la prima
modalità ordinata.
ix
0ix
Se è l’ammontare del carattere posseduto dalla
i-esima unità ordinata, con allora si ha:
Indici di concentrazioneSi definisca ora con:
i
jjii xxxxA
121 ...
l’ammontare complessivo del carattere posseduto dalle i unità più povere con i=1,2,…,N
Si considerino ora le seguenti distribuzioni:
NFF ,...,1
NiFi /1.la distribuzione
delle prime i unità, dove:
della frazione cumulata
rappresenta la
la frazione delle i unità più povere alle quali spetta l’ammontare Ai del carattere
Indici di concentrazione
2. la distribuzione Nqq ,...,1
cumulata dell’ammontare del carattere, dove:
della frazione
N
iN
jj
i
jj
i A
A
x
x
q
1
1
rappresenta la frazione dell’ammontare
complessivo (intensità) del carattere detenuto
dalle prime i unità (le i unità più povere).
Indici di concentrazione
ii qF
Infatti, avendo ordinato i dati in senso non
decrescente, il primo 10%, ad esempio, delle unità
più povere detengono al più il 10% dell’ammontare
totale del carattere; se così non fosse non
sarebbero le i unità più povere.
ii qF e Si fa notare che
con i, inoltre risulta sempre per ogni i=1,2,…,N:
sono funzioni non decrescenti
Indici di concentrazione
1 e 0...
,...,2,1 ogniper /
12
NNi
i
qqqq
NiNiF
NAxxx N /...21 CASO DI MINIMA CONCENTRAZIONE (Equidistribuzione)
Si ha quando:
ii qF In questo caso risulta: per ogni i=1,2,…,N
Axxxx NN e 0... 121
CASO DI MASSIMA CONCENTRAZIONE
Si ha quando:
In questo caso risulta:
Il rapporto di concentrazione
0 ii qF
0 NNNN qFqF
CASI INTERMEDI
Nei casi intermedi il carattere è tanto più concentrato
quanto maggiore è la differenza
Consideriamo quindi:
la sommatoria precedente è estesa da 1 a N-1, in quanto:
L’indice (1) è un indice assoluto di concentrazione.
1
1
N
iii qF (1)
Il rapporto di concentrazione
iiN qFxxx ...21
1
1
0N
iii qF
1 e 0...
e 0...
12
121
NNi
NN
qqqq
Axxxx
Il minimo dell’indice si ha nel caso di
equidistribuzione, cioè quando:
1
1
N
iii qF
Il massimo dell’indice si ha quando vi è massima
concentrazione cioè:
1
1
N
iii qF
Il rapporto di concentrazione
1
1
1
1
N
ii
N
iii FqF
1
1
1
1N
ii
N
iii
F
qFR 10 R
e allora:
Pertanto, è possibile definire l’indice relativo come:
Tale indice è noto come rapporto di concentrazione del Gini.
Il rapporto di concentrazione
OSSERVAZIONE:
Il calcolo di R è relativo ai singoli valori non
raggruppati in una distribuzione di frequenze e
pertanto per una popolazione ampia può risultare
gravoso calcolarne il valore.
Un esempio
Si richiede di calcolare il rapporto di concentrazione del Gini.
Velletri 43
Frascati 20
Marino 31
Tre comuni del Lazio avevano al 21/12/1980 la seguente popolazione in migliaia di unità
Un esempio
Prima ordiniamo i valori e poi calcoliamo Fi e qi :
Comune Popolazione Fi qi
Frascati 20 0,33 0,21
Marino 31 0,67 0,54
Velletri 43 1 1
Totale 94
Un esempioQuindi possiamo calcolare il rapporto di concentrazione R del Gini:
Comune Popolazione Fi qi Fi-qi
Frascati 20 0,33 0,21 0,12
Marino 31 0,67 0,54 0,13
Velletri 43 1 1
Totale 94 0,25
Un esempioIl risultato finale è pertanto pari a:
25,0
1
25,01
1
1
1
N
ii
N
iii
F
qFR
La curva di concentrazioneConsideriamo ora la rappresentazione grafica dei punti (Fi,qi) per i=1,2,…,N.
In un piano cartesiano, riportiamo in ascisse i valori Fi e in ordinate i valori qi
Nel caso di equidistribuzione si ha Fi=qi e quindi i punti si dispongono sulla bisettrice del I quadrante.
Il segmento che unisce i punti di coordinate (0,0) e (1,1) viene chiamato segmento di equidistribuzione.
La curva di concentrazione
Se non vi è equidistribuzione i punti di coordinate (pi,qi) si trovano nel triangolo di vertici (0,0), (1,0) e (1,1).
Unendo tali punti si ottiene una linea chiamata spezzata di concentrazione o curva di Lorenz.
La curva di concentrazione
(1,0)
(0,0)Fi Fi+1
qN
qi+1
qi
(1,1)
FN
La curva di concentrazione
In generale, quanto è maggiore la concentrazione del carattere, tanto più la spezzata di concentrazione risulta vicina all’asse dell’ascisse e quindi tanto è più grande l’area della superficie compresa fra il segmento di equidistribuzione e la spezzata di concentrazione.