Post on 31-Jul-2020
transcript
23
3. INDICI DI POSIZIONE
3.1 Introduzione
Nello studio delle caratteristiche di una variabile, le cosiddette medie sono particolari indici statistici,
detti anche indici di posizione, che risultano di fondamentale importanza perché consentono di descrivere
sinteticamente l’insieme dei dati osservati mediante una sola modalità o un unico valore numerico, a
seconda che la variabile considerata sia qualitativa o quantitativa.
Gli indici che saranno esaminati nei paragrafi seguenti si suddividono in medie di posizione,
determinabili per una variabile di qualsiasi natura, e medie analitiche, che possono essere invece
calcolate solo per variabili quantitative, dato che richiedono l’esecuzione di operazioni algebriche.
L’obiettivo che si vuole conseguire con il calcolo degli indici di posizione è la sintesi di tutte le
informazioni contenute nei dati originali attraverso una sola determinazione che sia in qualche modo
rappresentativa di tutte le rilevazioni effettuate, per cui è evidente che la media di una variabile qualitativa
dovrà necessariamente coincidere con una delle modalità assunte dalla variabile, mentre nel caso di una
variabile quantitativa la media sarà sempre interna al suo campo di variazione.
24
3.2 Moda
La prima caratteristica che si nota esaminando una distribuzione di frequenza relativa a una variabile
qualitativa o quantitativa discreta è la determinazione (o le determinazioni) a cui è associata la frequenza
(assoluta o relativa) più elevata.
Questa determinazione è detta determinazione modale o, più semplicemente, moda. Se esistono più
determinazioni a cui è associata la stessa frequenza massima, tutte queste determinazioni rappresentano
altrettante mode della distribuzione.
Considerata una variabile qualitativa o quantitativa discreta X che assume k determinazioni diverse e
indicata con nj la frequenza assoluta associata alla j-esima determinazione (con j = 1,2, …, k), la moda M
x
della variabile X è quella determinazione della variabile per la quale risulta
𝑀𝑥 = arg max1≤𝑗≤𝑘
𝑛𝑗 3.2.1
dove arg max sta per argomento del massimo ossia, per il caso in esame, corrisponde all'insieme delle
determinazioni della variabile a cui è associata la frequenza massima.
Se la distribuzione è espressa mediante le frequenze relative, anziché mediante le frequenze assolute, la
moda corrisponde ovviamente a quella determinazione della X per la quale risulta
𝑀𝑥 = arg max1≤𝑗≤𝑘
𝑓𝑗 3.2.2
Dato che l’individuazione della moda si basa solo sui valori assunti dalle frequenze (assolute o relative),
risulta evidente che questo indice può essere determinato per una variabile di qualunque tipo.
Per esempio, la moda della variabile considerata nella tabella nella 2.1.1 è "altre attività", nella tabella
2.1.2 è il "diploma di scuola secondaria superiore", nella tabella 2.1.3 è "2 componenti" e nella 2.1.8 è
"prime edizioni".
Le mode appena individuate sulle distribuzioni di frequenza delle variabili considerate sarebbero potute
essere individuate anche attraverso l’analisi del grafico corrispondente, dato che in tutti i casi la moda
corrisponde alla determinazione a cui è associato il rettangolo o il segmento con l’altezza maggiore (per
grafici a colonna o per i diagrammi ad asta) oppure al rettangolo con la base maggiore (per grafici a
nastro).
25
Così, per esempio, la moda della distribuzione rappresentata nelle figure 2.3.2 o 2.3.3 è "industria", la
moda della distribuzione rappresentata nella figura 2.3.4 è "sufficiente", la moda della distribuzione
rappresentata nella figura 2.3.5 è il valore "2" e nella figura 2.3.6 la moda è “1”.
Ovviamente se in una distribuzione ci sono più determinazioni a cui è associata la stessa frequenza
massima, la variabile presenta più mode, mentre non c'è alcuna moda se tutte le frequenze sono uguali fra
loro.
Una distribuzione che presenta una sola moda è detta unimodale, mentre è detta plurimodale se presenta
più mode. In particolare, se esistono due mode, la distribuzione è detta “bimodale”, se ne esistono tre è
detta “trimodale” e così via.
Nel caso di una distribuzione di una variabile continua mediante classi di valori, l’individuazione della
moda non può essere effettuata in base ai valori delle frequenze associate a ciascuna classe in quanto,
come si è già detto in precedenza, all’aumentare dell’ampiezza della classe tende ad aumentare anche la
frequenza associata. Per determinare la moda occorre quindi individuare l’intervallo che, a parità di
ampiezza, contiene la frazione maggiore delle osservazioni.
Nelle distribuzioni di variabili continue date mediante classi di valori, è detto modale quell'intervallo che
presenta la massima densità di frequenza. Anche in questo caso possono esistere più classi modali, se a
più intervalli diversi è associata una stessa densità di frequenza massima.
Nel caso della tabella 2.4.1, per esempio, l'intervallo modale della distribuzione è la classe (160, 165] in
corrispondenza della quale si ha il massimo valore del rapporto fra frequenza e ampiezza.
In generale, quindi, considerata una variabile quantitativa continua X i cui valori sono stati suddivisi in k
classi e indicata con hj la densità di frequenza associata alla j-esima classe (con j = 1,2, …, k), la classe
modale Mx è quell’intervallo per il quale risulta
𝑀𝑥 = arg max
1≤𝑗≤𝑘ℎ𝑗 3.2.3
Anche in questo caso la determinazione della classe modale può avvenire graficamente, in quanto
corrisponde al rettangolo dell’istogramma che presenta la massima altezza. Per esempio, la figura 2.4.1
mostra chiaramente che la moda corrisponde alla classe (160, 165], così come si era rilevato anche dai
valori riportati nella tabella 2.4.1.
Se la determinazione della moda è estremamente semplice, va però notato che il suo utilizzo è abbastanza
limitato. Dato che la moda non fornisce alcuna informazione ulteriore sulla distribuzione della variabile,
26
la sua conoscenza non è particolarmente utile se le determinazioni assunte dalla variabile sono piuttosto
numerose, specie se la massima frequenza non è sensibilmente più elevata delle frequenze associate alle
altre determinazioni.
É inoltre evidente che la determinazione dell'intervallo modale per una variabile quantitativa continua
risente di tutte le arbitrarietà della suddivisione in classi che è stata effettuata.
Un pregio della moda è invece la sua “robustezza”, nel senso che questo indice non risente della eventuale
presenza di determinazioni molto grandi o molto piccole che potrebbero corrispondere a valori anomali
(in inglese, outlier), ossia a determinazioni che si discostano di molto dalle restanti determinazioni assunte
dalla variabile.
Nota
In una distribuzione possono essere individuati anche valori modali, detti secondari o locali, che corrispondono a
massimi relativi della distribuzione. In questo caso la determinazione della distribuzione a cui è associata la
frequenza massima è detta anche moda principale.
Nell’esempio 2.4.1 riportato alla fine del paragrafo 2.4 si ha una moda principale in corrispondenza dell’intervallo
[3001, 4000] e una moda secondaria in corrispondenza dell’intervallo [1001, 2000]
27
3.3 Quantili
Date n osservazioni relative alla variabile quantitativa X si definisce quantile di ordine p (con 0 < p < 1),
e si indica con xp, quel particolare valore della variabile per cui la proporzione di osservazioni inferiori o
uguali a xp è almeno p (e quindi la proporzione di osservazioni maggiore o uguale a xp è almeno 1-p).
Se, per esempio, per una distribuzione di redditi annui è noto che il quantile di ordine 0.25 è pari a 5 mila
euro, questo vuol dire che almeno un quarto delle unità considerate ha un reddito annuo inferiore o uguale
a 5 mila euro; se in una distribuzione di stature x0,8 vale 178 centimetri, significa che almeno l’80% delle
unità ha una statura inferiore o uguale a 178 centimetri.
Data una sequenza di n osservazioni relative a una variabile quantitativa X, il quantile xp di ordine p è
l’osservazione che nella sequenza ordinata occupa il posto corrispondente alla parte intera superiore del
prodotto np, indicato con np
Il simbolo np rappresenta quindi la parte intera superiore di np per cui
1< npnpnp .
Esempio 3.3.1
Considerata la seguente sequenza di osservazioni rilevate su 5 piantine di cui si è misurata l’altezza ottenendo i
seguenti valori in centimetri
23.4 18.2 21.0 22.7 19.1
si determini il quantile di ordine p = 0.5 della variabile.
In questo caso n = 5, per cui
35.25.05 np . Il quantile di ordine 0.5, x0.5, occupa quindi il terzo posto nella sequenza ordinata
18.2 19.1 21.0 22.7 23.4
per cui risulta
x0.5 = x(3 )= 21.
Esempio 3.3.2
Si supponga ora che alle unità dell’esempio precedente si sia aggiunta una nuova piantina, la cui altezza in
centimetri è pari a 21.5. Si vuole determinare il quantile di ordine p = 0.5 delle 6 unità statistiche.
In questo caso la sequenza ordinata è la seguente
18.2 19.1 21.0 21.5 22.7 23.4
per cui, dato che n = 6,
335.06 np .
Il quantile di ordine 0.5 occupa quindi il terzo posto nella sequenza ordinata per cui risulta ancora
x0.5 = x(3 ) = 21.0.
28
Considerata una generica sequenza, tutti i suoi termini sono evidentemente quantili di un certo ordine
della variabile X, ma fra questi alcuni sembrano più indicativi di altri perché fanno riferimento a quei
valori di p che corrispondono a quelli di uso più comune e sono considerati, quindi, come altrettanti valori
caratteristici della X.
Sono frequentemente utilizzati i quantili x0.25, x0.5 e x0.75 che, per la loro importanza nella descrizione delle
caratteristiche della variabile X, hanno un nome particolare e vengono detti quartili.
Il quartile più importante è il secondo, x0.5, comunemente chiamato mediana, perché indica quel
particolare valore della variabile tale che almeno la metà delle unità presenta un valore minore o uguale a
x0.5 e almeno la metà delle unità presenta un valore maggiore o uguale a x0.5.
Per esempio l’ISTAT fa espressamente riferimento al “reddito mediano” in numerosi studi volti a
confrontare la distribuzione del reddito in Italia rispetto a quella di altri Paesi europei, oppure per
analizzare condizioni di vita e livello di povertà delle famiglie italiane nei diversi anni.
Altri quantili di uso frequente sono i nove decili x0.1, x0.2, ..., x0.9 e i novantanove centili x0.01, x0.02, ..., x0.99.
In questi casi la mediana corrisponde al quinto decile o al cinquantesimo centile.
Esempio 3.3.3
Considerata la seguente sequenza di n=10 valori di una variabile quantitativa continua X 3.20 3.25 2.80 2.96 3.00 3.18 3.12 1.87 1.99 2.02
si determinino i suoi tre quartili.
La sequenza ordinata è
1.87 1.99 2.02 2.80 2.96 3.00 3.12 3.18 3.20 3.25
per cui il primo quartile occupa il posto 35.225.010 np , la mediana il posto 555.010 np
e il terzo quartile il posto 85.775.010 np . Risulta quindi x0.25 = 2.02 x0.5 = 2.96 x0.75 = 3.18 Esempio 3.3.4
Considerata la seguente sequenza di n=14 valori di una variabile quantitativa discreta X 3 1 5 -2 -3 -5 0 10 -9 20 12 6 -21 8
si determinino i suoi tre quartili.
La sequenza ordinata è
-21 -9 -5 -3 -2 0 1 3 5 6 8 10 12 20
per cui il primo quartile occupa il posto 45.325.014 np , la mediana il posto 775.014 np
e il terzo quartile il posto 115.1075.014 np . Risulta quindi x0.25 = -3 x0.5 = 1 x0.75 = 8
29
Se nella sequenza degli n valori alcuni di questi si presentano più di una volta, l’addensamento delle
frequenze in corrispondenza di alcune determinazioni fa sì che uno stesso valore della variabile possa
corrispondere a più quantili di ordine diverso.
Se, per esempio, si considera la seguente sequenza ordinata dei voti in statistica ottenuti da 20 studenti
18 18 18 20 20 22 22 23 23 23 23 24 24 24 25 26 27 27 28 30
i tre quartili occupano rispettivamente i posti 525.020 , 105.020 e 1575.020 e sono
quindi dati da x0.25 = 20, x0.5 = 23 e x0.75 = 25. Il valore 20 corrisponde però anche al secondo decile, così
come il valore 23 è sia mediana, sia quarto e sesto decile.
Alle medesime conclusioni si giunge ovviamente se si fa riferimento, invece che alla sequenza, alla
distribuzione di frequenza corrispondente, per cui il calcolo dei quantili si effettua sempre nello stesso
modo.
Nel caso di una distribuzione di frequenza conviene però utilizzare i valori delle frequenze assolute
cumulate.
In una distribuzione di frequenza il quantile di ordine p della variabile quantitativa X corrisponde al
valore cj a cui è associata la prima frequenza assoluta cumulata Nj maggiore o uguale a np .
Data per esempio la distribuzione dei voti considerati in precedenza
Distribuzione dei voti
x Frequenza assoluta Frequenza assoluta cumulata
18 3 3
20 2 5
22 2 7
23 4 11
24 3 14
25 1 15
26 1 16
27 2 18
28 1 19
30 1 20
20
dalle frequenze assolute cumulate contenute nell’ultima colonna della tabella precedente si ottengono gli
stessi quartili ottenuti sulla sequenza dei voti.
30
Esempio 3.3.5
Data la seguente distribuzione di frequenza relativa a una variabile quantitativa discreta X
Distribuzione di una variabile X
x Frequenza assoluta
-2 4
-1 6
0 10
1 10
2 12
3 8
50
si determini il valore del secondo, del quinto e del settimo decile.
Le unità esaminate sono 50, per cui i posti occupati dai tre decili richiesti sono rispettivamente il decimo, il
venticinquesimo e il trentacinquesimo. Dalle frequenze assolute cumulate riportate nella tabella seguente
Distribuzione di una variabile X
x Frequenza assoluta Frequenza assoluta cumulata
-2 4 4
-1 6 10
0 10 20
1 10 30
2 12 42
3 8 50
50
risulta x0.2 = -1, x0.5 = 1 e x0.7 = 2.
In questa sede, per semplicità, non verrà considerata la determinazione dei quantili per variabili
quantitative continue la cui distribuzione è stata sintetizzata in classi di valori, né per variabili qualitative
ordinabili. È invece chiaro che non è mai possibile determinare i quantili di variabili qualitative
sconnesse, dato che non esiste un ordinamento naturale delle sue modalità.
31
3.4 Media aritmetica
Un’importante caratteristica di una variabile quantitativa è costituita dal suo valore medio, espressione
utilizzata spesso anche nel linguaggio comune dato che, con riferimento a gruppi di persone, si parla
abitualmente di reddito medio, voto medio, età media.
Il valore medio rientra fra le medie di tipo analitico, in quanto la sua determinazione richiede operazioni
di tipo algebrico sui valori assunti dalla variabile, per cui può essere calcolato esclusivamente per variabili
di tipo quantitativo (sia discrete, sia continue).
Il valore medio, calcolato per determinare l'ordine di grandezza del fenomeno nel gruppo considerato, è
spesso utilizzato per confrontare in modo sommario la distribuzione di una stessa variabile rilevata su
diversi gruppi di unità oppure in tempi diversi. Sono di uso comune, per esempio, espressioni quali "le
donne in media vivono più a lungo degli uomini", "i neonati maschi pesano in media più delle femmine",
"la durata media della vita è sensibilmente più elevata di quella del secolo scorso".
L'espressione "valore medio" è piuttosto generica perché in realtà si può fare riferimento a più valori medi
che in genere risultano diversi fra di loro. Nel linguaggio comune, però, con il termine media ci si
riferisce quasi sempre alla cosiddetta media aritmetica che, fra tutti i possibili valori medi, è senz'altro il
più importante, tanto che in statistica, quando si parla di media senza ulteriori specificazioni, ci si riferisce
sempre a quest'ultima.
La media aritmetica, la moda e la mediana fanno parte della famiglia dei cosiddetti indici della tendenza
centrale, a sottolineare il fatto che tali indici tendono a posizionarsi al centro della distribuzione, ossia
tendono a rappresentare l’ordine di grandezza della variabile di interesse.
Considerata la sequenza degli n valori di una variabile quantitativa X, la sua media aritmetica, indicata
con il simbolo x o mx, è uguale alla somma di tutti i valori divisa per n.
Utilizzando l’operatore sommatoria, la formula di calcolo della media corrisponde quindi a
n
x
mx
n
ii
x
1 3.4.1
dove la somma di tutti gli n valori,
n
iix
1
, che compare al numeratore, corrisponde al cosiddetto
ammontare della variabile.
32
Per esempio, la media della sequenza dei voti in statistica considerata nell’esempio 2.1.3 è uguale a
20.392.
Esempio 3.4.1
La media aritmetica della sequenza successiva, che indica il numero di dipendenti di un gruppo di 10 aziende
cooperative, 1 2 3 4 6 8 15 18 20 23
risulta uguale a
10
10
100
10
23321
...x .
Se si dispone, anziché della sequenza originaria di valori, di una distribuzione di frequenza, la media
viene calcolata in modo diverso a seconda che nella prima colonna compaiano i singoli valori della
variabile oppure le classi. Se la variabile è discreta e a ogni valore cj è associata la frequenza assoluta n
j,
la media corrisponde a
n
nc
n
nc
mx
k
jjj
k
jj
k
jjj
x
1
1
1, j = 1, 2, ..., k n, 3.4.2
che è del tutto equivalente alla 3.4.1, perché l'ammontare complessivo della variabile corrisponde alla
somma dei prodotti fra ciascun valore e la frequenza corrispondente (ogni valore cj compare infatti n
j
volte).
Nel caso della tabella 2.1.3, per esempio, il numero medio di componenti delle famiglie italiane formate
da non più di 5 componenti si ottiene mediante la 3.4.2 e risulta approssimativamente pari a
.53.221410768
12639345...5900995254091801
x
Se nella distribuzione compaiono le frequenze relative, la media aritmetica è definita dall'espressione
33
k
jjjx fcmx
1
, j = 1, 2, ..., k n 3.4.3
che equivale sia alla 3.4.2, dato che
,fcn
nc
n
nc
x j
k
jj
jk
jj
k
jjj
11
1
sia alla 3.4.1, dove a ciascuna xi è associata una frequenza relativa costante, uguale a 1/n.
Infine, se i dati disponibili sono raggruppati in k classi, la media aritmetica può essere calcolata solo in
modo approssimato dato che non sono noti con esattezza tutti gli n valori rilevati (e quindi non si conosce
l’ammontare esatto della variabile all’interno di ogni singola classe).
In questa situazione si adotta l'ipotesi che i valori contenuti all'interno della j-esima classe siano tutti
uguali al suo valore centrale, pari alla semisomma dei suoi estremi.
Considerata la j-esima classe, il suo valore centrale, indicato con il simbolo jc , è quindi pari a
.cc
cjj
j2
1
A seconda che si disponga delle frequenze assolute o relative, la media di una distribuzione in classi si
calcola quindi mediante l’espressione
,fcn
nc
mx j
k
jj
k
jjj
x
1
1
ma ovviamente il risultato ottenuto in questo modo è solo un'approssimazione della media vera (ottenibile
dagli n valori originali). É chiaro quindi che, se si disponesse di tali valori, la media andrebbe sempre
calcolata su questi ultimi e non sulla distribuzione in classi.
In alcuni casi, pur non avendo a disposizione i singoli valori della variabile rilevati sulle singole unità
statistiche, si può conoscere l’esatto ammontare della variabile per ciascuna delle classi che compongono
la distribuzione (l’ISTAT fornisce spesso questa informazione). In questo caso, ovviamente, il calcolo
34
della media dovrà essere effettuato considerando questi ammontari esatti, piuttosto che quelli stimati in
modo approssimato.
Se invece si dispone dei soli dati in classi, va sottolineato che il valore medio approssimato risulterà più
preciso al diminuire dell'ampiezza delle diverse classi, mentre se nella distribuzione compaiono una o più
classi aperte, per il calcolo della media sarà necessario approssimare in qualche modo i valori degli
estremi, utilizzando altre eventuali informazioni disponibili sulla variabile in esame.
Esempio 3.4.2
La media della distribuzione riportata nella tabella successiva
Classi di valori Frequenza relativa Valore centrale
0 – 5 0.20 2.5
5 – 10 0.16 7.5
10 – 20 0.24 15.0
20 – 50 0.32 35.0
50 – 100 0.08 75.0
1.00
si ottiene dalla somma dei prodotti dei valori centrali per le frequenze relative corrispondenti, ed è uguale a 22.5.
In alcuni casi il calcolo del valore medio di una variabile viene effettuato in modo diverso, attribuendo ai
diversi valori assunti dalla variabile un “peso” che serve per misurare l’importanza che si vuole attribuire
a ciascuna di esse.
Si supponga, per esempio, che in due diverse occasioni si siano acquistate due diverse quantità (p1 e p
2) di
uno stesso bene pagando rispettivamente i prezzi x1 e x
2. In questo caso l'ammontare complessivo della
spesa sostenuta è pari alla somma dei prodotti fra prezzi e quantità
.2211 pxpx
Per calcolare il prezzo medio che, se fosse risultato identico nelle due occasioni, avrebbe fatto spendere la
stessa somma complessiva, non si può fare semplicemente la semisomma dei due prezzi x1 e x
2, ma i due
prezzi vanno pesati (ossia ponderati) con le quantità corrispondenti (p1 e p
2).
Il prezzo medio �̅� è pari quindi al rapporto fra l’ammontare della spesa complessiva e la quantità totale
del bene acquistata, per cui
35
.21
2211
pp
pxpxx
3.4.4
Il valore così ottenuto è quel prezzo medio che lascia inalterato l’ammontare complessivo della spesa,
come risulta subito dall’uguaglianza
.pxpxppx 221121
La 3.4.4 è un esempio di media aritmetica ponderata, ossia di una media dove ogni singolo valore
contribuisce alla determinazione dell'ammontare complessivo in maniera proporzionale a un qualche
"peso" associato al valore stesso.
In generale, considerati gli n valori xi della variabile X a cui sono attribuiti rispettivamente i pesi p
i, la
media ponderata della variabile risulta
.
1
1
n
ii
n
iii
p
px
x
3.4.5
Un esempio tipico di media ponderata si presenta quando si vuole calcolare il voto medio ottenuto negli
esami di profitto di un corso universitario quando ai diversi esami è attribuito un numero di crediti (CFU)
variabile. In questo caso la media dei voti deve tenere conto di questa informazione che “pesa”
l’importanza di ciascuno degli esami superati.
Supponiamo per esempio che uno studente abbia ottenuto le votazioni riportate nella prima riga della
tabella successiva, mentre nella seconda riga sono riportati i valori dei crediti corrispondenti.
Tabella 3.4.1
Voto e crediti degli esami universitari superati da uno studente
Voto 24 26 18 30 27 26
CFU 4 8 12 4 8 4
Il voto medio corrisponde a .2440
960
4841284
4268274301218826424
x
36
3.5 Proprietà della media aritmetica
La media aritmetica verifica alcune importanti proprietà che verranno utilizzate anche nei capitoli
successivi. Innanzitutto, dato che la media x
misura l’ordine di grandezza della variabile X, è necessario
che sia interna al campo di variazione della variabile stessa.
- Prima proprietà (proprietà di internalità)
Considerata la sequenza ordinata delle osservazioni x(i)
di una variabile quantitativa X, la sua media x
risulta sempre compresa all’interno del suo campo di variazione.
Dimostrazione
Data una variabile quantitativa X rilevata su n unità statistiche, si consideri la sequenza ordinata dei valori
ordinati in modo non decrescente nx...,,x, x 21 . Per ogni i = 1, 2, ..., n vale la disuguaglianza
ni xx per cui
n
n
in
n
ii xx
nx
nx
11
11.
In modo analogo, dato che 1xxi per ogni i = 1, 2, ..., n risulta
11
11
11xx
nx
nx
n
i
n
ii
per cui la media è sempre compresa nel campo di variazione nx x,x 1Ω della variabile X:
nxxx 1
- Seconda proprietà
L’ammontare complessivo di una variabile quantitativa X rilevata su n unità corrisponde a n volte il
valore della sua media aritmetica x , ossia
xnxn
ii
1
.
37
In base all’uguaglianza precedente, che non necessita di alcuna dimostrazione perché deriva direttamente
dalla definizione 3.4.1, la media aritmetica risulta essere quel particolare valore che, sostituito a ciascuno
dei valori effettivamente rilevati, lascia inalterato l'ammontare della variabile. Questa proprietà evidenzia
quindi i casi in cui è corretto sintetizzare i dati raccolti mediante la media aritmetica, anziché mediante
una media diversa: la media aritmetica è quel particolare valore che “equiripartisce” l’ammontare della
variabile fra le n unità.
Per esempio, dato un gruppo di n individui su cui è stata rilevata la variabile reddito, la sua media
aritmetica rappresenta quel particolare valore teorico del reddito, uguale per ciascun individuo, che lascia
inalterato il reddito complessivo del gruppo.
- Terza proprietà (proprietà di linearità)
La media di una trasformazione lineare corrisponde alla trasformazione lineare della media.
Dimostrazione
Considerata una variabile X di media x e una sua trasformazione lineare del tipo
Y = a + bX 3.5.1
la media della variabile trasformata, corrispondente all’espressione seguente
n
iiy y
nmy
1
1,
può essere scritta nella forma seguente
n
iibxa
ny
1
1
per cui risulta
xbaxn
ban
nbx
na
ny
n
ii
n
ii
n
i
111
111. 3.5.2
38
Quindi, se di una variabile quantitativa X è nota la sua media x , per ottenere la media della variabile Y,
trasformata lineare della X, non è necessario effettuare la trasformazione delle singole osservazioni xi, ma
è sufficiente effettuare la trasformazione lineare della x .
Riprendendo l’esempio 1.4.1 considerato nel primo capitolo, si indichi con X la temperatura espressa in
gradi Fahrenheit e con Y la temperatura espressa in gradi Celsius. La media della X risulta
414
59503223
x
mentre, tenuta presente la relazione esistente fra gradi Fahrenheit e gradi Celsius, la temperatura media in
gradi centigradi corrisponde a
532
9
5 xy .
Esempio 3.5.1
Data una variabile X di media 2x si determini la media delle tre variabili trasformate
X42Y X38W
X65Z
Applicando la 3.5.2 si ottiene
624242 xy
1423838 xw
726565 xz
Come caso particolare di trasformazione lineare si consideri la variabile
Y = X−�̅� , 3.5.3
che si ottiene dalla 3.5.1 ponendo a = −�̅� e b = 1. La Y, detta variabile scarto, assumerà valori
yi = xi−�̅�
che risultano positivi o negativi a seconda che la i-esima osservazione sia rispettivamente maggiore o
minore della media �̅�.
39
Dalla 3.5.2, tenendo presenti le uguaglianze a = −�̅� e b = 1, risulta immediatamente che la media
aritmetica �̅� della variabile scarto Y è sempre pari a zero e, quindi, è pari a zero anche la somma dei suoi
n valori.
- Quarta proprietà
Considerata una variabile X di media �̅�, la somma dei quadrati degli scarti della variabile dalla sua media
è un minimo.
Dimostrazione
Considerata una variabile quantitativa X e un valore h diverso dalla sua media aritmetica �̅�, si deve
dimostrare che vale la seguente disuguaglianza
xhhxxxn
ii
n
ii
ogniper1
2
1
2. 3.5.4
Se nel termine a destra della disuguaglianza precedente si sottrae e si somma la media aritmetica �̅� si
ottiene
.hxxxhxxxn
ii
n
ii
1
2
1
2
Sviluppando il quadrato del binomio, risulta
n
ii
n
i
n
ii
n
iii xxhxhxxxhxxxhxxx
11
2
1
2
1
22 22 .
dove il doppio prodotto è pari a zero perché corrisponde al prodotto di una costante per la somma della
variabile scarto.
Il termine a destra nella disuguaglianza 3.5.4 può essere quindi scomposto nella somma
21
2
1
2
1
2
1
2 hxnxxhxxxhxn
ii
n
i
n
ii
n
ii
3.5.5
40
della somma dei quadrati degli scarti dalla media più n volte la differenza al quadrato fra la costante
arbitraria h e la media aritmetica x . Quest’ultima quantità risulta nulla se e solo se xh ed è quindi
dimostrato che la quantità a sinistra della 3.5.4 assume il suo valore minimo quando xh .
Questa proprietà appena dimostrata sottolinea ancora una volta il ruolo di “centralità” della media
aritmetica, in quanto la �̅� minimizza la somma dei quadrati degli scarti e può essere quindi considerato
come il valore “più vicino” alle n osservazioni originali.
Nota
Anche la mediana verifica una proprietà analoga a questa, ma riferita alla somma dei valori assoluti degli scarti,
anziché ai loro quadrati. La mediana x0.5
di una variabile quantitativa X è infatti quel valore che rende minima la
somma dei valori assoluti degli scarti
minxxn
i.i
150 .
In alcune situazioni le n unità statistiche esaminate sono naturalmente suddivise in gruppi (per esempio, le
persone esaminate in un’indagine possono essere naturalmente suddivise in maschi e femmine oppure in
occupati e disoccupati) e può accadere di conoscere il valore medio della variabile di interesse nei singoli
gruppi (per esempio, si potrebbe conoscere il reddito medio per i maschi e per le femmine o l’età media
degli occupati e dei disoccupati). In queste situazioni, se è noto il numero delle unità appartenenti ai
singoli gruppi, la media della variabile sulle n unità corrisponde alla media delle medie nei gruppi,
ponderate con le numerosità corrispondenti.
- Quinta proprietà (proprietà associativa)
Considerate n unità statistiche suddivise in g gruppi distinti, ciascuno di numerosità nh, con ,nn
g
hh
1
e
indicata con hx la media della variabile X all’interno dell’h-esimo gruppo (con h = 1, 2, …, g), la media
x della X su tutte le n unità corrisponde alla media delle singole medie hx ponderate con le nh.
Dimostrazione
Tenendo presente che le n osservazioni relative alla variabile X sono suddivise in g gruppi disgiunti,
conviene indicare ogni singola osservazione con due indici, il primo dei quali riporta la posizione
occupata da ciascuna osservazione nel gruppo di appartenenza, mentre il secondo riporta l’identificativo
41
del gruppo. In questo modo il simbolo xih indica l’i-esima osservazione appartenente all’h-esimo gruppo
(con i =1, 2, …, nh e h = 1, 2, …, g).
Utilizzando questa notazione, la media generale della variabile X, pari al rapporto fra l’ammontare
complessivo della variabile diviso per il numero di unità che la compongono, può essere posta nella forma
n
x
n
x
x
hhn
iih
g
h
n
i
g
hih
111 1 3.5.6
dove le quantità nella parentesi tonda corrispondono all’ammontare della variabile in ciascun gruppo,
ossia al prodotto della media aritmetica del gruppo per la numerosità del gruppo stesso, ossia
g...,,,hnxx hh
n
iih
h
211
.
La media aritmetica generale 3.5.6, quindi, può essere anche scritta nella forma equivalente
g
hhhnx
nx
1
1 3.5.7
che corrisponde alla media delle medie dei singoli gruppi ponderate per la numerosità dei gruppi stessi.
Esempio 3.5.4 Si consideri un gruppo di 100 laureati di cui 45 di sesso femminile e 55 di sesso maschile. Sapendo che il voto
medio di laurea delle studentesse è risultato pari a 103.3 mentre il voto medio degli studenti è risultato pari a 101.1,
determinare il voto medio di laurea per l’intero gruppo di laureati.
Il risultato cercato è dato da 09102100
551101453103.
..
Nota
Si osservi che in alcune situazioni l'ordine di grandezza di un fenomeno va misurato con valori medi diversi dalla
media aritmetica. Quest’ultima, infatti, è solo un caso particolare della cosiddetta famiglia delle medie potenziate,
il cui generico elemento, indicato con Ms, è detto media potenziata di ordine s. Considerata la serie degli n valori
originari, la media potenziata di ordine s assume la forma
42
sn
i
si
sn
x
M
1
1
< s < +
che è definita per qualsiasi valore di s solo se tutte le xi sono maggiori di zero. La media aritmetica fa ovviamente
parte di questa famiglia e si ottiene per s = 1.
43
3.6 Momenti
Il concetto di media aritmetica è alla base della definizione di un’altra famiglia di indici, frequentemente
utilizzati in statistica, che vengono detti momenti.
Data la sequenza delle n osservazioni di una variabile quantitativa X, si definisce momento ordinario (o
momento dall’origine) di ordine r (e viene indicato di solito mediante il simbolo mrx
o mediante il più
semplice simbolo mr, se è evidente che si sta analizzando la variabile X) la media aritmetica delle potenze
r-esime delle osservazioni
n
i
rirrx x
nmm
1
1, r = 0, 1, 2, ... 3.6.1
Dalla formula precedente i vede subito che il momento di ordine zero è sempre uguale a 1, mentre
ponendo r = 1 si ottiene la media aritmetica
.mmx x 1
Esempio 3.6.1
Data la seguente sequenza di valori,
0 1 1 3 3 4
il terzo momento dall’origine è pari a
206
433110 333
3
m
Se i valori rilevati sono organizzati in una distribuzione di frequenza, la determinazione dei momenti di
ordine r viene effettuata in modo analogo a quanto visto a proposito della media aritmetica.
Nel caso di una distribuzione di frequenza il momento di ordine r corrisponde alla media aritmetica delle
potenze r-esime dei k valori
j
k
j
rjj
k
j
rjr fcnc
nm
11
1, r = 0, 1, 2, ... 3.6.2
44
Esempio 3.6.2
Data la distribuzione riportata nella tabella seguente
Numero di figli Frequenza relativa
0 0.4
1 0.2
2 0.3
3 0.1
1.0
il secondo momento dall’origine corrisponde a
m2 = 0×0.4+1×0.2+4×0.3+9×0.1=2.3
Per una distribuzione in classi, il valore approssimato del momento di ordine r si ottiene da
j
k
j
rjj
k
j
rjr fcnc
nm
11
1, r = 0, 1, 2, ... 3.6.3
Esempio 3.6.3
Data la distribuzione riportata nella tabella seguente
Classi Frequenza
assoluta
-1 1 5
1 15
5 20
40
il terzo momento dall’origine corrisponde a
m3 ≈ (0×5+33×15+73×20)/40 = 18.625
Oltre ai momenti dall’origine, in statistica spesso si utilizzano anche i momenti centrali, il cui generico
elemento di ordine r, indicato con il simbolo rxm , o più brevemente rm se è chiaro che ci si riferisce
alla variabile X, assume la forma
n
i
rirrx xx
nmm
1
1, r = 0, 1, 2, ... 3.6.4
se i dati sono costituiti dalla sequenza di n osservazioni.
45
Per r = 0 il risultato è pari a uno, mentre per r = 1 si ottiene la media della variabile scarto, che è sempre
pari a zero.
Nel caso di una distribuzione di frequenza il momento centrale di ordine r corrisponde a
j
k
j
rjj
k
j
rjr fxcnxc
nm
11
1, r = 0, 1, 2, ... 3.6.5
ed infine, per una distribuzione in classi, il valore approssimato del momento centrale di ordine r è dato
da
j
k
j
rjj
k
j
rjr fxcnxc
nm
11
1, r = 0, 1, 2, ... 3.6.6
Il momento centrale di ordine r corrisponde alla media aritmetica delle potenze r-esime degli scarti dalla
media aritmetica della variabile
Esempio 3.6.4
Data la distribuzione riportata nella tabella dell’esempio 3.6.2, se ne calcoli il secondo momento centrale.
La media aritmetica è pari a
11103302201400 .....x
per cui il secondo momento centrale è
�̅�2 = (0 − 1.1)2 × 0.4 + (1 − 1.1)2 × 0.2 + (2 − 1.1)2 × 0.3 + (3 − 1.1)2 × 0.1 = 1.09
Proprietà
Considerata una variabile X il cui momento centrale di ordine r è dato da rxm , il momento centrale di
ordine r di una trasformazione lineare del tipo Y = a + bX corrisponde a rxr
ry mbm
Dimostrazione
Considerata una variabile X di media �̅� e momento r-esimo rxm , la variabile trasformata Y data dalla
3.5.1 ha una media pari alla trasformazione lineare della media della X, per cui il momento suo r-esimo
può essere scritto nella forma seguente
46
rxr
n
i
ri
r
n
i
ri
n
i
ri
n
i
riry
mbxxn
b
xxbn
xbabxan
yyn
m
1
111
1
111
3.6.7
Questo risultato indica che i momenti di ordine r sono invarianti per cambiamenti dell’origine della scala
di misura, ma variano al variare dell’unità di misura.
I valori dei momenti centrali possono essere ricavati da quelli dei momenti dall'origine. Facendo
riferimento alla sequenza degli n valori originali, per esempio, si dimostra che il secondo momento
centrale risulta uguale a
212
22
222
1
2
11
2
1
2
11
2
1
22
1
22
211
21
21
211
mmxmxxmxn
xn
xxn
xxxxn
xxxxn
xxn
m
n
i
n
ii
n
ii
n
i
n
ii
n
ii
n
iii
n
ii
3.6.8
e corrisponde quindi alla differenza fra il secondo momento dall'origine e la media al quadrato o, in altri
termini, alla media dei quadrati meno il quadrato della media.
Esempio 3.6.5
Data la distribuzione riportata nella tabella dell’esempio 3.6.2, se ne calcoli il secondo momento centrale mediante il
calcolo dei primi due momenti dall’origine.
Risulta
11103302201400 .....x
m2 = 0×0.4+1×0.2+4×0.3+9×0.1=2.3
da cui si ottiene infine
0911132 2222 ...xmm
Nota
Per quanto riguarda il terzo e il quarto momento centrale le relazioni con i momenti dall’origine sono invece
41
2121344
311233
364
23
mmmmmmm
mmmmm
47
I momenti centrali di ordine 2, 3 e 4, come si vedrà nel prossimo capitolo, forniscono alcune importanti
informazioni su diverse caratteristiche della distribuzione della variabile in esame.
Nota
Tutti i momenti esaminati rientrano nella cosiddetta famiglia dei momenti di ordine r da h, il cui generico termine
che indichiamo con il simbolo rh m , nel caso di una sequenza di n osservazioni assume la forma
n
i
rirh h
nm
1
x1
, r = 0, 1, 2, ...
da cui, per h = 0, si ottengono le espressioni dei momenti dall'origine, mentre per h = x si ottengono le espressioni
dei momenti centrali.