3. INDICI DI POSIZIONE - unisi.it · determinabili per una variabile di qualsiasi natura, e medie...

transcript

3. INDICI DI POSIZIONE

3.1 Introduzione

Nello studio delle caratteristiche di una variabile, le cosiddette medie sono particolari indici statistici,

detti anche indici di posizione, che risultano di fondamentale importanza perché consentono di descrivere

sinteticamente l’insieme dei dati osservati mediante una sola modalità o un unico valore numerico, a

seconda che la variabile considerata sia qualitativa o quantitativa.

Gli indici che saranno esaminati nei paragrafi seguenti si suddividono in medie di posizione,

determinabili per una variabile di qualsiasi natura, e medie analitiche, che possono essere invece

calcolate solo per variabili quantitative, dato che richiedono l’esecuzione di operazioni algebriche.

L’obiettivo che si vuole conseguire con il calcolo degli indici di posizione è la sintesi di tutte le

informazioni contenute nei dati originali attraverso una sola determinazione che sia in qualche modo

rappresentativa di tutte le rilevazioni effettuate, per cui è evidente che la media di una variabile qualitativa

dovrà necessariamente coincidere con una delle modalità assunte dalla variabile, mentre nel caso di una

variabile quantitativa la media sarà sempre interna al suo campo di variazione.

3.2 Moda

La prima caratteristica che si nota esaminando una distribuzione di frequenza relativa a una variabile

qualitativa o quantitativa discreta è la determinazione (o le determinazioni) a cui è associata la frequenza

(assoluta o relativa) più elevata.

Questa determinazione è detta determinazione modale o, più semplicemente, moda. Se esistono più

determinazioni a cui è associata la stessa frequenza massima, tutte queste determinazioni rappresentano

altrettante mode della distribuzione.

Considerata una variabile qualitativa o quantitativa discreta X che assume k determinazioni diverse e

indicata con nj la frequenza assoluta associata alla j-esima determinazione (con j = 1,2, …, k), la moda M

della variabile X è quella determinazione della variabile per la quale risulta

𝑀𝑥 = arg max1≤𝑗≤𝑘

𝑛𝑗 3.2.1

dove arg max sta per argomento del massimo ossia, per il caso in esame, corrisponde all'insieme delle

determinazioni della variabile a cui è associata la frequenza massima.

Se la distribuzione è espressa mediante le frequenze relative, anziché mediante le frequenze assolute, la

moda corrisponde ovviamente a quella determinazione della X per la quale risulta

𝑀𝑥 = arg max1≤𝑗≤𝑘

𝑓𝑗 3.2.2

Dato che l’individuazione della moda si basa solo sui valori assunti dalle frequenze (assolute o relative),

risulta evidente che questo indice può essere determinato per una variabile di qualunque tipo.

Per esempio, la moda della variabile considerata nella tabella nella 2.1.1 è "altre attività", nella tabella

2.1.2 è il "diploma di scuola secondaria superiore", nella tabella 2.1.3 è "2 componenti" e nella 2.1.8 è

"prime edizioni".

Le mode appena individuate sulle distribuzioni di frequenza delle variabili considerate sarebbero potute

essere individuate anche attraverso l’analisi del grafico corrispondente, dato che in tutti i casi la moda

corrisponde alla determinazione a cui è associato il rettangolo o il segmento con l’altezza maggiore (per

grafici a colonna o per i diagrammi ad asta) oppure al rettangolo con la base maggiore (per grafici a

nastro).

Così, per esempio, la moda della distribuzione rappresentata nelle figure 2.3.2 o 2.3.3 è "industria", la

moda della distribuzione rappresentata nella figura 2.3.4 è "sufficiente", la moda della distribuzione

rappresentata nella figura 2.3.5 è il valore "2" e nella figura 2.3.6 la moda è “1”.

Ovviamente se in una distribuzione ci sono più determinazioni a cui è associata la stessa frequenza

massima, la variabile presenta più mode, mentre non c'è alcuna moda se tutte le frequenze sono uguali fra

Una distribuzione che presenta una sola moda è detta unimodale, mentre è detta plurimodale se presenta

più mode. In particolare, se esistono due mode, la distribuzione è detta “bimodale”, se ne esistono tre è

detta “trimodale” e così via.

Nel caso di una distribuzione di una variabile continua mediante classi di valori, l’individuazione della

moda non può essere effettuata in base ai valori delle frequenze associate a ciascuna classe in quanto,

come si è già detto in precedenza, all’aumentare dell’ampiezza della classe tende ad aumentare anche la

frequenza associata. Per determinare la moda occorre quindi individuare l’intervallo che, a parità di

ampiezza, contiene la frazione maggiore delle osservazioni.

Nelle distribuzioni di variabili continue date mediante classi di valori, è detto modale quell'intervallo che

presenta la massima densità di frequenza. Anche in questo caso possono esistere più classi modali, se a

più intervalli diversi è associata una stessa densità di frequenza massima.

Nel caso della tabella 2.4.1, per esempio, l'intervallo modale della distribuzione è la classe (160, 165] in

corrispondenza della quale si ha il massimo valore del rapporto fra frequenza e ampiezza.

In generale, quindi, considerata una variabile quantitativa continua X i cui valori sono stati suddivisi in k

classi e indicata con hj la densità di frequenza associata alla j-esima classe (con j = 1,2, …, k), la classe

modale Mx è quell’intervallo per il quale risulta

𝑀𝑥 = arg max

1≤𝑗≤𝑘ℎ𝑗 3.2.3

Anche in questo caso la determinazione della classe modale può avvenire graficamente, in quanto

corrisponde al rettangolo dell’istogramma che presenta la massima altezza. Per esempio, la figura 2.4.1

mostra chiaramente che la moda corrisponde alla classe (160, 165], così come si era rilevato anche dai

valori riportati nella tabella 2.4.1.

Se la determinazione della moda è estremamente semplice, va però notato che il suo utilizzo è abbastanza

limitato. Dato che la moda non fornisce alcuna informazione ulteriore sulla distribuzione della variabile,

la sua conoscenza non è particolarmente utile se le determinazioni assunte dalla variabile sono piuttosto

numerose, specie se la massima frequenza non è sensibilmente più elevata delle frequenze associate alle

altre determinazioni.

É inoltre evidente che la determinazione dell'intervallo modale per una variabile quantitativa continua

risente di tutte le arbitrarietà della suddivisione in classi che è stata effettuata.

Un pregio della moda è invece la sua “robustezza”, nel senso che questo indice non risente della eventuale

presenza di determinazioni molto grandi o molto piccole che potrebbero corrispondere a valori anomali

(in inglese, outlier), ossia a determinazioni che si discostano di molto dalle restanti determinazioni assunte

dalla variabile.

In una distribuzione possono essere individuati anche valori modali, detti secondari o locali, che corrispondono a

massimi relativi della distribuzione. In questo caso la determinazione della distribuzione a cui è associata la

frequenza massima è detta anche moda principale.

Nell’esempio 2.4.1 riportato alla fine del paragrafo 2.4 si ha una moda principale in corrispondenza dell’intervallo

[3001, 4000] e una moda secondaria in corrispondenza dell’intervallo [1001, 2000]

3.3 Quantili

Date n osservazioni relative alla variabile quantitativa X si definisce quantile di ordine p (con 0 < p < 1),

e si indica con xp, quel particolare valore della variabile per cui la proporzione di osservazioni inferiori o

uguali a xp è almeno p (e quindi la proporzione di osservazioni maggiore o uguale a xp è almeno 1-p).

Se, per esempio, per una distribuzione di redditi annui è noto che il quantile di ordine 0.25 è pari a 5 mila

euro, questo vuol dire che almeno un quarto delle unità considerate ha un reddito annuo inferiore o uguale

a 5 mila euro; se in una distribuzione di stature x0,8 vale 178 centimetri, significa che almeno l’80% delle

unità ha una statura inferiore o uguale a 178 centimetri.

Data una sequenza di n osservazioni relative a una variabile quantitativa X, il quantile xp di ordine p è

l’osservazione che nella sequenza ordinata occupa il posto corrispondente alla parte intera superiore del

prodotto np, indicato con np

Il simbolo np rappresenta quindi la parte intera superiore di np per cui

1< npnpnp .

Esempio 3.3.1

Considerata la seguente sequenza di osservazioni rilevate su 5 piantine di cui si è misurata l’altezza ottenendo i

seguenti valori in centimetri

23.4 18.2 21.0 22.7 19.1

si determini il quantile di ordine p = 0.5 della variabile.

In questo caso n = 5, per cui

35.25.05 np . Il quantile di ordine 0.5, x0.5, occupa quindi il terzo posto nella sequenza ordinata

18.2 19.1 21.0 22.7 23.4

per cui risulta

x0.5 = x(3 )= 21.

Esempio 3.3.2

Si supponga ora che alle unità dell’esempio precedente si sia aggiunta una nuova piantina, la cui altezza in

centimetri è pari a 21.5. Si vuole determinare il quantile di ordine p = 0.5 delle 6 unità statistiche.

In questo caso la sequenza ordinata è la seguente

18.2 19.1 21.0 21.5 22.7 23.4

per cui, dato che n = 6,

335.06 np .

Il quantile di ordine 0.5 occupa quindi il terzo posto nella sequenza ordinata per cui risulta ancora

x0.5 = x(3 ) = 21.0.

Considerata una generica sequenza, tutti i suoi termini sono evidentemente quantili di un certo ordine

della variabile X, ma fra questi alcuni sembrano più indicativi di altri perché fanno riferimento a quei

valori di p che corrispondono a quelli di uso più comune e sono considerati, quindi, come altrettanti valori

caratteristici della X.

Sono frequentemente utilizzati i quantili x0.25, x0.5 e x0.75 che, per la loro importanza nella descrizione delle

caratteristiche della variabile X, hanno un nome particolare e vengono detti quartili.

Il quartile più importante è il secondo, x0.5, comunemente chiamato mediana, perché indica quel

particolare valore della variabile tale che almeno la metà delle unità presenta un valore minore o uguale a

x0.5 e almeno la metà delle unità presenta un valore maggiore o uguale a x0.5.

Per esempio l’ISTAT fa espressamente riferimento al “reddito mediano” in numerosi studi volti a

confrontare la distribuzione del reddito in Italia rispetto a quella di altri Paesi europei, oppure per

analizzare condizioni di vita e livello di povertà delle famiglie italiane nei diversi anni.

Altri quantili di uso frequente sono i nove decili x0.1, x0.2, ..., x0.9 e i novantanove centili x0.01, x0.02, ..., x0.99.

In questi casi la mediana corrisponde al quinto decile o al cinquantesimo centile.

Esempio 3.3.3

Considerata la seguente sequenza di n=10 valori di una variabile quantitativa continua X 3.20 3.25 2.80 2.96 3.00 3.18 3.12 1.87 1.99 2.02

si determinino i suoi tre quartili.

La sequenza ordinata è

1.87 1.99 2.02 2.80 2.96 3.00 3.12 3.18 3.20 3.25

per cui il primo quartile occupa il posto 35.225.010 np , la mediana il posto 555.010 np

e il terzo quartile il posto 85.775.010 np . Risulta quindi x0.25 = 2.02 x0.5 = 2.96 x0.75 = 3.18 Esempio 3.3.4

Considerata la seguente sequenza di n=14 valori di una variabile quantitativa discreta X 3 1 5 -2 -3 -5 0 10 -9 20 12 6 -21 8

si determinino i suoi tre quartili.

La sequenza ordinata è

-21 -9 -5 -3 -2 0 1 3 5 6 8 10 12 20

per cui il primo quartile occupa il posto 45.325.014 np , la mediana il posto 775.014 np

e il terzo quartile il posto 115.1075.014 np . Risulta quindi x0.25 = -3 x0.5 = 1 x0.75 = 8

Se nella sequenza degli n valori alcuni di questi si presentano più di una volta, l’addensamento delle

frequenze in corrispondenza di alcune determinazioni fa sì che uno stesso valore della variabile possa

corrispondere a più quantili di ordine diverso.

Se, per esempio, si considera la seguente sequenza ordinata dei voti in statistica ottenuti da 20 studenti

18 18 18 20 20 22 22 23 23 23 23 24 24 24 25 26 27 27 28 30

i tre quartili occupano rispettivamente i posti 525.020 , 105.020 e 1575.020 e sono

quindi dati da x0.25 = 20, x0.5 = 23 e x0.75 = 25. Il valore 20 corrisponde però anche al secondo decile, così

come il valore 23 è sia mediana, sia quarto e sesto decile.

Alle medesime conclusioni si giunge ovviamente se si fa riferimento, invece che alla sequenza, alla

distribuzione di frequenza corrispondente, per cui il calcolo dei quantili si effettua sempre nello stesso

Nel caso di una distribuzione di frequenza conviene però utilizzare i valori delle frequenze assolute

cumulate.

In una distribuzione di frequenza il quantile di ordine p della variabile quantitativa X corrisponde al

valore cj a cui è associata la prima frequenza assoluta cumulata Nj maggiore o uguale a np .

Data per esempio la distribuzione dei voti considerati in precedenza

Distribuzione dei voti

x Frequenza assoluta Frequenza assoluta cumulata

18 3 3

20 2 5

22 2 7

23 4 11

24 3 14

25 1 15

26 1 16

27 2 18

28 1 19

30 1 20

dalle frequenze assolute cumulate contenute nell’ultima colonna della tabella precedente si ottengono gli

stessi quartili ottenuti sulla sequenza dei voti.

Esempio 3.3.5

Data la seguente distribuzione di frequenza relativa a una variabile quantitativa discreta X

Distribuzione di una variabile X

x Frequenza assoluta

si determini il valore del secondo, del quinto e del settimo decile.

Le unità esaminate sono 50, per cui i posti occupati dai tre decili richiesti sono rispettivamente il decimo, il

venticinquesimo e il trentacinquesimo. Dalle frequenze assolute cumulate riportate nella tabella seguente

Distribuzione di una variabile X

x Frequenza assoluta Frequenza assoluta cumulata

-2 4 4

-1 6 10

0 10 20

1 10 30

2 12 42

3 8 50

risulta x0.2 = -1, x0.5 = 1 e x0.7 = 2.

In questa sede, per semplicità, non verrà considerata la determinazione dei quantili per variabili

quantitative continue la cui distribuzione è stata sintetizzata in classi di valori, né per variabili qualitative

ordinabili. È invece chiaro che non è mai possibile determinare i quantili di variabili qualitative

sconnesse, dato che non esiste un ordinamento naturale delle sue modalità.

3.4 Media aritmetica

Un’importante caratteristica di una variabile quantitativa è costituita dal suo valore medio, espressione

utilizzata spesso anche nel linguaggio comune dato che, con riferimento a gruppi di persone, si parla

abitualmente di reddito medio, voto medio, età media.

Il valore medio rientra fra le medie di tipo analitico, in quanto la sua determinazione richiede operazioni

di tipo algebrico sui valori assunti dalla variabile, per cui può essere calcolato esclusivamente per variabili

di tipo quantitativo (sia discrete, sia continue).

Il valore medio, calcolato per determinare l'ordine di grandezza del fenomeno nel gruppo considerato, è

spesso utilizzato per confrontare in modo sommario la distribuzione di una stessa variabile rilevata su

diversi gruppi di unità oppure in tempi diversi. Sono di uso comune, per esempio, espressioni quali "le

donne in media vivono più a lungo degli uomini", "i neonati maschi pesano in media più delle femmine",

"la durata media della vita è sensibilmente più elevata di quella del secolo scorso".

L'espressione "valore medio" è piuttosto generica perché in realtà si può fare riferimento a più valori medi

che in genere risultano diversi fra di loro. Nel linguaggio comune, però, con il termine media ci si

riferisce quasi sempre alla cosiddetta media aritmetica che, fra tutti i possibili valori medi, è senz'altro il

più importante, tanto che in statistica, quando si parla di media senza ulteriori specificazioni, ci si riferisce

sempre a quest'ultima.

La media aritmetica, la moda e la mediana fanno parte della famiglia dei cosiddetti indici della tendenza

centrale, a sottolineare il fatto che tali indici tendono a posizionarsi al centro della distribuzione, ossia

tendono a rappresentare l’ordine di grandezza della variabile di interesse.

Considerata la sequenza degli n valori di una variabile quantitativa X, la sua media aritmetica, indicata

con il simbolo x o mx, è uguale alla somma di tutti i valori divisa per n.

Utilizzando l’operatore sommatoria, la formula di calcolo della media corrisponde quindi a

1 3.4.1

dove la somma di tutti gli n valori,

, che compare al numeratore, corrisponde al cosiddetto

ammontare della variabile.

Per esempio, la media della sequenza dei voti in statistica considerata nell’esempio 2.1.3 è uguale a

20.392.

Esempio 3.4.1

La media aritmetica della sequenza successiva, che indica il numero di dipendenti di un gruppo di 10 aziende

cooperative, 1 2 3 4 6 8 15 18 20 23

risulta uguale a

...x .

Se si dispone, anziché della sequenza originaria di valori, di una distribuzione di frequenza, la media

viene calcolata in modo diverso a seconda che nella prima colonna compaiano i singoli valori della

variabile oppure le classi. Se la variabile è discreta e a ogni valore cj è associata la frequenza assoluta n

la media corrisponde a

1, j = 1, 2, ..., k n, 3.4.2

che è del tutto equivalente alla 3.4.1, perché l'ammontare complessivo della variabile corrisponde alla

somma dei prodotti fra ciascun valore e la frequenza corrispondente (ogni valore cj compare infatti n

volte).

Nel caso della tabella 2.1.3, per esempio, il numero medio di componenti delle famiglie italiane formate

da non più di 5 componenti si ottiene mediante la 3.4.2 e risulta approssimativamente pari a

.53.221410768

12639345...5900995254091801

Se nella distribuzione compaiono le frequenze relative, la media aritmetica è definita dall'espressione

jjjx fcmx

, j = 1, 2, ..., k n 3.4.3

che equivale sia alla 3.4.2, dato che

sia alla 3.4.1, dove a ciascuna xi è associata una frequenza relativa costante, uguale a 1/n.

Infine, se i dati disponibili sono raggruppati in k classi, la media aritmetica può essere calcolata solo in

modo approssimato dato che non sono noti con esattezza tutti gli n valori rilevati (e quindi non si conosce

l’ammontare esatto della variabile all’interno di ogni singola classe).

In questa situazione si adotta l'ipotesi che i valori contenuti all'interno della j-esima classe siano tutti

uguali al suo valore centrale, pari alla semisomma dei suoi estremi.

Considerata la j-esima classe, il suo valore centrale, indicato con il simbolo jc , è quindi pari a

A seconda che si disponga delle frequenze assolute o relative, la media di una distribuzione in classi si

calcola quindi mediante l’espressione

ma ovviamente il risultato ottenuto in questo modo è solo un'approssimazione della media vera (ottenibile

dagli n valori originali). É chiaro quindi che, se si disponesse di tali valori, la media andrebbe sempre

calcolata su questi ultimi e non sulla distribuzione in classi.

In alcuni casi, pur non avendo a disposizione i singoli valori della variabile rilevati sulle singole unità

statistiche, si può conoscere l’esatto ammontare della variabile per ciascuna delle classi che compongono

la distribuzione (l’ISTAT fornisce spesso questa informazione). In questo caso, ovviamente, il calcolo

della media dovrà essere effettuato considerando questi ammontari esatti, piuttosto che quelli stimati in

modo approssimato.

Se invece si dispone dei soli dati in classi, va sottolineato che il valore medio approssimato risulterà più

preciso al diminuire dell'ampiezza delle diverse classi, mentre se nella distribuzione compaiono una o più

classi aperte, per il calcolo della media sarà necessario approssimare in qualche modo i valori degli

estremi, utilizzando altre eventuali informazioni disponibili sulla variabile in esame.

Esempio 3.4.2

La media della distribuzione riportata nella tabella successiva

Classi di valori Frequenza relativa Valore centrale

0 – 5 0.20 2.5

5 – 10 0.16 7.5

10 – 20 0.24 15.0

20 – 50 0.32 35.0

50 – 100 0.08 75.0

si ottiene dalla somma dei prodotti dei valori centrali per le frequenze relative corrispondenti, ed è uguale a 22.5.

In alcuni casi il calcolo del valore medio di una variabile viene effettuato in modo diverso, attribuendo ai

diversi valori assunti dalla variabile un “peso” che serve per misurare l’importanza che si vuole attribuire

a ciascuna di esse.

Si supponga, per esempio, che in due diverse occasioni si siano acquistate due diverse quantità (p1 e p

uno stesso bene pagando rispettivamente i prezzi x1 e x

2. In questo caso l'ammontare complessivo della

spesa sostenuta è pari alla somma dei prodotti fra prezzi e quantità

.2211 pxpx

Per calcolare il prezzo medio che, se fosse risultato identico nelle due occasioni, avrebbe fatto spendere la

stessa somma complessiva, non si può fare semplicemente la semisomma dei due prezzi x1 e x

2, ma i due

prezzi vanno pesati (ossia ponderati) con le quantità corrispondenti (p1 e p

Il prezzo medio �̅� è pari quindi al rapporto fra l’ammontare della spesa complessiva e la quantità totale

del bene acquistata, per cui

Il valore così ottenuto è quel prezzo medio che lascia inalterato l’ammontare complessivo della spesa,

come risulta subito dall’uguaglianza

.pxpxppx 221121

La 3.4.4 è un esempio di media aritmetica ponderata, ossia di una media dove ogni singolo valore

contribuisce alla determinazione dell'ammontare complessivo in maniera proporzionale a un qualche

"peso" associato al valore stesso.

In generale, considerati gli n valori xi della variabile X a cui sono attribuiti rispettivamente i pesi p

media ponderata della variabile risulta

Un esempio tipico di media ponderata si presenta quando si vuole calcolare il voto medio ottenuto negli

esami di profitto di un corso universitario quando ai diversi esami è attribuito un numero di crediti (CFU)

variabile. In questo caso la media dei voti deve tenere conto di questa informazione che “pesa”

l’importanza di ciascuno degli esami superati.

Supponiamo per esempio che uno studente abbia ottenuto le votazioni riportate nella prima riga della

tabella successiva, mentre nella seconda riga sono riportati i valori dei crediti corrispondenti.

Tabella 3.4.1

Voto e crediti degli esami universitari superati da uno studente

Voto 24 26 18 30 27 26

CFU 4 8 12 4 8 4

Il voto medio corrisponde a .2440

4841284

4268274301218826424

3.5 Proprietà della media aritmetica

La media aritmetica verifica alcune importanti proprietà che verranno utilizzate anche nei capitoli

successivi. Innanzitutto, dato che la media x

misura l’ordine di grandezza della variabile X, è necessario

che sia interna al campo di variazione della variabile stessa.

- Prima proprietà (proprietà di internalità)

Considerata la sequenza ordinata delle osservazioni x(i)

di una variabile quantitativa X, la sua media x

risulta sempre compresa all’interno del suo campo di variazione.

Dimostrazione

Data una variabile quantitativa X rilevata su n unità statistiche, si consideri la sequenza ordinata dei valori

ordinati in modo non decrescente nx...,,x, x 21 . Per ogni i = 1, 2, ..., n vale la disuguaglianza

ni xx per cui

In modo analogo, dato che 1xxi per ogni i = 1, 2, ..., n risulta

per cui la media è sempre compresa nel campo di variazione nx x,x 1Ω della variabile X:

nxxx 1

- Seconda proprietà

L’ammontare complessivo di una variabile quantitativa X rilevata su n unità corrisponde a n volte il

valore della sua media aritmetica x , ossia

In base all’uguaglianza precedente, che non necessita di alcuna dimostrazione perché deriva direttamente

dalla definizione 3.4.1, la media aritmetica risulta essere quel particolare valore che, sostituito a ciascuno

dei valori effettivamente rilevati, lascia inalterato l'ammontare della variabile. Questa proprietà evidenzia

quindi i casi in cui è corretto sintetizzare i dati raccolti mediante la media aritmetica, anziché mediante

una media diversa: la media aritmetica è quel particolare valore che “equiripartisce” l’ammontare della

variabile fra le n unità.

Per esempio, dato un gruppo di n individui su cui è stata rilevata la variabile reddito, la sua media

aritmetica rappresenta quel particolare valore teorico del reddito, uguale per ciascun individuo, che lascia

inalterato il reddito complessivo del gruppo.

- Terza proprietà (proprietà di linearità)

La media di una trasformazione lineare corrisponde alla trasformazione lineare della media.

Dimostrazione

Considerata una variabile X di media x e una sua trasformazione lineare del tipo

Y = a + bX 3.5.1

la media della variabile trasformata, corrispondente all’espressione seguente

può essere scritta nella forma seguente

per cui risulta

111. 3.5.2

Quindi, se di una variabile quantitativa X è nota la sua media x , per ottenere la media della variabile Y,

trasformata lineare della X, non è necessario effettuare la trasformazione delle singole osservazioni xi, ma

è sufficiente effettuare la trasformazione lineare della x .

Riprendendo l’esempio 1.4.1 considerato nel primo capitolo, si indichi con X la temperatura espressa in

gradi Fahrenheit e con Y la temperatura espressa in gradi Celsius. La media della X risulta

59503223

mentre, tenuta presente la relazione esistente fra gradi Fahrenheit e gradi Celsius, la temperatura media in

gradi centigradi corrisponde a

5 xy .

Esempio 3.5.1

Data una variabile X di media 2x si determini la media delle tre variabili trasformate

X42Y X38W

Applicando la 3.5.2 si ottiene

624242 xy

1423838 xw

726565 xz

Come caso particolare di trasformazione lineare si consideri la variabile

Y = X−�̅� , 3.5.3

che si ottiene dalla 3.5.1 ponendo a = −�̅� e b = 1. La Y, detta variabile scarto, assumerà valori

yi = xi−�̅�

che risultano positivi o negativi a seconda che la i-esima osservazione sia rispettivamente maggiore o

minore della media �̅�.

Dalla 3.5.2, tenendo presenti le uguaglianze a = −�̅� e b = 1, risulta immediatamente che la media

aritmetica �̅� della variabile scarto Y è sempre pari a zero e, quindi, è pari a zero anche la somma dei suoi

n valori.

- Quarta proprietà

Considerata una variabile X di media �̅�, la somma dei quadrati degli scarti della variabile dalla sua media

è un minimo.

Dimostrazione

Considerata una variabile quantitativa X e un valore h diverso dalla sua media aritmetica �̅�, si deve

dimostrare che vale la seguente disuguaglianza

xhhxxxn

ogniper1

2. 3.5.4

Se nel termine a destra della disuguaglianza precedente si sottrae e si somma la media aritmetica �̅� si

ottiene

.hxxxhxxxn

Sviluppando il quadrato del binomio, risulta

iii xxhxhxxxhxxxhxxx

22 22 .

dove il doppio prodotto è pari a zero perché corrisponde al prodotto di una costante per la somma della

variabile scarto.

Il termine a destra nella disuguaglianza 3.5.4 può essere quindi scomposto nella somma

2 hxnxxhxxxhxn

della somma dei quadrati degli scarti dalla media più n volte la differenza al quadrato fra la costante

arbitraria h e la media aritmetica x . Quest’ultima quantità risulta nulla se e solo se xh ed è quindi

dimostrato che la quantità a sinistra della 3.5.4 assume il suo valore minimo quando xh .

Questa proprietà appena dimostrata sottolinea ancora una volta il ruolo di “centralità” della media

aritmetica, in quanto la �̅� minimizza la somma dei quadrati degli scarti e può essere quindi considerato

come il valore “più vicino” alle n osservazioni originali.

Anche la mediana verifica una proprietà analoga a questa, ma riferita alla somma dei valori assoluti degli scarti,

anziché ai loro quadrati. La mediana x0.5

di una variabile quantitativa X è infatti quel valore che rende minima la

somma dei valori assoluti degli scarti

minxxn

In alcune situazioni le n unità statistiche esaminate sono naturalmente suddivise in gruppi (per esempio, le

persone esaminate in un’indagine possono essere naturalmente suddivise in maschi e femmine oppure in

occupati e disoccupati) e può accadere di conoscere il valore medio della variabile di interesse nei singoli

gruppi (per esempio, si potrebbe conoscere il reddito medio per i maschi e per le femmine o l’età media

degli occupati e dei disoccupati). In queste situazioni, se è noto il numero delle unità appartenenti ai

singoli gruppi, la media della variabile sulle n unità corrisponde alla media delle medie nei gruppi,

ponderate con le numerosità corrispondenti.

- Quinta proprietà (proprietà associativa)

Considerate n unità statistiche suddivise in g gruppi distinti, ciascuno di numerosità nh, con ,nn

indicata con hx la media della variabile X all’interno dell’h-esimo gruppo (con h = 1, 2, …, g), la media

x della X su tutte le n unità corrisponde alla media delle singole medie hx ponderate con le nh.

Dimostrazione

Tenendo presente che le n osservazioni relative alla variabile X sono suddivise in g gruppi disgiunti,

conviene indicare ogni singola osservazione con due indici, il primo dei quali riporta la posizione

occupata da ciascuna osservazione nel gruppo di appartenenza, mentre il secondo riporta l’identificativo

del gruppo. In questo modo il simbolo xih indica l’i-esima osservazione appartenente all’h-esimo gruppo

(con i =1, 2, …, nh e h = 1, 2, …, g).

Utilizzando questa notazione, la media generale della variabile X, pari al rapporto fra l’ammontare

complessivo della variabile diviso per il numero di unità che la compongono, può essere posta nella forma

111 1 3.5.6

dove le quantità nella parentesi tonda corrispondono all’ammontare della variabile in ciascun gruppo,

ossia al prodotto della media aritmetica del gruppo per la numerosità del gruppo stesso, ossia

g...,,,hnxx hh

La media aritmetica generale 3.5.6, quindi, può essere anche scritta nella forma equivalente

1 3.5.7

che corrisponde alla media delle medie dei singoli gruppi ponderate per la numerosità dei gruppi stessi.

Esempio 3.5.4 Si consideri un gruppo di 100 laureati di cui 45 di sesso femminile e 55 di sesso maschile. Sapendo che il voto

medio di laurea delle studentesse è risultato pari a 103.3 mentre il voto medio degli studenti è risultato pari a 101.1,

determinare il voto medio di laurea per l’intero gruppo di laureati.

Il risultato cercato è dato da 09102100

551101453103.

Si osservi che in alcune situazioni l'ordine di grandezza di un fenomeno va misurato con valori medi diversi dalla

media aritmetica. Quest’ultima, infatti, è solo un caso particolare della cosiddetta famiglia delle medie potenziate,

il cui generico elemento, indicato con Ms, è detto media potenziata di ordine s. Considerata la serie degli n valori

originari, la media potenziata di ordine s assume la forma

< s < +

che è definita per qualsiasi valore di s solo se tutte le xi sono maggiori di zero. La media aritmetica fa ovviamente

parte di questa famiglia e si ottiene per s = 1.

3.6 Momenti

Il concetto di media aritmetica è alla base della definizione di un’altra famiglia di indici, frequentemente

utilizzati in statistica, che vengono detti momenti.

Data la sequenza delle n osservazioni di una variabile quantitativa X, si definisce momento ordinario (o

momento dall’origine) di ordine r (e viene indicato di solito mediante il simbolo mrx

o mediante il più

semplice simbolo mr, se è evidente che si sta analizzando la variabile X) la media aritmetica delle potenze

r-esime delle osservazioni

rirrx x

1, r = 0, 1, 2, ... 3.6.1

Dalla formula precedente i vede subito che il momento di ordine zero è sempre uguale a 1, mentre

ponendo r = 1 si ottiene la media aritmetica

.mmx x 1

Esempio 3.6.1

Data la seguente sequenza di valori,

0 1 1 3 3 4

il terzo momento dall’origine è pari a

433110 333

Se i valori rilevati sono organizzati in una distribuzione di frequenza, la determinazione dei momenti di

ordine r viene effettuata in modo analogo a quanto visto a proposito della media aritmetica.

Nel caso di una distribuzione di frequenza il momento di ordine r corrisponde alla media aritmetica delle

potenze r-esime dei k valori

rjr fcnc

1, r = 0, 1, 2, ... 3.6.2

Esempio 3.6.2

Data la distribuzione riportata nella tabella seguente

Numero di figli Frequenza relativa

il secondo momento dall’origine corrisponde a

m2 = 0×0.4+1×0.2+4×0.3+9×0.1=2.3

Per una distribuzione in classi, il valore approssimato del momento di ordine r si ottiene da

rjr fcnc

1, r = 0, 1, 2, ... 3.6.3

Esempio 3.6.3

Data la distribuzione riportata nella tabella seguente

Classi Frequenza

assoluta

-1 1 5

il terzo momento dall’origine corrisponde a

m3 ≈ (0×5+33×15+73×20)/40 = 18.625

Oltre ai momenti dall’origine, in statistica spesso si utilizzano anche i momenti centrali, il cui generico

elemento di ordine r, indicato con il simbolo rxm , o più brevemente rm se è chiaro che ci si riferisce

alla variabile X, assume la forma

rirrx xx

1, r = 0, 1, 2, ... 3.6.4

se i dati sono costituiti dalla sequenza di n osservazioni.

Per r = 0 il risultato è pari a uno, mentre per r = 1 si ottiene la media della variabile scarto, che è sempre

pari a zero.

Nel caso di una distribuzione di frequenza il momento centrale di ordine r corrisponde a

rjr fxcnxc

1, r = 0, 1, 2, ... 3.6.5

ed infine, per una distribuzione in classi, il valore approssimato del momento centrale di ordine r è dato

rjr fxcnxc

1, r = 0, 1, 2, ... 3.6.6

Il momento centrale di ordine r corrisponde alla media aritmetica delle potenze r-esime degli scarti dalla

media aritmetica della variabile

Esempio 3.6.4

Data la distribuzione riportata nella tabella dell’esempio 3.6.2, se ne calcoli il secondo momento centrale.

La media aritmetica è pari a

11103302201400 .....x

per cui il secondo momento centrale è

�̅�2 = (0 − 1.1)2 × 0.4 + (1 − 1.1)2 × 0.2 + (2 − 1.1)2 × 0.3 + (3 − 1.1)2 × 0.1 = 1.09

Proprietà

Considerata una variabile X il cui momento centrale di ordine r è dato da rxm , il momento centrale di

ordine r di una trasformazione lineare del tipo Y = a + bX corrisponde a rxr

ry mbm

Dimostrazione

Considerata una variabile X di media �̅� e momento r-esimo rxm , la variabile trasformata Y data dalla

3.5.1 ha una media pari alla trasformazione lineare della media della X, per cui il momento suo r-esimo

può essere scritto nella forma seguente

xbabxan

Questo risultato indica che i momenti di ordine r sono invarianti per cambiamenti dell’origine della scala

di misura, ma variano al variare dell’unità di misura.

I valori dei momenti centrali possono essere ricavati da quelli dei momenti dall'origine. Facendo

riferimento alla sequenza degli n valori originali, per esempio, si dimostra che il secondo momento

centrale risulta uguale a

mmxmxxmxn

e corrisponde quindi alla differenza fra il secondo momento dall'origine e la media al quadrato o, in altri

termini, alla media dei quadrati meno il quadrato della media.

Esempio 3.6.5

Data la distribuzione riportata nella tabella dell’esempio 3.6.2, se ne calcoli il secondo momento centrale mediante il

calcolo dei primi due momenti dall’origine.

Risulta

11103302201400 .....x

m2 = 0×0.4+1×0.2+4×0.3+9×0.1=2.3

da cui si ottiene infine

0911132 2222 ...xmm

Per quanto riguarda il terzo e il quarto momento centrale le relazioni con i momenti dall’origine sono invece

2121344

311233

mmmmmmm

I momenti centrali di ordine 2, 3 e 4, come si vedrà nel prossimo capitolo, forniscono alcune importanti

informazioni su diverse caratteristiche della distribuzione della variabile in esame.

Tutti i momenti esaminati rientrano nella cosiddetta famiglia dei momenti di ordine r da h, il cui generico termine

che indichiamo con il simbolo rh m , nel caso di una sequenza di n osservazioni assume la forma

rirh h

, r = 0, 1, 2, ...

da cui, per h = 0, si ottengono le espressioni dei momenti dall'origine, mentre per h = x si ottengono le espressioni

dei momenti centrali.

3. INDICI DI POSIZIONE - unisi.it · determinabili per una variabile di qualsiasi natura, e medie...

Documents