1
Elementi di Statistica descrittiva
Lez. 2 - Misure di tendenza centrale
- le Medie
- la Moda
- la Mediana____________________
Anno scolastico 2001/2002
Prof. Biasco
2
Valori MEDI (o indici di posizione)
Nello studio dei fenomeni collettivi è importante calcolare dei valori sintetici che siano rappresentativi dell’insieme dei dati, che diano una visione d’insiemevisione d’insieme del fenomeno.
Tali valori si dicono MEDIE
Si possono definire diversi tipi di medie, tra le più comuni si hanno: la media aritmetica, la mediana, la moda, la media geometrica, la media armonica, la media quadratica.
3
Esempio Si vogliono confrontare le stature di 3 gruppi:
• Un gruppo di bambini• Un gruppo di giocatori di pallacanestro• Un gruppo di clienti di un supermercato
4
Poligono di frequenza - Statura Bambini
5
810
15
30
20
10
20
5
10
15
20
25
30
35
146-
148
148-
150
150-
152
152-
154
154-
156
156-
158
158-
160
160-
162
freq
uenz
ePoligono di frequenza dei giocatori
5
12
2527
11 10
7
3
0
5
10
15
20
25
30
freq
uenz
e
Clienti di un supermercato
2
4
7
10
12
14 1413
10
8
5
10
2
4
6
8
10
12
14
16
158-
160
160-
162
162-
164
164-
166
166-
168
168-
170
170-
172
172-
174
174-
176
176-
178
178-
180
180-
182
freq
uenz
e
Poligoni di frequenza dei tre Poligoni di frequenza dei tre gruppigruppi
5
Elementi per cui le tre distribuzioni Elementi per cui le tre distribuzioni differisconodifferiscono
• Valore attorno al quale si distribuiscono i datiValore attorno al quale si distribuiscono i dati
• Diversa distribuzione dei dati attorno al centroDiversa distribuzione dei dati attorno al centro
• Presenza più o meno accentuata di code a destra Presenza più o meno accentuata di code a destra
o sinistrao sinistra
• Distribuzione più o meno appuntita.Distribuzione più o meno appuntita.
6
Confronto delle tre distribuzioniConfronto delle tre distribuzioni
Confronto tre distribuzioni
0
5
10
15
20
25
30
35
bambini
clienti supermercato
giocatori basket
7
Le misure che permettono di valutare Le misure che permettono di valutare sinteticamente tali caratteristiche sono:sinteticamente tali caratteristiche sono:
• Misure di tendenza centrale: MEDIEMisure di tendenza centrale: MEDIE
• Misure di variabilità o dispersioneMisure di variabilità o dispersione
• Misure di forma (asimmetria, curtosi)Misure di forma (asimmetria, curtosi)
• Misure di concentrazione.Misure di concentrazione.
8
Le misure di tendenza centrale possono essere distinte in due gruppi:
Media aritmeticaMedia geometricaMedia armonicaMedia quadratica
2° gruppoMedie lasche o di posizione
Moda
Mediana
1° gruppoMedie ferme o analitiche
9
Quali di queste è la Media “più giusta”?
Non esiste la “media migliore”, ma la media da utilizzare deve essere scelta in relazione al problema che si sta risolvendo.
La media più adatta, “più giusta”, va scelta a seconda dei DATI e degli SCOPI dell’elaborazione statistica.
10
La Media aritmetica(semplicemente Media)
La Media geometrica
La Media Armonica
La Media quadratica
La Moda
La Mediana
Noi vedremo le seguenti medie:
11
Partiamo da un esempio:
Esempio 1
Una società di ricerca statistica deve determinare la ricchezza degli abitanti di alcuni paesi al fine di decidere dove aprire alcuni punti vendita per una ditta operante nel settore commerciale.
I dati raccolti sono riportati nella seguente tabella
12
.
reddito in milioni freq. 1° paese freq. 2° paese
0 11 45 8 16
10 13 3415 24 4620 16 2430 32 1240 12 1050 4 4
totali 120 150
Esempio 1 - Tabella dei redditi rilevati
13
Diagramma delle frequenze
0
10
20
30
40
50
0 10 20 30 40 50 60
reddito (milioni)
freq
uenz
e
1° paese
2° paese
Esempio 1 - Diagramma delle frequenze dei redditi
14
Vogliamo calcolare dei valori numerici che siano indicativi del grado di ricchezza/povertà della popolazione del paese considerato.
Gli indici più utili potrebbero essere:
– il reddito medio
– il reddito più diffuso
– il reddito rispetto al quale la popolazione risulta divisa in due parti uguali.
15
La Media Aritmetica
La media aritmetica rappresenta il reddito che ogni abitante avrebbe se il reddito totale del paese venisse equamente suddiviso tra tutti gli abitanti
cioè nel caso in cui
1- ciascun abitante versa al sindaco tutto il suo reddito (reddito totale non cambia),
2- Il sindaco divide in parti uguali il reddito totale della città e lo ridistribuisce ai singoli cittadini.
16
Vediamo come calcolarlo.
Se x1, x2, … xn sono i redditi degli n abitanti
il Reddito medio (la MEDIA dei redditi) viene calcolata nel modo seguente:
1. Calcoliamo il reddito totale della popolazione:
n
i 1in21 xx...x x totaleReddito
17
2. Dividiamolo per il numero degli abitanti
nn
x...xx
n
in
1
i21
x
abitanti num.
totaleReddito capite pro Reddito
nn
x...xx
n
in
1
i21
xredditi dei Media medio Reddito
Quindi la media dei redditi è:
18
Tornando all’esempio 1
Reddito relativo al 1° paese.
milioni... 2490450131085110 totaleReddito
milmil
75,20120
2490 redditi dei Media
19
In generale,
se x1, x2, … xn sono n dati numerici,
la loro Media aritmetica (media aritmetica semplice) si ottiene sommando tutti i dati numerici e dividendo la somma per il numero dei dati:
i1 2 1
xMedia
n
n ix x ... xM x
n n
20
Dalla formula precedente avremo:
Nxxxx N ...21
21
In particolare se gli n dati numerici sono tali che:
il dato x1 compare f1 volte, x2 f2 volte,…. xk fk volte,
la Media Aritmetica (Media aritmetica ponderata) è data da:
n
f
f...ff
fx...fxfx
k
ii
k
kk
1i
21
2211
xM
22
Proprietà della media aritmetica
1. La media aritmetica è sempre compresa tra il valore minimo e il valore massimo
x min media xmax
2. La somma degli scarti dalla media è sempre zero
posto xi = xi – media = xi – M (scarto dalla media)
si ha che:
0xmedia dalla scarti Somma1
i
n
i
23
3. La somma dei quadrati degli scarti dalla media è
minore della somma dei quadrati degli scarti da qualsiasi altro valore numerico
Cioè se M è la media e A un qualsiasi altro numero allora
n
i
n
i
AM1
2i
1
2i xx
minimo valoreha x scarti Somma1
2i
2
n
i
M
24
La Media Geometrica
Def. Siano x1, x2, … xn gli n valori, tutti >0, assunti da una variabile numerica
La media geometrica G di questi valori è:
Vediamo qualche esempio:
1- Se x1 e x2 sono i due lati di un rettangolo, la media geometrica rappresenta il lato del quadrato equivalente al rettangolo.
nnxxxG .........21
25
x1
x2
G
G
G · G = x1 · x2
1- Se x1 e x2 sono i due lati di un rettangolo,
la media geometrica rappresenta il lato del quadrato
equivalente al rettangolo.
221 xxG
26
G · G · G = x1 · x2 · x3
Esempio 2
Se x1, x2. x3 sono i tre lati di un parallelepipedo rettangolo allora G è il lato di un cubo avente lo stesso volume.
3321 xxxG
27
• se gli n dati numerici positivi sono tali che: il dato x1 compare f1 volte, x2 f2 volte,…. xk fk volte,
la Media Geometrica è data da:
N fkk
ff xxxG ..........22
11
28
Esempio 3
Un capitale iniziale di 5.000 euro viene investito ad interesse composto. Sapendo che il tasso d’interesse il primo anno è del 2%, del 4% il secondo anno e del 6% il terzo anno, calcolare il tasso medio relativo ai tre anni.
C0 = 5000 capitale iniziale:
C1 = C0 + C0 *r1 = C0(1 + r1) = 5000(1 + r1) capitale alla fine del 1°anno
C2 = C1 + C1*r2 = C1(1 + r2) = C0(1 + r1)(1 + r2) capitale alla fine del 2° anno
C3 = C2 + C2*r3 = C2(1 + r3) = C0(1 + r1)(1 + r2) (1 + r3)
capitale alla fine del 3° anno
29
se indichiamo con r il tasso medio annuo costante deve risultare:
Per cui da C3 = C0(1 + r1)(1 + r2) (1 + r3)= C0(1 + r)3
C3 = C0(1 + r)3
quindi (1 + r)3 = 5622,24/5000 da cui
1 + r = 31,124 r 3,9 %
diversa dalla media aritmetica dei tassi = 4%
avremo che (1+r) è la media geometrica
(1 + r) = 3(1 + r1)(1 + r2) (1 + r3)
30
Esempio 4
Il numero di microrganismi di una certa coltura è aumentato da 2000 a 9000 in 3 giorni. Calcolare l’incremento medio giornaliero.
n0 = 2000 numero iniziale batteri:
n1 = n0 + n0 *r = n0(1 + r) = 2000(1 + r) batteri alla fine del 1°giorno
n2 = n1 + n1*r = n1(1 + r) = n0(1 + r)2= 2000(1 + r)2 batteri alla fine del 2° giorno
n3 = n2 + n2*r = n2(1 + r) = n0(1 + r)3 = 2000(1 + r)3
batteri alla fine del 3° giorno
31
Esempio 4
E poiché alla fine del 3° giorno ci sono 9000 batteri
2000(1 + r)3 = 9000
(1 + r)3 = 9000/2000
1 + r = 34,5 r = 65,1 %
32
La Media Armonica
Def. Siano x1, x2, … xn gli n valori, tutti >0, assunti da una variabile numerica
La media armonica H di questi valori è:
iNx
N
Nxxx
H111
...11
1
21
33
La Media Quadratica
Def. Siano x1, x2, … xn gli n valori assunti da una variabile numerica
La media quadratica Q di questi valori è:
N
xxxQ N
222
21 ...
34
La Moda (o valore modale)
La moda è uguale al dato che, nella distribuzione, compare con frequenza più elevata, cioè è il dato più rilevante, il dato più diffuso.
Nel caso dell’ Esempio 1 - 2° paese
Moda= = 15 milioni
infatti 15 milioni è il reddito più diffuso
Cioè il gruppo di abitanti con un reddito di 15 mil. è il più numeroso.
x)
x̂
35
Diagramma a colonne
4
16
34
46
24
12 104
05
101520253035404550
0 5 10 15 20 30 40 50
reddito (milioni)
freq
uenz
e
Moda = 15 mil.
L’ortogramma dei redditi del secondo paese mostra chiaramente
un valore modale
36
Osservazioni
La MODA è un valore medio interessante
Se la moda è un reddito basso allora c’è un gruppo consistente di cittadini poveri
Se la moda è un valore alto c’è un gruppo consistente di cittadini ricchi.
Se il reddito è legato al tipo di attività potrebbe indicare che in quel paese una certa attività è la più diffusa, o indicare il ceto sociale prevalente.
37
Esempio:
Se in 100 lanci di un dado otteniamo come valore modale “significativo” il numero 5 allora con molta probabilità il dado è truccato.
38
La MedianaLa Mediana è una media di posizione, è uguale al valore che si trova al centro di una distribuzione ordinata in modo crescente (o decrescente)
La Mediana divide i dati in due parti tali che : • il numero di osservazioni della Mediana
è uguale al• numero di osservazioni della Mediana
ˆx x%
x~
39
.
voti conseguiti freq. 1° prova freq. 2° prova
2 1 03 1 54 2 35 4 26 3 57 2 38 2 49 0 4
totali 15 26
Esempio 1 - Tabella dei voti
40
Esempio:
2 3 4 4 5 5 5 5 6 6 6 8 8 9 9
Mediana
2 3 4 4 5 5 5 5 6 6 6 8 8 9 9 9
Madiana = 5 + 6 = 5,5 2
41
Io sono il valore
MEDIANO
42
Fine lezione