Post on 01-May-2015
transcript
Stat 02 - 1 / 40
Lezione 5Strumenti statistici:
campioni e stimatori
Stat 02 - 2 / 40
Nella parte 1 ...
gli stimatoricampionari V = v ( X1, X2, …, Xn )
correttezza: VE
consistenza: 1lim
V-Vn
EP
efficienza:
2
11
2
22
21 /V-V
V-VVVEff
E
E
E
E
le strategie di campionamento:- sistematico,- stratificato,- per quote,- a grappolo
Stat 02 - 3 / 40
parte 2 gli stimatori:
- “media campionaria”
Stat 02 - 4 / 40
Richiami: statistiche e stimatori
• Si definisce “statistica” g ( X1, X2, X3, …, Xn ) una funzione di variabili casuali che non contiene parametri.
– Una statistica è a sua volta una variabile casuale.
• Si definiscono “stimatori” quelle statistiche che vengono usate per stimare un parametro o una sua funzione.
– I valori ottenuti mediante gli stimatori si dicono “stime” del parametro.
Stat 02 - 5 / 40
Principali statistiche:momento campionario di ordine 1
n
j
nj
n
j
pjp
XXn
M
p
Xn
M
1
11 1
1
1
• Fra i momenti campionari riveste particolare interesse quello di
ordine 1 ( p = 1 ). E’ chiamato “media campionaria” e coincide
con la media della X per il campione: per questo motivo lo
indicheremo con per richiamare il suo significato.nX
Stat 02 - 6 / 40
Proprietà della media campionaria
teorema 5.1:• estraendo da una popolazione per cui è definita la variabile
casuale X diversi campioni di n elementi a ciascuno dei quali
corrisponde un insieme di variabili casuali { X1, X2, …, Xn }
• posto:
si ha:
qualunque sia l’andamento della f (x)
e qualunque sia la distribuzione della media campionaria
n
XX nn
2
var;
E
nX
n
j
jn Xn
X1
1
Stat 02 - 7 / 40
Teorema limite centrale
teorema 5.2:
• Siano X1, X2, …, Xn variabili casuali indipendenti con la
medesima distribuzione con media e varianza 2 finite.
• Detta Sn = X1 + X2 + … + Xn la variabile casuale costituita
dalla loro somma,
• allora la corrispondente variabile standardizzata
• è asintoticamente normale dato che:
n
nSn
uu
bn
nSa
b
a
n
nd
2exp
2
1lim
2
P
Stat 02 - 8 / 40
Variabile standardizzata
• da una variabile casuale X con media e varianza 2 finita si ricava la corrispondente variabile standardizzata
Xstandardizzata
– sottraendo ad X la sua media – dividendo la differenza X - per il valore della
“deviazione standard” ( radice quadrata positiva della varianza )
X
X zatastandardiz
Stat 02 - 9 / 40
Teorema limite centrale
teorema 5.2:
• Siano X1, X2, …, Xn variabili casuali indipendenti con la
medesima distribuzione con media e varianza 2 finite.
• Detta Sn = X1 + X2 + … + Xn la variabile casuale costituita
dalla loro somma,
• allora la corrispondente variabile standardizzata
• è asintoticamente normale dato che:
n
nSn
uu
bn
nSa
b
a
n
nd
2exp
2
1lim
2
P
Stat 02 - 10 / 40
Proprietà della media campionaria
• Se dividiamo sia il numeratore sia il denominatore
della
per n otteniamo:
n
nSn
ricordando poi che:
Sn = X1 + X2 + … + Xn
otteniamo:
nn
nS
n
nSn
n
Stat 02 - 11 / 40
Proprietà della media campionaria
n
Xn
n
nn
S
n
nS
n
j
jn
n
1
1
Sn = X1 + X2 + … + Xn
n
Xn
n
jj
1
1Con cui si può affermare che
è asintoticamente normale.
Stat 02 - 12 / 40
Proprietà della media campionaria
• se X1, X2, …, Xn anziché variabili casuali indipendenti
definite per popolazioni diverse, ancorché con la medesima distribuzione e con
media e varianza 2 finite,sono variabili casuali indipendenti definite per la stessa popolazione (con media
e varianza 2 finita) che corrispondono ad un campione di n elementi
• allora possiamo scrivere anche:
n
X
n
Xn
n
nS n
n
j
j
n
1
1
Stat 02 - 13 / 40
Proprietà della media campionaria
• questo ci permette di affermare che anche la variabile (standardizzata)
è asintoticamente normale dato che è possibile scrivere:
n
X n
u
ub
n
nSa
n
nS
n
X
b
a
n
n
nn
d2
exp2
1lim
2
P
Stat 02 - 14 / 40
Proprietà della media campionaria
Variabile standardizzata:si era scritto che:
• da una variabile casuale X con media e varianza 2 finita si ricava la corrispondente variabile standardizzata
Xstandardizzata
– sottraendo ad X la media – dividendo la differenza X - per il valore della
“deviazione standard” , ( radice quadrata positiva della varianza )
X
X zatastandardiz
Stat 02 - 15 / 40
Proprietà della media campionaria
dato che la variabile standardizzata
è asintoticamente normale si può affermare che, per n che tende all’infinito, la variabile casuale
ha distribuzione normale,
X
X zatastandardiz
n
X n
n
j
jn Xn
X1
1
n
XX nn
2
var;
E
Stat 02 - 16 / 40
Distribuzione della media campionaria
teorema 5.3:• Sia data una popolazione infinita per cui è stata definita la
variabile casuale X avente densità f (x) , media finita e varianza 2 finita.
• Detta: la media della X per un campione casuale di
dimensione n estratto da essa,
• allora, al tendere di n ad infinito,
la media campionaria
- segue una distribuzione normale
- con media e varianza 2 / n .
nX
n
j
jn Xn
X1
1
Stat 02 - 17 / 40
considerazioni
• Il teorema 5.3 non fa alcuna considerazione sulla distribuzione
della X, ma richiede solamente che media e varianza 2 siano finite.
• La possibilità di costruire un campione di dimensione n che tende all’infinito è ovviamente solo teorica, ma l’enunciato del teorema deve essere inteso nel senso che:– quanto più il campione è numeroso,– tanto meglio la distribuzione della media campionaria
approssima una distribuzione normale con media e
varianza 2 / n.
Stat 02 - 18 / 40
Distribuzione della media campionaria
n
j
jn Xn
X1
1
)(xf
Stat 02 - 19 / 40
Proprietà della media campionaria
conseguenze 1) e 2) del teorema 5.3 enunciato:
1) la distribuzione della media campionaria ha media coincidente
con la media della X relativa alla popolazione da cui proviene il campione
pertanto
la media campionaria è uno stimatore corretto
della media della X per l’intera popolazione.
nXE
Stat 02 - 20 / 40
Proprietà della media campionaria
conseguenze 1) e 2) del teorema 5.3 enunciato:
2) nel caso di popolazioni infinite o di campionamento con ripetizione la distribuzione della media campionaria ha una varianza che, risultando inversamente proporzionale al numero degli elementi che costituiscono il campione,
tende a 0 per n che tende all’infinito
pertanto
la media campionaria è uno stimatore consistente
della media della X per l’intera popolazione.
n
X n
2
var
Stat 02 - 21 / 40
Proprietà della media campionaria
corollario:
la distribuzione della media campionaria presenta una dispersione attorno al proprio valore medio che, espressa in termini di “deviazione standard ”, risulta inversamente proporzionale alla radice quadrata del numero degli elementi che costituiscono il campione.
Possiamo anche notare che ad un aumento di quattro volte della dimensione del campione corrisponde solamente un dimezzamento della deviazione standard della nuova distribuzione della media campionaria.
n
X n
2
var
Stat 02 - 22 / 40
Proprietà della media campionaria
teorema 5.4:• dato un campione di n elementi prelevato senza ripetizione da una
popolazione composta da N elementi per cui è definita la variabile casuale X, posto:
• si ha:
1
var2
N
nN
nX n
n
j
jn Xn
X1
1
80,01100
500;99,0
1100
10000
N
nNn
N
N
nNn
N
Stat 02 - 23 / 40
Distribuzione della media campionaria
Avevamo affermato che:• estraendo da una popolazione per cui è definita la variabile
casuale X diversi campioni di n elementi a ciascuno dei quali corrisponde un insieme di variabili casuali { X1, X2, …, Xn }
posto:
al tendere di n ad infinito si ha:
qualunque sia l’andamento della f (x) e qualunque sia la distribuzione della media campionaria .
• Ma qual è la distribuzione della media campionaria ?
n
XX nn
2
var;
E
nX
n
j
jn Xn
X1
1
Stat 02 - 24 / 40
Distribuzione della media campionaria
“… allora, al tendere di n ad infinito, la media campionaria segue una distribuzione normale
con media e varianza 2 / n …” :
2
σ
μ
2
1exp
σπ2
1
X
X
X
X
xxf
2
2
1exp
2
1
n
X
n
Xf nn
distribuzione normale
Stat 02 - 25 / 40
gli stimatori:- “varianza campionaria”
Stat 02 - 26 / 40
Principali statistiche: momento campionario rispetto a .nX
2
1
2
2
1SXX
nM
n
j
nj
nX
• Il momento campionario di ordine 2 rispetto a definisce la varianza campionaria S
2,
il cui valore coincide con la varianza della X nel campione:
definizione 5.3:• estraendo da una popolazione per cui è definita la variabile
casuale X un campione di n elementi a cui corrisponde
l’insieme di variabili casuali { X1, X2, …, Xn } si chiama
“momento campionario di ordine p rispetto a ” la statistica:
nX
n
j
p
njp XXn
M1
1
Stat 02 - 27 / 40
Varianza campionaria S 2
La varianza campionaria S 2 può essere usata come stimatore
della varianza 2 della X relativa all’intera popolazione?
n
j
nj XXn
S1
22 1
N
j
XjxN
1
22 1?correttezza degli
stimatori campionari VE
consistenza degli stimatori campionari
1lim
V-Vn
EP
Stat 02 - 28 / 40
La dimostrazione di tale affermazione ci consentirà di individuare
uno stimatore campionario corretto della varianza 2.
Varianza campionaria S 2
E’ possibile dimostrare che
pertanto la varianza campionaria S 2 non è uno stimatore corretto
della varianza della X relativa all’intera popolazione!!!
22 SE
Stat 02 - 29 / 40
2222 nnjjnj XXXXXX
Varianza campionaria S 2
dimostrazione:
22 SE
2222 njnjnj XXXXXX
μμμμ
1
1
22
njnjnj
n
jnj
XXXXXX
XXn
S
se scriviamo:
allora:
Stat 02 - 30 / 40
da cui si ricava, passando alle sommatorie:
Varianza campionaria S 2
2222 njnjnj XXXXXX
n
j
n
j
njn
n
j
j
n
j
nj
XXX
XXX
1 1
2
1
2
1
2
2
Stat 02 - 31 / 40
Varianza campionaria S 2
n
j
n
jnjn
n
jj
n
jnj
XXX
XXX
1 1
2
1
2
1
2
2
n
jnn
n
jj
n
jnj
XXn
XXX
1
22
1
2
1
2
2
da cui:
n
n
j
j XnX1
notiamo che:
Stat 02 - 32 / 40
Varianza campionaria S 2
2
1
2
n
n
jn XnX
notiamo poi che:
n
jnn
n
jj
n
jnj
XXn
XXX
1
22
1
2
1
2
2
da cui:
2
1
2
1
2
n
n
j
j
n
j
nj XnXXX
Stat 02 - 33 / 40
Dividendo ambo i membri per n si può scrivere:
Varianza campionaria S 2
2
1
2
1
2
n
n
j
j
n
j
nj XnXXX
2
1
2
1
2 11
n
n
jj
n
jnj X
n
nX
nXX
n
e, passando ai valori medi in ambo i membri:
2
1
2
1
2 11
n
n
jj
n
jnj XX
nXX
nEEE
Stat 02 - 34 / 40
Varianza campionaria S 2
2
1
2
1
2 11
n
n
jj
n
jnj XX
nXX
nEEE
la variabile casuale X ha media e varianza 2 pertanto, per n che tende all’infinito, si può scrivere:
2
1
2 var1
XXn
n
jj
2
1
21
n
jjX
nE
da cui:
22
1
21
n
n
jnj XXX
nEE
Stat 02 - 35 / 40
Varianza campionaria S 2
22
1
21
n
n
jnj XXX
nEE
per n che tende all’infinito, la variabile casuale media campionaria
ha distribuzione normale,
n
j
jn Xn
X1
1
nXX nn
2
var;
E
pertanto:
n
Xn
Xn
jnn
2
1
22 1
E
nXX
n
n
jnj
22
1
21E
Stat 02 - 36 / 40
Varianza campionaria S 2
raccogliendo al secondo membro, si ottiene:
nXX
n
n
jnj
22
1
21E
2
1
2 11
n
nXX
n
n
jnjE
da cui si conclude che:
2
1
21
n
jnj XX
nE
Stat 02 - 37 / 40
Varianza campionaria S 2
E’ stato possibile dimostrare che
pertanto la varianza campionaria S 2 non è uno stimatore corretto
della varianza 2 !!!
22 SE
Come stimatore della varianza 2 si può usare la “varianza campionaria corretta” Sn
2
che, come ora è facile mostrare, è uno stimatore corretto.
22
2
11S
n
nM
n
nSn
Stat 02 - 38 / 40
Nel caso della varianza campionaria S 2 si era concluso che:
Varianza campionaria corretta Sn 2
è sufficiente moltiplicare ambo i membri per n / ( n -1 ) per ottenere:
2
1
2 11
n
nXX
n
n
j
njE
2
1
2 1
1
1
1
n
n
n
nXX
nn
n n
j
njE
22
1
2
1
1
n
n
j
nj SXXn
EE
da cui:
Stat 02 - 39 / 40
La prossima volta…
Lo stimatore “varianza campionaria corretta” e la sua distribuzione