Date post: | 01-May-2015 |
Category: |
Documents |
Upload: | malvolia-di-giacomo |
View: | 215 times |
Download: | 0 times |
Test di ipotesiX variabile casuale con funzione di densità (probabilità) f(x; ) parametro incognito. Test Statistico: regola che sulla base di un campione di numerosità n (X1, …,Xn) consente di decidere tra due ipotesi sul valore di Il campione è una variabile casuale n-pla a componenti indipendenti e identicamente distribuite come X.
: ipotesi nulla (0 1 = : ipotesi alternativa (0 1 =
La regola consiste nel determinare una partizione dello spazio dei campioni in due sottoinsiemi A (regione di accettazione) e R (regione di rifiuto) tale che se il campione (X 1, …,Xn) A si accetta , se il campione (X1, …,Xn) R si accetta (si rifiuta ). La partizione dello spazio dei campioni è spesso determinata sulla base di una funzione del campione t(X1, …,Xn) detta statistica-test.
vera veraaccetto errore seconda specie rifiuto errore prima specie
probabilità di commettere un errore prima specie (ampiezza del test)probabilità di commettere un errore seconda specie (1- ) potenza del test
Test di ipotesi
Probabilità di errore
vera vera
accetto
rifiuto
Si fissa un valore per la probabilità di commettere un errore di prima specie . Il test migliore minimizza la probabilità di commettere un errore di seconda specie
Il test di ipotesi sul valor medio consiste nel determinare un insieme di valori della media campionaria (statistica-test) che conducono a rifiutare l’ipotesi nulla e un insieme di valori della media campionaria che conducono ad accettare l’ipotesi nulla.
x
Ipotesi
Un’ipotesi può essere:
• semplice, quando specifica un singolo valore per il parametro incognito sia per che per
• composta, specifica un intervallo di valori per il parametro incognito
Sia allora è un’ipotesi semplice, mentre è un’ipotesi composta.
Un’ipotesi composta può essere:
• unidirezionale, specifica valori del parametro in una sola direzione
• bidirezionale, quando specifica intervalli di valori in più direzioni
)16 ,(~ 2 NX 50 :H
50 :H
50 :H 50 :H è unidirezionale, mentre bidirezionale.
Test di ipotesi sul valor medioX variabile casuale con valore medio E(X)= incognito e varianza nota Var(X)= 2=225. Verificare le seguenti ipotesi sul valore medio di X:
H0: =40=
H1: =45=
=0.05campione di numerosità n=36:
18 58 64 35 54 50 42 26 66 53 47 40 60 32 52 27 52 62 38 44 19 45 54 43 27 23 82 74 78 36 37 34 48 39 41 57
40 45 x
),()( 2Nxf
H0 H1
0= = 1
Test di ipotesi sul valor medio
Pr( 40/*xx)=Pr(n
x)(>n
x)(*/=40) =Pr(Z>
36225
)40(*x)=Pr(Z>z1-)=0.05
z 1 - = 1 . 6 4 5
nzx
10*
R :
36225
)40( x> 1 . 6 4 5 e q u i v a l e n t e R : 1.44
36
225645.140* xx
A :
36225
)40( x< 1 . 6 4 5 e q u i v a l e n t e A : 1.44
36
225645.140* xx
40 45
x
),()(2
nNxf
H0 H1
zona di accettazione di H0
zona di rifiuto di H0
44.1
1.4436
225645.140 x
1.4436
225645.140 x
0= = 1*x
appartiene alla zona di Rifiuto di H002.46x
02.46
livello di significatività osservato <
0 2 z
)1,0()( Nzf
zona di accettazione di H0
zona di rifiuto di H0
1.6450= = 1*z
645.1
36225
)40(
x
645.1
36225
)40(
x
H0 H1
appartiene alla zona di Rifiuto di H04.236/225/)4002.46(
40 45
x
H0 H1
zona di accettazione di H0
zona di rifiuto di H0
44.10= = 1
= Pr(Accettare H0/ H0 falsa (o H1 vera))=
Pr( 45/1.44 x )=Pr(
n
x)(<
n
)1.44( /=45)=Pr(Z<
36225
)451.44( )
=Pr(Z<-0.36)=0.3594 1- =1-0.3594=0.6406 potenza del test
Potenza del test
Funzione di potenza
Si chiama funzione di potenza del test la funzione che descrive la
probabilità, al variare di , di rifiutare e viene indicata con 0H
Se l’ipotesi alternativa è composta la potenza del test è una funzione
Funzione di potenza
edicrescentefunzione
n
zF
n
zF
n
z
n
xP
nzxP
)(1)(1
)()()/()(
0
1
0
1
0
110
H0: =0
H1: >0
n numerosità campionaria, ampiezza del test
()1
()
()
Test del rapporto delle massime verosimiglianzeUn test con livello di significatività pari a e una funzione di potenza è detto uniformemente più potente a livello se:
per ogni altro test con uguale livello di significatività e funzione di potenza .
1 ,
Test uniformemente più potenti possono essere individuati mediante l’approccio basato sul rapporto delle massime verosimiglianze.
Dato un problema di verifica d’ipotesi: la statistica rapporto delle massime verosimiglianze è:
è la stima di massima verosimiglianza di con il vincolo è la stima di massima verosimiglianza non vincolata.
contro 1100 :H:H
)(
)(
L
L
XXXL
XXXLXXX
n
n
n
0
21
21
21
ˆ
;...,,max
;...,,max...,, 0
0̂ 0̂
R={(X1, X2,.,Xn) tali che (X1, X2,.,Xn) k} A={(X1, X2,.,Xn) tali che (X1, X2,.,Xn) >k} k tale che l’ampiezza del test sia
Test di ipotesi sul valor medioX variabile casuale con valore medio E(X)= incognito e varianza Var(X)= 2=225.
H0: =40=
H1: =35=
=0.05campione di numerosità n=36:
18 58 64 35 54 50 42 26 66 53 47 40 60 32 52 27 52 62 38 44 19 45 54 43 27 23 82 74 78 36 37 34 48 39 41 57
02.46x
35 40
x
),()(2
nNxf
H1 H0
zona di rifiuto di H0
zona di accettazione di H0
35.9
9.3536
225645.140 x
9.3536
225645.140 x
1= = 0*x
appartiene alla zona di Accettazione di H002.46x
Test di ipotesi sul valor medio
X variabile casuale con valore medio E(X)= incognito e varianza Var(X)= 2=225.
H0: =40=
H1: 40
=0.1
campione di numerosità n=36:
18 58 64 35 54 50 42 26 66 53 47 40 60 32 52 27 52 62 38 44 19 45 54 43 27 23 82 74 78 36 37 34 48 39 41 57
02.46x
35.9 40 44.01
H1 H0 H1
zona di rifiuto di H0 zona di rifiuto di H0
1.4436
225645.140 x9.35
36
225645.140 x
0=
appartiene alla zona di Rifiuto di H002.46x
zona di accettazione di H0
1.449.35 x
Test di ipotesi sul valor medio di una variabile aleatoria di Bernoulli
X variabile casuale con valore medio E(X)= incognito e varianza Var(X)= .
H0: = H1: > oppure <oppure
1. Test basato su Z Normale standardizzata:
Z=
n
x
)1(
)(
(n>30)
Un intervento di manutenzione effettuata su 100 componenti è risultato efficace su 25. Verificare l’ipotesi che la probabilità di efficacia sia 0.18 con una probabilità di errore di primo tipo =0.05.
H0: =0.18 H1: 0.18
x =0.25 2 =(0.18*0.82)/100 z0.025=1.96 R={ x tali che ( x -0.18)/(0.18*0.82)/100> 1.96} R={ x tali che ( x -0.18)/(0.18*0.82)/100< -1.96} A= R={ x tali che –1.96<( x -0.18)/(0.18*0.82)/100< 1.96} 1. Poiché (0.25-0.18)/(0.18*0.82)/100=1.72, l’ipotesi nulla è accettata.
Test di ipotesi sul confronto tra 2 valori medi: campioni indipendenti
X1 variabile casuale con valore medio E(X1)= incognito e varianza nota Var(X)=
2.
X2 variabile casuale con valore medio E(X2)= incognito e varianza nota Var(X)=
2.
campione di numerosità n1 di X1
campione di numerosità n2 di X2
H0: =
H1: >(<, )
=0.05
1x
2x
x
),()( 2Nxf
2 1
),()(2
nNxf
2 1 x
),()(2
2
2
1
2
1
2121 nnNxxf
21 xx
zona di accettazione di H0
zona di rifiuto di H0
2
22
1
21
21 96.1nn
xx
*21 )( xx
2
2
2
1
2
1
2196.1
nnxx
H0 H1
Le valutazioni di un indice di affidabilità effettuate su due distinti ed indipendenti gruppi di prodotti hanno fornito i seguenti risultati: gruppo I: 12 15 20 20 25 18 16 14 24 26 25 25gruppo II: 10 14 15 17 12 20 16 10 12 8 I=20 s2I=22.66 II=13.4 s2II=12.24
Verificare l’ipotesi che il valor medio dell’indice di affidabilità nel gruppo I è significativamente superiore rispetto a quello del gruppo II con probabilità di errore di primo tipo =0.025 (varianze incognite e uguali). H0: III=0H1: III>0
I=20 s2I=22.66 II=13.4 s2II=12.24 t20,0.025=2.086 s2=[(12*22.66)+10*12.24)/20]=20.2s2*(1/12+1/10)=4.45* (1/12+1/10)=1.91 R={ tali che I- II/1.91> 2.086} A={ tali che I- II /1.91 2.086}
Poiché (20-13.4)/1.91=3.46, l’ipotesi nulla è rifiutata.
x
x
x
x
x x
x
x xx
Test di ipotesi sul confronto tra 2 valori medi: campioni appaiati
X1 variabile casuale Normale con valore medio E(X1)= incognito e varianza Var(X1)=
2.
X2 variabile casuale Normale con valore medio E(X2)= incognito e varianza Var(X2)=
2.
H0: = (H0: d=con d=X1-X2)
H1: > oppure < oppure (d>d< d
test basato su t di Student di parametro n-1:
(x11,….,x1n) campione di ampiezza n generato da X1
(x21,….,x2n) campione di ampiezza n generato da X2
1
ˆ
n
sd
n
sd
dd
1)( ntdf
d
zona di accettazione di H0
zona di rifiuto di H0
n
std d
n
2
,1
ˆ
*d
n
std d
n
2
,1
ˆ
H0 H1
I seguenti dati rappresentano gli errori commessi da 8 lettori ottici, in due prove distinte, prima e dopo l’inserimento di un dispositivo: Prima: 6 7 12 12 11 10 16 9Dopo: 4 6 9 12 10 9 15 8 Verificare l’ipotesi che che il dispositivo abbia migliorato in modo significativo le prestazioni del lettore con una probabilità di errore di primo tipo =0.01. H0: d=con d=Xprima-Xdopo
H1: d>Prima: 6 7 12 12 11 10 16 9Dopo: 4 6 9 12 10 9 15 8d=P-D 2 1 3 0 1 1 1 1
d=10/8=1.25 sd=0.83 t7,0.01=2.99 R={ tali che ( d-0)/( sd /n-1)> 2.99}
A={ tali che ( d-0)/( sd /n-1< 2.99} Poiché (1.25-0)/(0.83/7)=3.99, l’ipotesi nulla è rifiutata.
x
x
xx
Test di ipotesi sul valor medio (ANOVA). Caso di k>2 campioni indipendenti: Analisi della Varianza ad 1 fattore
X1 variabile casuale Normale con valore medio E(X1)= incognito e varianza
Var(X1)= 2.
X2 variabile casuale Normale con valore medio E(X2)= incognito e varianza
Var(X2)= 2.
X3 variabile casuale Normale con valore medio E(X3)= incognito e varianza
Var(X3)= 2.
H0: =H1: almeno due medie diverse
H0: =H1: almeno due medie diverseTest basato su F di Fisher:
(x11,….,x1n1) campione di ampiezza n1 generato da X1
(x21,….,x2n2) campione di ampiezza n2 generato da X2
(x31,….,x3n3) campione di ampiezza n3 generato da X3
media campionaria del campione generato da X1
varianza campionaria del campione generato da X1
)/(var
)1/(var
)/(][
)1/(])()()([233
222
211
233
222
211
kngruppiientroianza
kgruppiifraianza
knsnsnsn
kxxnxxnxxn
1
11
11
1 n
iix
nx
21
11
1
21 )(
1 1
xxn
sn
ii
Fk-1, n-k= F3-1, n-3=
Test di ipotesi sul valor medio (ANOVA). Caso di k>2 campioni indipendenti: Analisi della Varianza ad 1 fattore
4
3
1
1 2 3
5
2
6
7
3.9*
*
*
*
*
*
*
*
*
*
*
*
4
3
1
1 2 3
5
2
6
7
3.9*
*
*
*
*
*
*
*
*
*
*
*
ANOVA
processo 1 processo 2 processo 3
6 2 2 5 4 4 7 3 2 6 2 3 4 4 4 6 5 1
VARIABILE tempo di vita di un circuito
H0: =H1: almeno due medie diverse 1=5.7 2=3.3 3=2.7 =3.9 s21=0.9 s22=1.22 s23=1.22
F2,15,0.01=6.36 n1=n2=n3=6 n=18 k=3 1. F=11.2>6.36 =F2,15,0.01 si rifiuta l’ipotesi nulla.
2. La media della variabile è maggiore nel gruppo 13. La distribuzione della variabile deve essere ipotizzata normale.4. Omoschedasticità
xxxx
ANOVA
29,778 2 14,889 11,167 ,001
20,000 15 1,333
49,778 17
Fra gruppi
Entro gruppi
Totale
Somma deiquadrati df
Media deiquadrati F Sig.
GRUPPI
3,002,001,00
Med
ia d
ella
VA
RIA
BIL
E N
EI G
RU
PP
I
6,0
5,5
5,0
4,5
4,0
3,5
3,0
2,50,00
0,05
0,10
0,0 6.36 11.2
F2,15
Accetto H0 Rifiuto H0
H0
Test di indipendenza H0: X e Y indipendenti nij = ni0 n0j / n i=1,.., r ; j=1,.., s
H1: X e Y non indipendenti almeno un nij ni0 n0j / n
X/Y y1 … yj … ys distr. marginale
di X
x1 n11 … n1j … n1s
… … … … … … …
xi ni1
… nij … nis
… … … … … … …
xr nr1 … nrj … nrs
distr. marginale
di Y
…
…
n
s
jjnn
1110
s
jiji nn
10
s
jrjr nn
10
r
iinn
1101
r
iijj nn
10
r
iiss nn
10
r
i
s
j ji
jiij
n
nnn
nnn
1 1 00
200
2)(
}{ 2),1(),1(
2 sr
Test chi quadro basato su:
Rifiuto
Con riferimento alla seguente distribuzione di un collettivo di individui secondo il sesso (X) e l’opinione sulla liberalizzazione dei servizi di telecomunicazioni TLC (Y), eseguire il test chi quadrato (2) con una probabilità di errore di primo tipo =0.05, commentare il risultato (relazione tra sesso e opinione sulla liberalizzazione dei servizi di telecomunicazioni: quali modalità si attraggono e quali si respingono). Ridistribuire le frequenze in modo da avere massima dipendenza tra le variabili.
a favore contrari indecisi
femmine 2 8 1maschi 8 1 2
H0: sesso e opinione liberalizzazione servizi TLC indipendentiH1: sesso e opinione liberalizzazione servizi TLC dipendenti2
(2-1)*(3-1),0.05=5.991 R={2 > 5.991}A={2 < 5.991} 2 =9.378> 5.991. Si rifiuta l’ipotesi nulla.
0,00
0,05
0,10
0,0
Accetto H0 Rifiuto H0
5.991 9.378
2 8 1 11
5,0 4,5 1,5 11,0
-3,0 3,5 -,5
8 1 2 11
5,0 4,5 1,5 11,0
3,0 -3,5 ,5
10 9 3 22
10,0 9,0 3,0 22,0
Conteggio
Conteggio atteso
Residui
Conteggio
Conteggio atteso
Residui
Conteggio
Conteggio atteso
femmina
maschio
sesso
Totale
a favore contrari indecisi Totale
H0
Test di correlazione
Si consideri una v.c. doppia (X,Y) di cui si osserva un campione di numerosità n. Ogni osservazione è costituita da una coppia (Xi,Yi) (i=1,..n) e pertanto l’intero campione sarà costituito dalle n coppie di v.c.
(X1,Y1),… (Xn,Yn).Si suppone che vi sia indipendenza tra le osservazioni campionarie, cioè tra le coppie di
v.c. relative a osservazioni differenti, mentre ovviamente le due v.c. (X i,Yi) (i=1,..n) non sono in generale
indipendenti poiché tra esse intercorre la stessa relazione che vi è tra X e Y.
Il coefficiente di correlazione campionario è dato dalla: dove la quantità: è la covarianza campionaria tra le v.c. X e Y, mentre le: sono le varianze campionarie corrette della varianza di X e della varianza di Y
yx
xy
yx
n
iii
SS
S
SS
yyxx
nr
ˆˆ
ˆ
ˆˆ
))((
1
1 1
n
iiixy yyxx
nS
1
))((1
1ˆ
n
iiy
n
iix yy
nSxx
nS
1
22
1
22 )(1
1)(
1
1
Se =0, ossia le componenti la v.c. normale doppia (X,Y) sono indipendenti, si può provare che:
ha esattamente distribuzione t di Student con (n-2) gradi di libertà. Se 0 si può operare con una trasformazione di variable (“trasformata z di Fisher”):
21 2
nr
rt
r
rZ
1
1ln
2
1
che ha distribuzione approssimativamente Normale con media e varianza date da:
xy
xyZ
1
1ln
2
1
3
1
nZ
Test di correlazione
Campione di numerosità n=8 generato da una v.a. (X,Y) normale doppia:
0
1
2
3
4
5
0 1 2 3 4X
Y
(0.68, 2.7), (1.73, 3.51), (1.51, 3.62), (2.67, 4.51), (1.32, 3.28), (0.52, 2.71), (1.71, 3.95), (0.83, 3.01).
Si supponga di voler verificare ad un livello di significatività 0.05 le ipotesi seguenti: H0: =0
H1: 0
La regione di accettazione è data da (t6, 0.025 =2.447)
A: -2.447 2.447
Il coefficiente di correlazione campionario r vale 0.97. Si rifiuta l’ipotesi nulla. Tra X e Y esiste una significativa correlazione positiva.
281 2
r
r -2.447 0 2.447
f(t, n-2)
H0
Campione di numerosità n=8 generato da una v.a. (X,Y) normale doppia:
0
1
2
3
4
5
0 1 2 3 4X
Y
(0.68, 2.7), (1.73, 3.51), (1.51, 3.62), (2.67, 4.51), (1.32, 3.28), (0.52, 2.71), (1.71, 3.95), (0.83, 3.01).
Si supponga ora di voler verificare ad un livello di significatività 0.05 le ipotesi seguenti: H0: =0.5
H1: 0.5
La regione di accettazione è data da (z1-0.025 =1.96)
A: -1.96 1.96
Il coefficiente di correlazione campionario r vale 0.97. Si rifiuta l’ipotesi nulla. Tra X e Y esiste una significativa correlazione superiore a 0.5.
z
zZ
97.01
97.01ln
2
1
Z5.01
5.01ln
2
1
z38
1
z
-1.96 0 1.96
f(Z)H0
Test per la verifica di ipotesi sul modello distributivo
H0: p(xi) = ni/ n i=1,.., r H1: per almeno un ‘i’ p(xi) ni/ n
X p(x) x1 p(x1) … … xi p(xi)
… … xr p(xr)
1
X frequenza x1 n1 … … xi ni
… … xr nr
n Test chi quadrato basato su:
r
i i
ii
xpn
xpnn
1
22
)(
))((
Rifiuto {2
),1(2
r }
Si ritiene che in una certa popolazione la variabile X sia Normale con =174 e varianza 2 =16 .
Verificare l’ipotesi con il test 2 con =0.01 sulla base dei seguenti dati:
X frequenza frequenza
osservata attesa
1 165 7 0.012
165-170 51 0.146
170-175 190 0.440
175-180 124 0.334
180 28 0.068
2 =3.77< 201.0,4 =13.227. L’ipotesi nulla non viene rifiutata.