Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; ) parametro...

Test di ipotesiX variabile casuale con funzione di densità (probabilità) f(x; ) parametro incognito. Test Statistico: regola che sulla base di un campione di numerosità n (X1, …,Xn) consente di decidere tra due ipotesi sul valore di Il campione è una variabile casuale n-pla a componenti indipendenti e identicamente distribuite come X.

: ipotesi nulla (0 1 = : ipotesi alternativa (0 1 =

La regola consiste nel determinare una partizione dello spazio dei campioni in due sottoinsiemi A (regione di accettazione) e R (regione di rifiuto) tale che se il campione (X 1, …,Xn) A si accetta , se il campione (X1, …,Xn) R si accetta (si rifiuta ). La partizione dello spazio dei campioni è spesso determinata sulla base di una funzione del campione t(X1, …,Xn) detta statistica-test.

vera veraaccetto errore seconda specie rifiuto errore prima specie

probabilità di commettere un errore prima specie (ampiezza del test)probabilità di commettere un errore seconda specie (1- ) potenza del test

Test di ipotesi

Probabilità di errore

vera vera

accetto

rifiuto

Si fissa un valore per la probabilità di commettere un errore di prima specie . Il test migliore minimizza la probabilità di commettere un errore di seconda specie

Il test di ipotesi sul valor medio consiste nel determinare un insieme di valori della media campionaria (statistica-test) che conducono a rifiutare l’ipotesi nulla e un insieme di valori della media campionaria che conducono ad accettare l’ipotesi nulla.

x

Ipotesi

Un’ipotesi può essere:

• semplice, quando specifica un singolo valore per il parametro incognito sia per che per

• composta, specifica un intervallo di valori per il parametro incognito

Sia allora è un’ipotesi semplice, mentre è un’ipotesi composta.

Un’ipotesi composta può essere:

• unidirezionale, specifica valori del parametro in una sola direzione

• bidirezionale, quando specifica intervalli di valori in più direzioni

)16 ,(~ 2 NX 50 :H

50 :H

50 :H 50 :H è unidirezionale, mentre bidirezionale.

Test di ipotesi sul valor medioX variabile casuale con valore medio E(X)= incognito e varianza nota Var(X)= 2=225. Verificare le seguenti ipotesi sul valore medio di X:

H0: =40=

H1: =45=

=0.05campione di numerosità n=36:

18 58 64 35 54 50 42 26 66 53 47 40 60 32 52 27 52 62 38 44 19 45 54 43 27 23 82 74 78 36 37 34 48 39 41 57

40 45 x

),()( 2Nxf

H0 H1

0= = 1

Test di ipotesi sul valor medio

Pr( 40/*xx)=Pr(n

x)(>n

x)(*/=40) =Pr(Z>

36225

)40(*x)=Pr(Z>z1-)=0.05

z 1 - = 1 . 6 4 5

nzx

10*

R :

36225

)40( x> 1 . 6 4 5 e q u i v a l e n t e R : 1.44

36

225645.140* xx

A :

36225

)40( x< 1 . 6 4 5 e q u i v a l e n t e A : 1.44

36

225645.140* xx

40 45

x

),()(2

nNxf

H0 H1

zona di accettazione di H0

zona di rifiuto di H0

44.1

1.4436

225645.140 x

1.4436

225645.140 x

0= = 1*x

appartiene alla zona di Rifiuto di H002.46x

02.46

livello di significatività osservato <

0 2 z

)1,0()( Nzf



1.6450= = 1*z

645.1

36225

)40(

x

645.1

36225

)40(

x

H0 H1

appartiene alla zona di Rifiuto di H04.236/225/)4002.46(

40 45

x

H0 H1



44.10= = 1

= Pr(Accettare H0/ H0 falsa (o H1 vera))=

Pr( 45/1.44 x )=Pr(

n

x)(<

n

)1.44( /=45)=Pr(Z<

36225

)451.44( )

=Pr(Z<-0.36)=0.3594 1- =1-0.3594=0.6406 potenza del test

Potenza del test

Funzione di potenza

Si chiama funzione di potenza del test la funzione che descrive la

probabilità, al variare di , di rifiutare e viene indicata con 0H

Se l’ipotesi alternativa è composta la potenza del test è una funzione

Funzione di potenza

edicrescentefunzione

n

zF

n

zF

n

z

n

xP

nzxP

)(1)(1

)()()/()(

0

1

0

1

0

110

H0: =0

H1: >0

n numerosità campionaria, ampiezza del test

()1

()

()

Test del rapporto delle massime verosimiglianzeUn test con livello di significatività pari a e una funzione di potenza è detto uniformemente più potente a livello se:

per ogni altro test con uguale livello di significatività e funzione di potenza .

1 ,

Test uniformemente più potenti possono essere individuati mediante l’approccio basato sul rapporto delle massime verosimiglianze.

Dato un problema di verifica d’ipotesi: la statistica rapporto delle massime verosimiglianze è:

è la stima di massima verosimiglianza di con il vincolo è la stima di massima verosimiglianza non vincolata.

contro 1100 :H:H

)(

)(

L

L

XXXL

XXXLXXX

n

n

n

0

21

21

21

ˆ

;...,,max

;...,,max...,, 0

0̂ 0̂

R={(X1, X2,.,Xn) tali che (X1, X2,.,Xn) k} A={(X1, X2,.,Xn) tali che (X1, X2,.,Xn) >k} k tale che l’ampiezza del test sia

Test di ipotesi sul valor medioX variabile casuale con valore medio E(X)= incognito e varianza Var(X)= 2=225.

H0: =40=

H1: =35=

=0.05campione di numerosità n=36:

18 58 64 35 54 50 42 26 66 53 47 40 60 32 52 27 52 62 38 44 19 45 54 43 27 23 82 74 78 36 37 34 48 39 41 57

02.46x

35 40

x

),()(2

nNxf

H1 H0



35.9

9.3536

225645.140 x

9.3536

225645.140 x

1= = 0*x

appartiene alla zona di Accettazione di H002.46x

Test di ipotesi sul valor medio

X variabile casuale con valore medio E(X)= incognito e varianza Var(X)= 2=225.

H0: =40=

H1: 40

=0.1

campione di numerosità n=36:

18 58 64 35 54 50 42 26 66 53 47 40 60 32 52 27 52 62 38 44 19 45 54 43 27 23 82 74 78 36 37 34 48 39 41 57

02.46x

35.9 40 44.01

H1 H0 H1

zona di rifiuto di H0 zona di rifiuto di H0

1.4436

225645.140 x9.35

36

225645.140 x

0=

appartiene alla zona di Rifiuto di H002.46x


1.449.35 x

Test di ipotesi sul valor medio di una variabile aleatoria di Bernoulli

X variabile casuale con valore medio E(X)= incognito e varianza Var(X)= .

H0: = H1: > oppure <oppure

1. Test basato su Z Normale standardizzata:

Z=

n

x

)1(

)(

(n>30)

Un intervento di manutenzione effettuata su 100 componenti è risultato efficace su 25. Verificare l’ipotesi che la probabilità di efficacia sia 0.18 con una probabilità di errore di primo tipo =0.05.

H0: =0.18 H1: 0.18

x =0.25 2 =(0.18*0.82)/100 z0.025=1.96 R={ x tali che ( x -0.18)/(0.18*0.82)/100> 1.96} R={ x tali che ( x -0.18)/(0.18*0.82)/100< -1.96} A= R={ x tali che –1.96<( x -0.18)/(0.18*0.82)/100< 1.96} 1. Poiché (0.25-0.18)/(0.18*0.82)/100=1.72, l’ipotesi nulla è accettata.

Test di ipotesi sul confronto tra 2 valori medi: campioni indipendenti

X1 variabile casuale con valore medio E(X1)= incognito e varianza nota Var(X)=

2.

X2 variabile casuale con valore medio E(X2)= incognito e varianza nota Var(X)=

2.

campione di numerosità n1 di X1

campione di numerosità n2 di X2

H0: =

H1: >(<, )

=0.05

1x

2x

x

),()( 2Nxf

2 1

),()(2

nNxf

2 1 x

),()(2

2

2

1

2

1

2121 nnNxxf

21 xx



2

22

1

21

21 96.1nn

xx

*21 )( xx

2

2

2

1

2

1

2196.1

nnxx

H0 H1

Le valutazioni di un indice di affidabilità effettuate su due distinti ed indipendenti gruppi di prodotti hanno fornito i seguenti risultati: gruppo I: 12 15 20 20 25 18 16 14 24 26 25 25gruppo II: 10 14 15 17 12 20 16 10 12 8 I=20 s2I=22.66 II=13.4 s2II=12.24

Verificare l’ipotesi che il valor medio dell’indice di affidabilità nel gruppo I è significativamente superiore rispetto a quello del gruppo II con probabilità di errore di primo tipo =0.025 (varianze incognite e uguali). H0: III=0H1: III>0

I=20 s2I=22.66 II=13.4 s2II=12.24 t20,0.025=2.086 s2=[(12*22.66)+10*12.24)/20]=20.2s2*(1/12+1/10)=4.45* (1/12+1/10)=1.91 R={ tali che I- II/1.91> 2.086} A={ tali che I- II /1.91 2.086}

Poiché (20-13.4)/1.91=3.46, l’ipotesi nulla è rifiutata.

x

x

x

x

x x

x

x xx

Test di ipotesi sul confronto tra 2 valori medi: campioni appaiati

X1 variabile casuale Normale con valore medio E(X1)= incognito e varianza Var(X1)=

2.

X2 variabile casuale Normale con valore medio E(X2)= incognito e varianza Var(X2)=

2.

H0: = (H0: d=con d=X1-X2)

H1: > oppure < oppure (d>d< d

test basato su t di Student di parametro n-1:

(x11,….,x1n) campione di ampiezza n generato da X1

(x21,….,x2n) campione di ampiezza n generato da X2

1

ˆ

n

sd

n

sd

dd

1)( ntdf

d



n

std d

n

2

,1

ˆ

*d

n

std d

n

2

,1

ˆ

H0 H1

I seguenti dati rappresentano gli errori commessi da 8 lettori ottici, in due prove distinte, prima e dopo l’inserimento di un dispositivo: Prima: 6 7 12 12 11 10 16 9Dopo: 4 6 9 12 10 9 15 8 Verificare l’ipotesi che che il dispositivo abbia migliorato in modo significativo le prestazioni del lettore con una probabilità di errore di primo tipo =0.01. H0: d=con d=Xprima-Xdopo

H1: d>Prima: 6 7 12 12 11 10 16 9Dopo: 4 6 9 12 10 9 15 8d=P-D 2 1 3 0 1 1 1 1

d=10/8=1.25 sd=0.83 t7,0.01=2.99 R={ tali che ( d-0)/( sd /n-1)> 2.99}

A={ tali che ( d-0)/( sd /n-1< 2.99} Poiché (1.25-0)/(0.83/7)=3.99, l’ipotesi nulla è rifiutata.

x

x

xx

Test di ipotesi sul valor medio (ANOVA). Caso di k>2 campioni indipendenti: Analisi della Varianza ad 1 fattore

X1 variabile casuale Normale con valore medio E(X1)= incognito e varianza

Var(X1)= 2.


Var(X2)= 2.


Var(X3)= 2.

H0: =H1: almeno due medie diverse

H0: =H1: almeno due medie diverseTest basato su F di Fisher:

(x11,….,x1n1) campione di ampiezza n1 generato da X1



media campionaria del campione generato da X1

varianza campionaria del campione generato da X1

)/(var

)1/(var

)/(][

)1/(])()()([233

222

211

233

222

211

kngruppiientroianza

kgruppiifraianza

knsnsnsn

kxxnxxnxxn

1

11

11

1 n

iix

nx

21

11

1

21 )(

1 1

xxn

sn

ii

Fk-1, n-k= F3-1, n-3=

Test di ipotesi sul valor medio (ANOVA). Caso di k>2 campioni indipendenti: Analisi della Varianza ad 1 fattore

4

3

1

1 2 3

5

2

6

7

3.9*

*

*

*

*

*

*

*

*

*

*

*

4

3

1

1 2 3

5

2

6

7

3.9*

*

*

*

*

*

*

*

*

*

*

*

ANOVA

processo 1 processo 2 processo 3

6 2 2 5 4 4 7 3 2 6 2 3 4 4 4 6 5 1

VARIABILE tempo di vita di un circuito

H0: =H1: almeno due medie diverse 1=5.7 2=3.3 3=2.7 =3.9 s21=0.9 s22=1.22 s23=1.22

F2,15,0.01=6.36 n1=n2=n3=6 n=18 k=3 1. F=11.2>6.36 =F2,15,0.01 si rifiuta l’ipotesi nulla.

2. La media della variabile è maggiore nel gruppo 13. La distribuzione della variabile deve essere ipotizzata normale.4. Omoschedasticità

xxxx

ANOVA

29,778 2 14,889 11,167 ,001

20,000 15 1,333

49,778 17

Fra gruppi

Entro gruppi

Totale

Somma deiquadrati df

Media deiquadrati F Sig.

GRUPPI

3,002,001,00

Med

ia d

ella

VA

RIA

BIL

E N

EI G

RU

PP

I

6,0

5,5

5,0

4,5

4,0

3,5

3,0

2,50,00

0,05

0,10

0,0 6.36 11.2

F2,15

Accetto H0 Rifiuto H0

H0

Test di indipendenza H0: X e Y indipendenti nij = ni0 n0j / n i=1,.., r ; j=1,.., s

H1: X e Y non indipendenti almeno un nij ni0 n0j / n

X/Y y1 … yj … ys distr. marginale

di X

x1 n11 … n1j … n1s

… … … … … … …

xi ni1

… nij … nis

… … … … … … …

xr nr1 … nrj … nrs

distr. marginale

di Y

…

…

n

s

jjnn

1110

s

jiji nn

10

s

jrjr nn

10

r

iinn

1101

r

iijj nn

10

r

iiss nn

10

r

i

s

j ji

jiij

n

nnn

nnn

1 1 00

200

2)(

}{ 2),1(),1(

2 sr

Test chi quadro basato su:

Rifiuto

Con riferimento alla seguente distribuzione di un collettivo di individui secondo il sesso (X) e l’opinione sulla liberalizzazione dei servizi di telecomunicazioni TLC (Y), eseguire il test chi quadrato (2) con una probabilità di errore di primo tipo =0.05, commentare il risultato (relazione tra sesso e opinione sulla liberalizzazione dei servizi di telecomunicazioni: quali modalità si attraggono e quali si respingono). Ridistribuire le frequenze in modo da avere massima dipendenza tra le variabili.

a favore contrari indecisi

femmine 2 8 1maschi 8 1 2

H0: sesso e opinione liberalizzazione servizi TLC indipendentiH1: sesso e opinione liberalizzazione servizi TLC dipendenti2

(2-1)*(3-1),0.05=5.991 R={2 > 5.991}A={2 < 5.991} 2 =9.378> 5.991. Si rifiuta l’ipotesi nulla.

0,00

0,05

0,10

0,0

Accetto H0 Rifiuto H0

5.991 9.378

2 8 1 11

5,0 4,5 1,5 11,0

-3,0 3,5 -,5

8 1 2 11

5,0 4,5 1,5 11,0

3,0 -3,5 ,5

10 9 3 22

10,0 9,0 3,0 22,0

Conteggio

Conteggio atteso

Residui

Conteggio

Conteggio atteso

Residui

Conteggio

Conteggio atteso

femmina

maschio

sesso

Totale

a favore contrari indecisi Totale

H0

Test di correlazione

Si consideri una v.c. doppia (X,Y) di cui si osserva un campione di numerosità n. Ogni osservazione è costituita da una coppia (Xi,Yi) (i=1,..n) e pertanto l’intero campione sarà costituito dalle n coppie di v.c.

(X1,Y1),… (Xn,Yn).Si suppone che vi sia indipendenza tra le osservazioni campionarie, cioè tra le coppie di

v.c. relative a osservazioni differenti, mentre ovviamente le due v.c. (X i,Yi) (i=1,..n) non sono in generale

indipendenti poiché tra esse intercorre la stessa relazione che vi è tra X e Y.

Il coefficiente di correlazione campionario è dato dalla: dove la quantità: è la covarianza campionaria tra le v.c. X e Y, mentre le: sono le varianze campionarie corrette della varianza di X e della varianza di Y

yx

xy

yx

n

iii

SS

S

SS

yyxx

nr

ˆˆ

ˆ

ˆˆ

))((

1

1 1

n

iiixy yyxx

nS

1

))((1

1ˆ

n

iiy

n

iix yy

nSxx

nS

1

22

1

22 )(1

1)(

1

1

Se =0, ossia le componenti la v.c. normale doppia (X,Y) sono indipendenti, si può provare che:

ha esattamente distribuzione t di Student con (n-2) gradi di libertà. Se 0 si può operare con una trasformazione di variable (“trasformata z di Fisher”):

21 2

nr

rt

r

rZ

1

1ln

2

1

che ha distribuzione approssimativamente Normale con media e varianza date da:

xy

xyZ

1

1ln

2

1

3

1

nZ

Test di correlazione

Campione di numerosità n=8 generato da una v.a. (X,Y) normale doppia:

0

1

2

3

4

5

0 1 2 3 4X

Y

(0.68, 2.7), (1.73, 3.51), (1.51, 3.62), (2.67, 4.51), (1.32, 3.28), (0.52, 2.71), (1.71, 3.95), (0.83, 3.01).

Si supponga di voler verificare ad un livello di significatività 0.05 le ipotesi seguenti: H0: =0

H1: 0

La regione di accettazione è data da (t6, 0.025 =2.447)

A: -2.447 2.447

Il coefficiente di correlazione campionario r vale 0.97. Si rifiuta l’ipotesi nulla. Tra X e Y esiste una significativa correlazione positiva.

281 2

r

r -2.447 0 2.447

f(t, n-2)

H0

Campione di numerosità n=8 generato da una v.a. (X,Y) normale doppia:

0

1

2

3

4

5

0 1 2 3 4X

Y

(0.68, 2.7), (1.73, 3.51), (1.51, 3.62), (2.67, 4.51), (1.32, 3.28), (0.52, 2.71), (1.71, 3.95), (0.83, 3.01).

Si supponga ora di voler verificare ad un livello di significatività 0.05 le ipotesi seguenti: H0: =0.5

H1: 0.5

La regione di accettazione è data da (z1-0.025 =1.96)

A: -1.96 1.96

Il coefficiente di correlazione campionario r vale 0.97. Si rifiuta l’ipotesi nulla. Tra X e Y esiste una significativa correlazione superiore a 0.5.

z

zZ

97.01

97.01ln

2

1

Z5.01

5.01ln

2

1

z38

1

z

-1.96 0 1.96

f(Z)H0

Test per la verifica di ipotesi sul modello distributivo

H0: p(xi) = ni/ n i=1,.., r H1: per almeno un ‘i’ p(xi) ni/ n

X p(x) x1 p(x1) … … xi p(xi)

… … xr p(xr)

1

X frequenza x1 n1 … … xi ni

… … xr nr

n Test chi quadrato basato su:

r

i i

ii

xpn

xpnn

1

22

)(

))((

Rifiuto {2

),1(2

r }

Si ritiene che in una certa popolazione la variabile X sia Normale con =174 e varianza 2 =16 .

Verificare l’ipotesi con il test 2 con =0.01 sulla base dei seguenti dati:

X frequenza frequenza

osservata attesa

1 165 7 0.012

165-170 51 0.146

170-175 190 0.440

175-180 124 0.334

180 28 0.068

2 =3.77< 201.0,4 =13.227. L’ipotesi nulla non viene rifiutata.

Date post:	01-May-2015
Category:	Documents
Upload:	malvolia-di-giacomo
View:	215 times
Download:	0 times

Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; ) parametro...

Documents