Di cosa si occupa la statistica inferenziale?. Individuazione della popolazione (criteri di...

Post on 01-May-2015

221 views 0 download

transcript

di cosa si occupa la statistica inferenziale?

• Individuazione della popolazione (criteri di inclusione/esclusione)

• Scelta del campione

• Valutazione descrittiva del campione

• Inferenza sulla popolazione

• Discussione dei risultati

• Noi vedremo in modo particolare:

• stime

• test

stime

• Stime puntuali

• Stime intervallari

• “Confidence intervals”

Cosa significa se leggiamo: c.i. per μ al 95%: (26,4; 30,4) ?

stime

• Trovare il c.i. al 95%per la stima della media di unapopolazione gaussiana N(μ,), avendo a disposizione i dati di un campione, opportunamente scelto, di nume-rosità n, media campionaria m e dev.st. campionaria s.

n

sqm

n

sqm ;

q è il quantile …

Con Excel: usare il comando CONFIDENZA

Risulta:

Cosa succede al variare di n, e cosa al variare di s?

stime

• E’ possibile calcolare a priori la numerosità del campione in modo da ottenere alla fine un c.i. di lunghezza minore o uguale ad una valore prefissato L?

22

L

qsnRisulta:

Vedi esercizio …

cos’è un test statistico

è una “procedura di calcolo”permette di verificare rifiutare un’ipotesiinput

dati di una campione

outputun consuntivo

decisionein base al consuntivo si rifiuta oppure non si

rifiuta l’ipotesi

“ipotesi nulla”

cos’è un test statisticologica aristotelica

(ipotesi nulla, H0)

il nuovo farmaco non è efficace

vero falso

accetto decisione

corretta

errore

(2° tipo)

rifiuto errore

(1° tipo)

decisione

corretta

(H0) il nuovo farmaco non è efficace

vero falso

accetto 1 - P( accetto | falsa )

, beta

rifiuto P( rifiuto | vera)

, alfa

1 -

cos’è un test statistico

test

Parole chiave:

• Ipotesi “nulla” H0 – Ipotesi “alternativa” H1

• Significatività del test α – Potenza del test 1-β

• P-value

• test: parametrici, non parametrici, … t-Student, 2, Wilcoxon, di normalità, …

indipendenza

Completare la seguente tavola:

  U D  

M+     5%

M-     95%

  40% 60% 100%

indipendenza

Se la malattia non dipende dal genere, possiamocompletare la tavola nel modo seguente:

  U D  

M+ 2% 3% 5%

M- 38% 57% 95%

  40% 60% 100%

indipendenza, test 2, test di Fisher

tavola attesa tavola osservata

  U D     U D  

M+ 8 11 19 M+ 4 15 19

M- 144 217 361 M- 148 213 361

  152 228 380   152 228 380

Risolvere con Excel …

test t di Student casi-controlli per il confronto tra le medie

• Popolazioni gaussiane N(μ1,σ1), N(μ2,σ2)

• H0 = {μ1 = μ2}, H1=…

• Fisso α e β (ad es. 5%, 80%)

• Scelta del campione, osservazioni sul campione

.. da cui ottengo media camp. e SD camp.

• Con tali valori effettuo il test t

• Output: p-value –

p < α respingo Ho , quindi …

p > α non respingo Ho , quindi …

• Discussione sull’output … e la potenza, dov’è?

test t di Student per il confronto tra le medie

Si procede in maniera analoga per confronti tra medie

in studi longitudinali (o di coorte) …

il test t di Student

il test t di Student

ecco i dati numerici:

abbiamo due possibilità:

il p-valueè la probabilità di “prendere una cantonata” nel

rifiutare l’ipotesi H0

cosa facciamo in questo caso??

test non parametrici per il confronto tra le mediane

E se le popolazioni di partenza non sono gaussiane?

… test di Mann-Withney (dei ranghi),

test di Wilcoxon (dei ranghi con segno)