Post on 18-Feb-2019
transcript
Principi per la predisposizione di un
piano dicampionamento
Cristiana Maurella
SC Epidemiologia e Osservatorio Epidemiologico
Genova 9 Aprile 2015
PERCHE’ SI CAMPIONA?
�Genericamente: per valutare alcune caratteristiche di una popolazione / lotto
�In sanità pubblica: per cercare un RISCHIO
STRUMENTI PER LA RICERCA DEL
RISCHIO
Epidemiologia e Statistica
Test Diagnostico e
Analisi
Buone pratiche di
campionamento
È l’operazione di osservazione del fenomeno di interesse sulle unità statistiche (in epidemiologia
veterinaria: capi animali, alimenti)
può essere effettuata su:
Survey
tutte le unità di popolazione
(indagine totale o censimento)
un loro sottoinsieme, detto campione
(indagine parziale o campionaria)
perchè un campione anzichè l’intera popolazione?
perchè un campione anzichè l’intera popolazione?
• le risorse $, temporali, umane, di laboratorio sono limitate;• l’intera popolazione non è fisicamente raggiungibile o è in parte ignota;• l’osservazione comporta la distruzione degli elementi;• il nr. di elementi della pop. è molto elevato o infinito, tanto che lo
studio di ciascuno è fattibile solo teoricamente;• non è interessante sapere tutto della popolazione.
raramente è possibile esaminare ogni singolo elemento della popolazione:
l’esame di un numero ridotto di osservazioni, opportunamente
selezionate, consente di superare questi problemi
perchè un campione anzichè l’intera popolazione?
Svantaggi dell’indagine campionaria:
• perdita di parte dell’informazione: non si otterrà ilvalore vero di popolazione ma solo una suaapprossimazione, per quanto precisa (erroreinevitabile);
• ricorso a tecniche statistiche relativamente complesse(procedure di stima e verifica di ipotesi).
Vantaggi:
• risparmio di tempo e risorse;• accuratezza (= validità) delle misurazioni: è possibile
fissare a priori l’ammontare dell’errore di stimatollerabile.
obiettivi del campionamento statistico 1/2
Obiettivo generale è la conoscenza di una popolazionetramite l’esame di una sua parte e la generalizzazione,
con un certo grado di certezza, delle conclusioni ottenute dal campione all’intera popolazione
questo processo di generalizzazione è definito “INFERENZA”
POPOLAZIONE:N
campione: n
estrazione di un campione
studio del campione
inferenza
obiettivi del campionamento statistico 2/2
• in epidemiologia descrittiva: osservare le caratteristichedella popolazione bersaglio;
• in epidemiologia analitica: verificare l’esistenza di eventualirelazioni causali tra fattori di rischio e l’insorgenza dipatologie;
si utilizza l’inferenza per effettuare una stima: si parte dall’elaborazione sui dati del campione per
verificare se una caratteristica e/o relazione in esso osservata valga anche per il resto della popolazione, con
una certa probabilità
ruolo strategico del campione: base informativa per decisioni che riguardano
l’intera popolazione
Stima
logica della stima campionaria, puntuale e intervallare 1/2
puntuale:il parametro sconosciuto della popolazione viene
rappresentato con il valorepreciso calcolato sul
campione
Es.: dato un campione di 100 uova stimo che il peso medio delle uova M del produttore x sia 50 gr (= peso medio delle 100 uova campione).
intervallare:intorno alla s. puntuale
viene costruito un intervallodi valori che, con una certa
probabilità definibile a priori, conterrà l’ignoto
parametro di pop.
Es.: dato un campione di 100 uova stimo che , con prob. 95%,, il peso medio delle uova M del produttore x sia compreso tra 45 e 55 gr, ovvero 50±5 gr.
Campione = unica base informativa:si lavora solo sul campione estratto, dal quale si ottiene
un solo risultato di stima
ma il campione osservato è uno dei tanti che si possono estrarre da una popolazione, calcolando
per ciascuno di essi un valore di stima
al variare del campione, il valore della stima cambia: variabilità campionaria
Perché le stime sono “solo” probabili e non certe?
logica della stima campionaria, puntuale e intervallare 2/2
Affinché l’informazione campionaria ottenuta sia accurata (= valida) quasi quanto quella che si sarebbe ricavata esaminando l’intera pop., il
campione estratto deve essere
caratteri del campione 1/1
Rappresentativo: deve contenere, possibilmente rispettandone le proporzioni, le più importanti
caratteristiche della pop. di provenienza
Casuale: i componenti della pop. devono avere = probabilità di essere scelti
solo così le differenze tra campione e pop. sono accidentali e non sistematiche
Errore di campionamento: differenza tra i risultati ottenuti dal campione e la vera caratteristica della
pop. che vogliamo stimare
errore di campionamento e fattori che vi contribuiscono 1/2
Non può essere determinato con esattezza ma solo contenuto entro margini più o meno ristretti, e stimato
errore di campionamento e fattori che vi contribuiscono 2/2
disegno di campionamento: un campione non
rappresentativo influiscenegativamente sulla validità
= stime lontane dal veroparametro di pop.
La stima è affetta da erroresistematico o distorsione
(non eliminabile ripetendo la misurazione, nè stimabile).
da cosa dipendono tali proprietà?
numerosità campionaria n: un campione troppo piccolo o una elevata variabilità nella
pop. influirannonegativamente sulla
precisione della stima. La stima è affetta da errore
casuale (dovuto allafluttuazione accidentale dei
dati, stimabile).
Validità (=assenza di errore sistematico)
Precisione (=assenzadi errore casuale)
errore di campionamento e fattori che vi contribuiscono 4/5
errore
n
sistematico
casuale
le componenti dell’errore di campionamento: grafico di Rothman
, ....
errore di campionamento e fattori che vi contribuiscono
Validità e precisione delle stimecampionarie
A
B
C
D
A: alta validità, bassa
precisione
B: bassa validità, bassa
precisione (situazione peggiore!)
C: bassa validità, alta precisione
D: alta validità,
alta precisione (situazione ottimale)
Problema: quanto deve essere grande il campione?
determinazione della numerosità campionaria 1/2
• è una delle parti più delicate nella pianificazione di una indagine
campionaria;
• ovviamente (se estratto correttamente), più grande è il
campione, più precisi saranno i risultati. Ma indagini su campioni numerosi
costano un occhio della testa, oltre a richiedere molto tempo…
n = compromesso tra esigenze diverse
determinazione della numerosità campionaria 2/2
Fattori da considerare per det. n in uno studio epidemiologico:
� precisione (errore assoluto = ampiezza IC, es. ± 3% intorno alla stima puntuale); � livello di confidenza desiderato (es. 90, 95, 99%);� prevalenza attesa: rispecchia la variabilità nella pop. (se incognita ipotizzare, per sicurezza, la situazione peggiore e usare un valore di prevalenza del 50%, che massimizza la variabilità e quindi n);
�una correzione utilizzabile nel caso di una pop. bersaglio di modeste dimensioni (se n è almeno pari al 5% di N, è necessario un campione piùpiccolo per ottenere la stessa precisione).
� n aumenta se aumentano precisione e sicurezza, e se P=50%;
� n diminuisce se la pop. bersaglio è piccola.
Es. di determinazione di n per la stima della prevalenza nella pop.
Definisco a priori:
• precisione desiderata = ±3%• grado di “sicurezza” = 95%• prevalenza attesa P: essendo incognita utilizziamo un valore del 10%• la pop. bersaglio è molto grande (50.000 unità)• il campione necessario è pari a n = 385 kg
determinazione della numerosità campionaria 1/2
FORMULA DA UTILIZZARE:
n =
dove:• 2 è il fattore moltiplicativo dell’ES per un livello di confidenza del 95%;• d = precisione desiderata
−2
2 )1(*2
d
PP attatt
Det. di n per la valutazione della presenza di una malattia
Definisco a priori:
• liv. di confidenza (95, 99%)• numero min. di soggetti ammalati che ci si attende nella pop. nel caso la
malattia sia effettivamente presente (esprimibile in termini di prevalenza)
FORMULA DA UTILIZZARE
n =
dove:• a: liv. di confidenza (*)• D: numero di animali
ammalati nella pop.• N: dimensione della pop.
(*) prob. di osservare almeno un animale ammalato nel campione quando la malattia colpisce almeno D/N soggetti nella pop.
−−
−−
2
)1(*)1(1
1 DNa D
determinazione della numerosità campionaria 2/2
Supponiamo di avere 20 campioni e che me aspetto 5 positivi.
Se estraggo un campione a caso, la probabilità che sia positivo = 5/20 = 0.25 = p
E la probabilità che sia negativo = 15/20= 0.75 = 1-p
Ammettiamo che il primo sia negativo e ne prendo un altro. la probabilità che sia negativo = 14/19 = 0.737
La probabilità di 2 soggetti negativi = 0.75 x 0.737 = 0.55
ESEMPIO
Se ne prendo un terzo, la probabilità che sia negativo = 13/18 = 0.722 e la probabilità che i 3 siano negativi = 0.75 x 0.737 x 0.722 = 0.399
Se consideriamo la successione di estrarre 8 campioni negativi, la probabilità
= 15/20 x 14/19 x 13/18 x 12/17 x 11/16 x 10/15 x 9/14 x 8/13= 0.051 = 5
% e la p di avere almeno un campione positivo = 95 %
(((( )))) (((( ))))
−−−−−−−−××××
−−−−−−−−====2
111
1 dNkn d
Numerosità campionaria per dire con un dato livello di confidenza che la popolazione è esente da positivi (o non conformi) se tutti i campioni risultano positivi
n =numerosità campionaria che vogliamo
k =livello di confidenza = 0,95
d =numero di soggetti che si suppone positivi = 5
N =consistenza della popolazione = 20
(((( )))) (((( ))))
−−−−−−−−××××
−−−−−−−−====2
152095.011 5
1
n
n = 8
Numero/grandezza del campione
1
3
5
31020
5
1
4
3
Aflatossine BG in pistacchi
100 kg
5,8
Pasta di salsiccia (di origine diversa) in cui sospetto la presenza di salmonella del 25% ad un livello di confidenza pari al 95%.
Faccio 6 prelievi
Sono tutti negativi. Posso essere tranquillo??
d
dN
nk
−−−−−−−−−−−−−−−−====
21
11
86.0
215
20
611
5
====
−−−−−−−−−−−−−−−−====k
Se faccio 6 prelievi?
Non è un campionamento corretto!!
Con 7 prelievi, k = 0.91 < 0.95
(((( )))) (((( ))))8
21
111
====
−−−−−−−−××××
−−−−−−−−==== dNkn d
E se proprio questo fosse
positivo?
Campionamento microbiologico
Il campionamento deve tenere conto della peculiaritàdell’analita:
A. Biovariabilità della popolazione microbicaB. Distribuzione eterogenea dell’analita
C. Incostanza del comportamento biologico (Germi stressati)
D. La matrice alimentare è un substrato di “esseri viventi” che
entrano in competizione tra loro
E. I germi saprofiti ostacolano lo sviluppo dei germi patogeni
F. In un prodotto pastorizzato/sterilizzato un microrganismo
patogeno si moltiplica con maggior facilità
o.
E
E
E
E
Alimento (Partita -lotto)Campione
Trasporto
Laboratorio
Preparazione
Analisi Risultato
EE
•Scopo principale di un programma di campionamento non è quello di SCARTARE ma di PREVENIRE
come potrà/dovrà essere valutato un risultato positivo,negativo o numerico?
quali informazioni potrà fornire l’analisi sulla situazione igienico-sanitaria del prodotto o del processo di fabbricazione?
come potrà/dovrà essere interpretato il risultato delle determinazioni richieste?
come sarà espresso il risultato in base alla richiesta: qualitativo o quantitativo?
E’ bene domandarsi:
Prima di accingersi al campionamento
Campionamento - Precondizioni
Conoscenza del processo analitico generale e sua applicazione per la risoluzione dello specifico problema
Conoscenza della distribuzione della concentrazione dell’analitaall’interno della derrata
Conoscenza del grado di omogeneità del materiale oggetto di studio
Conoscenza dell’errore potenziale di campionamento
Conoscenza delle strutture coinvolte nella procedura
Esistenza di procedure operative standard (POS) in cui siano dettagliatamente descritte le fasi del campionamento
Disponibilità delle POS per gli operatori addetti al campionamento
Fattori determinanti lo sviluppo di un piano di campionamento
• Tipo di derrata
• Limiti soglia di accettabilità
• Grandezza del campione prelevato
• Preparazione del campione
• Disponibilità di metodi di analisi quantitativi
• Valutazione dei tempi di risposta
• Scelta dei punti di campionamento (campo, navi, ecc.)
• Valutazione dell’accettabilità del rischio del produttore
• Valutazione dell’accettabilità del rischio del consumatore
PIANO DI CAMPIONAMENTO PER ATTRIBUTI
in cui:
�vengono studiate, per un certo carattere, un numero stabilito di unità campionarie prelevate a random
�i risultati analitici ottenuti, qualitativi (assenza /presenza) o quantitativi, sono utilizzati per classificare le unità in 2 classi (Accettabile / Non accettabile) o in 3 classi (Accettabile / Marginalmente accettabile / Non accettabile)
�Un Piano di campionamento a due classi èapplicabile sia a ricerche di tipo qualitativoche di tipo quantitativo
�Un Piano di campionamento a tre classisolo a ricerche di tipo quantitativo
Il Piano di campionamento ICSMF a due classi
Definisce:
� n = numero di unità campionarie che costituiscono il campione, da analizzare in modo indipendente
�m = il valore limite che serve a classificare i risultati come accettabili o inaccettabili ( es. ass/pres in 25g o, per i risultati quantitativi, xxxUFC/g)
� c = numero massimo di unità campionarie con risultato superiore ad m tollerate, perché il giudizio complessivo sulla partita sia ancora favorevole
Un piano di questo tipo ci può dare informazioni, a seconda del valore di n e c, della probabilitàdi valutare come ACCETTABILE una partita non accettabile (Rischio del consumatore) o al contrario di valutare come INACCETTABILE una partita accettabile (Rischio del produttore)
Il Rischio per il produttore ed il Rischio per il consumatore variano - in termini di probabilità- al variare della prevalenza di unità “difettose”realmente presenti nella partita.
�Aumentando il valore di n riduciamo il rischio per il consumatore; stesso effetto si ottieneriducendo il valore di c o diminuendo il valore dim (Piani più stringenti)
� l’opposto avviene diminuendo il valore di n e/o aumentando c ed m (Piani meno stringenti)
La scelta della combinazione più opportuna è un compromesso che tiene conto della tipologia di alimento e della severità del pericolo per la salute umana
Il Piano di campionamento a tre classi
Definisce:
�n = numero di unità campionarie che costituiscono il campione, da analizzare in modo indipendente
�m = un limite microbiologico che permette di classificare i risultati come accettabili ( uguali o inferiori) o marginalmente accettabili
�M = un limite microbiologico al di sopra del quale i risultati sono inaccettabili
� c = numero massimo tollerabile di unitàcampionarie con risultato superiore ad m, ma inferiore ad M, perché il giudizio complessivo sulla partita sia ancora favorevole
GRAZIE PER L’ATTENZIONE