1
Elementi di Teoria della Probabilità
• Terminologia Terminologia • Operazioni su insiemi di eventi Operazioni su insiemi di eventi
– unione unione – intersezioneintersezione
• Proprietà della probabilità ( 1 , 2 , 3 , 4 )Proprietà della probabilità ( 1 , 2 , 3 , 4 )– I° esperimentoI° esperimento– II° esperimentoII° esperimento
• Eventi condizionatiEventi condizionati• Proprietà Moltiplicativa della probabilitàProprietà Moltiplicativa della probabilità• Teorema di BayesTeorema di Bayes
2
TerminologiaTerminologia
esperimentoun’attività che produce risultati diversi nelle successive prove in cui viene ripetuta (lanciare una moneta, estrarre un soggetto a caso da un elenco)
spazio dei risultati (o degli eventi)
tutti i possibili risultati dell’esperimento (testa o croce,somma di due dadi, maschio o femmina, età della persona)
evento semplice EEi
ogni elemento dello spazio dei risultati. Gli eventi semplici di un esperimento sono mutuamente esclusivi ( o incompatibili e collettivamente esaustivi
evento composto
un insieme di eventi semplici. Gli eventi composti non sono necessariamente mutuamente esclusivi .
3
Operazioni su Insiemi di EventiOperazioni su Insiemi di Eventi
unione di 2 eventiunione di 2 eventi = l’uno o l’altro o tutti e due E1E2
probabilità(unione)probabilità(unione)
= P(E1 o E2) = P(E1 E2)
intersezione di 2 eventiintersezione di 2 eventi = l’uno e l’altro E1E2
probabilità(intersezione)probabilità(intersezione)
= P(E1 e E2) = P(E1E2)
.OR..OR.
.AN.AND.D.
4
proprietà delle probabilità:proprietà delle probabilità:
1.1. 0 0 P(E P(Eii) ) 1 1 La probabilità di un evento ELa probabilità di un evento Ei i è sempre è sempre
un numero compreso tra 0 e 1un numero compreso tra 0 e 1
2.2. ii P(E P(Eii) = 1) = 1 La somma delle probabilità di tutti gli La somma delle probabilità di tutti gli
eventi Eeventi Ei i spazio degli spazio degli
eventi è = 1eventi è = 1
3.3. Regola della Somma della ProbabilitàRegola della Somma della Probabilità:
P(EP(E11 E E22) = P(E) = P(E11) + P(E) + P(E22) - P(E) - P(E11 E E22))
5
S=spazio campionario (totalità degli eventi)
DefinizioniDefinizioni
A A BBA A B BA B
S=spazio campionario (totalità degli eventi)
__AA
SS
6
I° esperimento: lancio di due I° esperimento: lancio di due dadidadi
risultato = somma del valore della risultato = somma del valore della faccia superiore dei due dadifaccia superiore dei due dadi
X= 6+5 (nell’esempio)X= 6+5 (nell’esempio)
7
x combinazioni possibilicombinazioni possibili
2 1,1
3 1,2 2,1
4 2,2 3,1 1,3
5 2,3 3,2 4,1 1,4
6 3,3 4,2 2,4 5,1 1,5
7 3,4 4,3 5,2 2,5 6,1 1,6
8 4,4 5,3 3,5 6,2 2,6
9 6,3 3,6 5,4 4,5
10 5,5 6,4 4,6
11 5,6 6,5
12 6,6
x=
som
ma d
ei 2
x=
som
ma d
ei 2
d
ad
id
ad
i
X= somma della faccia superiore dei due dadi {2, 3 , …, 12}X= somma della faccia superiore dei due dadi {2, 3 , …, 12}
p(x)
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
8
Regola della sommaRegola della somma
• EE11= = [x pari][x pari]• EE22 = = [[xx7]) 7])
P([x pari]P([x pari][[xx7]) 7]) = P(x pari) + P(x= P(x pari) + P(x7) - 7) - P(xP(x{{8,10,128,10,12}}))
= 18/36 + 21/36 - 9/36 = = 18/36 + 21/36 - 9/36 = 30/3630/36
P(EP(E11 E E22) ) = P(E= P(E11) ) + P(E+ P(E22) ) - P(E- P(E11 E E22))
9
x combinazioni possibilicombinazioni possibili p(x)2 1,1 1/363 1,2 2,1 2/36
4 2,2 3,1 1,3 3/36
5 2,3 3,2 4,1 1,4 4/366 3,3 4,2 2,4 5,1 1,5 5/367 3,4 4,3 5,2 2,5 6,1 1,6 6/368 4,4 5,3 3,5 6,2 2,6 5/369 6,3 3,6 5,4 4,5 4/36
10 5,5 6,4 4,6 3/3611 5,6 6,5 2/3612 6,6 1/36
x=
som
ma d
ei 2
x=
som
ma d
ei 2
d
ad
id
ad
i
P([x pari]P([x pari][[xx7]) 7]) = P(x pari) + P(x= P(x pari) + P(x7) - P(x7) - P(x{{8,10,128,10,12}}) ) = 18/36 + 21/36 - 9/36 = 30/36= 18/36 + 21/36 - 9/36 = 30/36
10
Se Se EE11 ed ed EE22 sono Mutuamente Esclusivi allora … sono Mutuamente Esclusivi allora …
P(E1 E2) = P(E1) + P(E2)
Esempio.
P(somma= 2 3) = 1 + 2 = 3 . 36 36 36
3. Proprietà Additiva della 3. Proprietà Additiva della probabilitàprobabilità:
11
II° esperimentoII° esperimento= estrarre una coppia
{genitore ; figlio}
Estrarre una coppia dalla distribuzione congiunta delle variabili …
{titolo di studio del genitoretitolo di studio del genitore; titolo di studio del figlio }.
12
eventoevento= una coppia di valori: uno per ciascuna variabile
titolo di studio del genitoretitolo di studio del genitoreelementar
emedia diploma totale
titolo di studio del figlio
elementare
4 1 0 5
media 6 24 5 35diploma 5 30 25 60
totale 15 55 30 100
Probabilità di eventi marginali :P(Gd) = P(titolo di studio del genitore = diploma) = 0,30P(Fd) = P(titolo di studio del figlio = diploma) = 0,60Probabilità dell’unione di eventi:Probabilità dell’unione di eventi:P(GdFd)=P[(genitore=diploma) o (figlio=diploma)] = 0,30+0,60-0,25 = 0,65P(GeFe)=P[(genitore=element.) o (figlio=element.)]= 0,05+0,15-0,04= 0,16P(GdFe)=P[(genitore=diploma) o (figlio=element.)] = 0,30+0,05-0,00= 0,35
Probabilità condizionat
a
13
Probabilità Condizionata
Condizionare per “un evento” significa considerare quell’evento come il nuovo spazio degli eventi.
Per pesto motivo si divide per la sua probabilità. E’ come dividere per il totale di riga o il totale di colonna quando nella tabella ci sono frequenze invece di probabilità.
1 2 1 2 2P(E E )=P(E |E ) P(E )
1 40 4=
10 100 100
1 21 2
2
P(E E )P(E |E )=
P(E ) E
ven
to E2
Evento E1SI NO
SI E1E2 E2
NO
E1 1,0
Cara
rrere
docile
(E1)
Capelli rossi (E2)
Si NoSi 4 21 25No 36 39
40 100
1 2
1 2 12
P(E E ) 4 1P(E |E ) = P(E )=
P(E ) 40 4
14
Probabilità Condizionata
P(Fd | Ge)= P[(figlio=diploma) tra quelli con (genitore=elementari)] = 0,05/0,15 = 0,33
P(Fd | Gm)= P[(figlio=diploma) tra quelli con (genitore=medie)] = 0,30/0,55 = 0,54
P(Fd | Gd)= P[(figlio=diploma) tra quelli con (genitore=diploma)] = 0,25/0,30 = 0,83
EVENTI INDIPENDENTIEVENTI INDIPENDENTI
Due eventi sono indipendenti quando la probabilità del primo Due eventi sono indipendenti quando la probabilità del primo condizionata al secondo è uguale alla probabilità del primo non condizionata al secondo è uguale alla probabilità del primo non condizionata (e viceversa)condizionata (e viceversa)
Se P(ESe P(E11 |E |E22) = P(E) = P(E11) ed P(E) ed P(E22|E|E11) = P(E) = P(E22) )
allora Eallora E11 ed E ed E22 sono indipendenti sono indipendenti
Vai alla
tabella
15
Eventi Indipendenti?Esempio dei due dadiEsempio dei due dadi
P(somma=10 | due dadi sono uguali) P(somma=10) 1/6 3/36 Falso
P(somma=pari | due dadi sono diversi) P(somma = pari) 12/30 18/36 Falso
P(dadi uguali | primo dado pari) = P(dadi uguali) 3/18 = 6/36 Vero
P(primo dado pari | dadi uguali) = P(primo dado pari)
3/6 = 18/36 Vero
Esempio dei titoli di studio di genitori e figliEsempio dei titoli di studio di genitori e figli
P(figlio con diploma | genitore con diploma)
P(figlio con diploma)
0,83 0,60 FalsoP(figlio con medie | genitore con
diploma) P(figlio con medie)
0,16 0,35 Falso
16
4.4. Proprietà Moltiplicativa della Proprietà Moltiplicativa della probabilitàprobabilità
Intuizione:Fingiamo per un attimo che E2 si verifichi con certezza, e calcoliamo P(E1|E2).
Adesso, rilasciamo questo assunto; E2 ridiventa un evento incerto, quindi moltiplichiamo per la probabilità di P(E2).
Il prodotto è la probabilità che E1 ed E2 si verifichino, cioè la probabilità dell’intersezione dei due eventi.
P(E1E2)=P(E1|E2)xP(E2)
Se ESe E11 ed E ed E2 sono indipendenti sono indipendenti P(E P(E1|E|E2)=P(E1) )=P(E1)
quindi P(Equindi P(E1EE2) = P(E) = P(E1) x P(E) x P(E2))
Dalla definizione di probabilità condizionata si deriva la proprietà
17
Regola del prodotto
Questo è un caso particolare della proprietà moltiplicativa:Questo è un caso particolare della proprietà moltiplicativa:
La probabilità che due eventi indipendenti si verifichino La probabilità che due eventi indipendenti si verifichino
entrambi è uguale al prodotto delle loro probabilitàentrambi è uguale al prodotto delle loro probabilità
(esempio: probabilità di fare testa due volte di seguito = (esempio: probabilità di fare testa due volte di seguito =
= probabilità testa 1= probabilità testa 1°° lancio x probabilità testa 2 lancio x probabilità testa 2°° lancio lancio = 0,5 x 0,5 = 0,25)= 0,5 x 0,5 = 0,25)
Note: Note: 1) due eventi mutuamente esclusivi non sono mai 1) due eventi mutuamente esclusivi non sono mai
indipendenti indipendenti 2) due eventi indipendenti, non sono mai 2) due eventi indipendenti, non sono mai
mutuamente esclusivimutuamente esclusivi
P(EP(E1EE2) = P(E) = P(E1) x ) x
P(EP(E2))
18
i ip(A )=1-p(A )
Evento certo:Evento certo: p(Ap(A11 A A22 ... A ... Ann ) = p(I) = 1 ) = p(I) = 1
Evento impossibile:Evento impossibile: p(B | [B p(B | [B I]) = 0 I]) = 0
Evento Evento complementare:complementare:
Unione di eventi:Unione di eventi: p(Ap(AiiAAjj)=p(A)=p(Aii) + p(A) + p(Ajj) - p(Ai) - p(AiAAjj))
Evento condizionato:Evento condizionato: p(Ap(Aii | A | Ajj ) = p(A ) = p(Aii A Ajj ) /p(A ) /p(Ajj ) )
Intersezione di eventi:Intersezione di eventi: p(Ap(Aii A Ajj ) = p(A ) = p(Ajj ) ) p(A p(Aii | A | Ajj ) )
Eventi incompatibili:Eventi incompatibili: p(Ap(Aii A Ajj ) = 0 ) = 0
regola della somma :regola della somma : p(Ap(Aii A Ajj ) = p(A ) = p(Aii ) + p(A ) + p(Ajj ) )
Eventi indipendenti:Eventi indipendenti: p(Ap(Aii | A | Ajj ) = p(A ) = p(Aii ) )
regola del prodotto :regola del prodotto : p(Ap(Aii A Aj j ) = p(A) = p(Aii ) ) p(A p(Ajj ) )
PROBABILITÀ: PROSPETTO RIASSUNTIVODato l'insieme I : {A1 , A2 , ... An I}
19
dadoB 1 2 3 4 5 6
dadoA
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12 punti
Un qualunque esito per uno dei due dadi può manifestarsi in concomitanza con un qualunque esito per l'altro dado. Se entrambi i dadi sono ben bilanciati, tutte le facce hanno la medesima probabilità di comparire. L'esito del lancio di uno qualunque dei due dadi è ininfluente sull'esito del lancio dell'altro dado.
20
Note:Punteggi ottenibili con due dadi da gioco a 6 facce
dadoB 1 2 3 4 5 6
dadoA
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12punti
21
PROBABILITÀ DI UN EVENTO
Evento: E Evento: E = punteggio minore di 6= punteggio minore di 6
p(E) = p(2) + p(3) + p(4) + p(5) == + + + = 1
36236
336
436
1036
dadoB 1 2 3 4 5 6
dadoA
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12 punti
22
dadoB 1 2 3 4 5 6
dadoA
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12 punti
UNIONE DI EVENTI(1) Evento:E (punteggio< 6) Evento:E (punteggio< 6) (punteggio (punteggio 8) 8)1036
1536
+
1136
=
2536
p(E)= p(<6)+p(8) = + = p(E)= 1 - [ p(6)+p(7)] = 1 - =
23
dadoB 1 2 3 4 5 6
dadoA
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12 punti
UNIONE DI EVENTI (2) Evento:E(punteggio
PARI)(punteggio<6)
p(E) = p(PARI) + p(<6) - p([PARI][<6]
=
= + - =
1836
1036
436
2436
24
dadoB 1 2 3 4 5 6
dadoA
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
punti
INTERSEZIONE DI EVENTI (1)
Evento:E (punteggio PARI)(punteggio<6)
p(E) = p(PARI) p(<6|PARI) =
= =
1836
418
436
25
B 1 2 3 4 5 6 dado A
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12 punti
INTERSEZIONE DI EVENTI (2) Evento:E= (A=1)(punteggio=7)
p(E)= p(A=1) p(7|A=1) =
= =636
16
136
16nb: (A=1) e (punteggio=7) sono eventi indipendenti P(7) = p(7|A=1) =
dado
26
n21
3
1i B, ,...B ,B ABpAp
22 22
3
i1 i
2
2 2
Ap p B
p B A BBp 0,303
A p A Ap p B
B
p B AAp
B p B
B1
B2
Bn
p[A/B1]
p[A/B2]
p[A/Bn]
A
A
AA1
A2
A3S
EsercizioUna ditta acquista fiale da tre diversi fornitori:il 65% dal fornitore B1, con difettosità del 5%il 25% dal fornitore B2, con difettosità del 10%il 10% dal fornitore B3, con difettosità del 25%Qual è la probabilità di ricevere una fiala difettosa?SoluzioneP[B1]+P[B2]+P[B3]=1
S=B1B2B3
•
p[A1A2A3]=p[A1]+p[A2]+p[A3]-p[A1A2]-p[A1A3]-p[A2A3]-p[A1A2A3]
•di conseguenza, usando la stessa formula,•p[B1/A]=0,394
•p[B3/A]=0,303
27
In uno studio sui fattori di rischio per le patologie cardiache, è stata esaminata la relazione tra
ipertensione (ia) e patologie coronariche (CHD) in soggetti di due diverse fasce di età
35 ‑ 49 anni > 65 anni
CHD CHD
Si NoTotal
eSi No
Totale
IASi 552 212 746
1102
87 1189
No 941 495 1436101
8106 1124
Totale
1493
707 2200212
0193 2313
In ciascuna fascia di età, le probabilità di essere affetti da patologie corona-riche sono maggiori o minor nei soggetti ipertesi ? E appropriato combinare le informazioni di queste due tabelle ?Perche si ? _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ Perche no? _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
Esempio : calcolo dei “valori attesi”
28
In uno studio sui fattori di rischio per le patologie cardiache è stata esaminata la relazione tra: patologie coronariche ~ ipertensione
arteriosa ed età
35 ‑ 49 anni > 65 anni CHD CHD
IA Si No Totale Si No TotaleSi 552 212 746 1102 87 1189No 941 495 1436 1018 106 1124
Totale 1493 707 2200 2120 193 2313
Sembra che patologie coronariche dipendano dall ‘età … ma …
N*p( iachd | 35‑49 anni)= (2200) ( 746/2200) (1493/2200) = 506.26 N*p( iachd | > 65 anni)= (2313) (1189/2313) (2120/2313) =1089.79
(N)*P(E(N)*P(E1EE2) = (N)*P(E) = (N)*P(E1) x P(E) x P(E2))
che relazione esiste tra ipertensione ed età ?
Esempio : calcolo dei “valori attesi”
29
Prima di rispondere osserviamo anche come siano distribuiti fattori di rischio nelle due fasce di età:
35 ‑ 49 anni > 65 anniCHD CHD
Si NoTotal
eSi No Totale
IASi 36.97 29.99 33.91 51.98 45.08 51.41
No 63.03 70.01 65.27 48.02 54.92 48.59Total
e100.0
0100.0
0100.0
0100.0
0100.0
0 100.00
p(ia)=33.91 p(ia)=51.41
Esempio : calcolo dei “valori attesi”
30
ed osserviamo anche come è distribuita la patologia nelle due fasce di età
35 ‑ 49 anni > 65 anni
CHD CHD
IA Si No Totale Si No Totale
Si 72.25 27.75 100.0 92.68 7.32 100.0
No 65.53 34.47 100.0 90.57 9.43 100.0
Totale 67.86 32.14 100.0 91.66 8.34 100.0
P(chd)=67.86P(chd)=91.66
31
Nelle due fasce di età la relazione (ia~chd) è in accordo con la regola dell’indipendenza
Tabella % 35 ‑ 49 anni > 65 anniCHD CHD
ia Si No Totale Si No Totale
Si25.0
99.64 33.91 47.64 3.76 51.41
No42.7
722.50 65.27 44.01 4.58 48.59
Totale67.8
632.14 100.00 91.66 8.34
100.00
Osservati ~ Attesi
0,2509~0.3391*0.6786=0.2391
Osservati ~ Attesi
0.4764~0.5141*0.9166=0.4712
32
I fattori di rischio possono combinarsi in modo moltiplicativo
oppure in modo additivo Quali effetti potremmo osservare ?
33
Avendo tre fattori a,b,c per c=0 c=0
a b=0 b=1 tot
a=0p(a=0|
b=0)××p(b=0)p(a=0|
b=1)*p(b=1)p(a=0
)
a=1p(a=1|
b=0)*p(b=0)p(a=1|
b=1)*p(b=1)p(a=1
)
tot p(b=0) p(b=1) 1.0
| col row | 0 1 | Total-----+--------------+------- 0 | 50 135 | 185 1 | 369 505 | 874 -----+--------------+-------Total| 419 640 | 1,059
| col row | 0 1 | Total-----+-----------------+------- 0 | 11.93 21.09 | 17.47 1 | 88.07 78.91 | 82.53 -----+-----------------+-------Total| 100.00 100.00 | 100.00
| col row | 0 1 | Total-----+-----------------+------- 0 | 27.03 72.97 | 100.00 1 | 42.22 57.78 | 100.00 -----+-----------------+-------Total| 39.57 60.43 | 100.00
E lo stesso schema si ripete per c=1
505 osservati 528.2 attesi
Percentuali per colonna Percentuali per riga
34
ETA35 Ignorando l’etàCHD CHD
IP 552 212 746 IP 1654 299 1935941 495 1436 1959 601 2560
1493 707 2200 3613 900 4513CHI2 ATTESI OR RR CHI2 OR RR
10.58 506.26 1.37 1.23 46.71 1.70 1.38
ETA65 Valori attesi per
un’ipotesiCHD di indipendenza
IP 1102 87 11891549.1
1 385.89 1935
1018 106 11242063.8
9 496.11 25602120 193 2313 3613 900 4513
CHI2 ATTESI OR RR OR RR
3.371089.7
9 1.32 1.15 0.96 0.993
RR= rischio relativoOR= odds ratio
35
Se avessi un effetto additivo 605=235+370
| col row | 1 2 | Total------+----------------------+---------- 1 | 50 235 | 285 | 17.54 82.46 | 100.00 | 11.90 27.98 | 22.62 -----+----------------------+---------- 2 | 370 605 | 975 | 37.95 62.05 | 100.00 | 88.10 72.02 | 77.38 ------+----------------------+----------Total | 420 840 | 1,260 | 33.33 66.67 | 100.00 | 100.00 100.00 | 100.00