8/19/2019 Statistica: Concetti Fondamentali
1/75
Non mi fido molto delle statistiche, perchéun uomo con la testa nel forno acceso e i
piedi nel congelatore statisticamente ha unatemperatura media.attr. a Charles Bukowski
8/19/2019 Statistica: Concetti Fondamentali
2/75
Cos’e’ la Statistica? La
statistica
è una scienza che studiaquantitativamente i fenomeni collettivi diqualche interesse in un determinato ambito.
8/19/2019 Statistica: Concetti Fondamentali
3/75
Due statistiche• L’intera collettività oggetto di studio si chiama
popolazione
ouniverso
. La statistica che descrivel’andamento di fenomeni riguardanti tutto l’insieme è definita statistica descrittiva.
• Se invece si prende in considerazione una parte(detta campione) della popolazione e da essa siintuiscono gli altri valori, si parla di statisticainferenziale
.
8/19/2019 Statistica: Concetti Fondamentali
4/75
Indagine statisticaSi chiamaindagine statistica
l’analisi di fenomenicollettivi eseguita secondo criteri statistici. Se eseguitasull’intera popolazione si parla in genere di
censimento; se prende in esame solo una parte (dettacampione ), si definisce rilevazione campionaria.
La proprietà che si vuole misurare o enumerare è dettacarattere
. Esso è:• quantitativo (variabile statistica ), se le varianti con
cui si presenta sono numeri o misure (dettivalori
)• qualitativo (mutabile ), se le varianti con cui si
presenta sono “qualità” (dette modalità)
8/19/2019 Statistica: Concetti Fondamentali
5/75
I passi di un’indagine statistica 1. Analisi del problema2. Definizione degli obiettivi dell’indagine 3. Rilevazione (autocompilazione o intervista),
spoglio e classificazione dei dati4. Elaborazione dei dati e presentazione sintetica dei
risultati con grafici e tabelle5. Interpretazione dei risultati
8/19/2019 Statistica: Concetti Fondamentali
6/75
FrequenzeOgni studio statistico ha a che fare con un numero piùo meno ampio di dati: la loro classificazione èfondamentale per rendere più agevole e preciso il
lavoro di elaborazione e interpretazione. L’utilizzo diindici numerici per indicare la frequenza con cui unamodalità (caratt. qualitativo) ritorna nell’indagine haproprio questa specifica funzione.La frequenza assoluta indica il numero di volte in cuiuna modalità ricorre.La frequenza relativa è il rapporto fra la frequenzaassoluta e il numero totale di rilevazioni (spessoindicata in percentuale).
8/19/2019 Statistica: Concetti Fondamentali
7/75
Freq. assoluta Freq. relativa
Apple 1 4,76%
LG 1 4,76%
Nokia 13 61,90%
Samsung 6 28,57%
TOTALE 21 100,00%
Brand dei cellulari nella II B
8/19/2019 Statistica: Concetti Fondamentali
8/75
Classi
Nella classificazione invece di caratteri quantitativi, puòessere necessario raggruppare le frequenze in classi (ointervalli ) fra due valori, detti limiti (inferiore e
superiore), in modo da semplificare la lettura delletabelle e l’elaborazione, ammettendo una piccolaperdita in precisione.
Lavorando con dati raggruppati per classi è possibileanche utilizzare lafrequenza cumulata
(relativa oassoluta), che equivale alla somma della frequenza dellaclasse stessa con tutte quelle che precedono.
8/19/2019 Statistica: Concetti Fondamentali
9/75
Gli amici di Facebook nella II B
Classi Freq. assoluta Freq. relativa
Freq. cumul.
assoluta
Freq. cumul.
relativa
0-100 0 0% 0 0%
101-200 4 22% 4 22%
201-300 2 11% 6 33%
301-400 6 33% 12 67%
401-500 3 17% 15 83%
501-600 2 11% 17 94%601-700 1 6% 18 100%
TOTALE 18* 100%
*18 sono le persone iscritte a Facebook
8/19/2019 Statistica: Concetti Fondamentali
10/75
Istogramma per classi
0
1
2
3
4
F r e q u e n z a
Mesi di nascita nella II B
8/19/2019 Statistica: Concetti Fondamentali
11/75
Istogramma in pila
0
50
100
150
200
250
T e
m p o i n m i n u t i
Studenti II B
Finalita’ dell’utilizzo del computer nella II B
Altro
8/19/2019 Statistica: Concetti Fondamentali
12/75
Istogramma in pila in %
0%
20%
40%
60%
80%
100%
T
e m p o i n m i n u t i
Studenti II B
Finalita’ dell’utilizzo del PC nella II B
AltroFacebook
8/19/2019 Statistica: Concetti Fondamentali
13/75
Areogramma (diag. a torta)1; 4% 1; 5%
13; 59%
6; 27%
1; 5%
Brand dei cellulari nella II B
Apple
LG
Nokia
Samsung
Sony-Ericsson
8/19/2019 Statistica: Concetti Fondamentali
14/75
Diagramma a linee (cartesiano)
0
50.000100.000
150.000
200.000
250.000
300.000
350.000
1985 1990 1995 2000 2005
Libri pubblicati e stampati in Italia
Opere pubblicate
Tiratura complessiva
(in migliaia di copie)
[Dati Istat]
8/19/2019 Statistica: Concetti Fondamentali
15/75
Ideogramma
DTV 8
Satellite 14
Rai 13
SKY 12
Mediaset 11
Premium 1
Alice TV 1
Generi di TV “frequentati” nella II B
8/19/2019 Statistica: Concetti Fondamentali
16/75
Diagrammma a radar
0
10
20
30
40IV
V
III
IIIMaterie
Ore
Ore2
[Dati Liceo Sarpi](Ore=curv.scientifica vecchioordinamento;ore2=nuovo ord.)
I quadri orari settimanali del Sarpi
8/19/2019 Statistica: Concetti Fondamentali
17/75
Cartogramma a colori
Cina 6
Vietnam 7
Indonesia 5
Italia 3
Luoghi di produzione delle scarpe della II B
8/19/2019 Statistica: Concetti Fondamentali
18/75
Cartogramma deformante
[WorldMapper]
Distribuzione della popolazione mondiale
8/19/2019 Statistica: Concetti Fondamentali
19/75
ModaMedianaMedia
8/19/2019 Statistica: Concetti Fondamentali
20/75
Moda• In statistica, la moda o norma della
distribuzione di frequenza X è la modalità
(o la classe di modalità) caratterizzatadalla massima frequenza e viene spessorappresentata con la simbologia ν 0 . Inaltre parole, è il valore che compare più
frequentemente.• Nel caso ci siano più valori «pari» si parla
di distribuzione bimodale , trimodale ecc.
8/19/2019 Statistica: Concetti Fondamentali
21/75
Mediana• La mediana è il valore centrale mettendo
una serie di valori in ordine crescente, in
caso di valori uguali al centro si calcolacome media matematica dei due valoricentrali.
• Ha il pregio di non essere particolarmenteinfluenzata da numeri particolarmentediversi dagli altri, che sono però esclusi einfluenzano invece la media aritmetica.
8/19/2019 Statistica: Concetti Fondamentali
22/75
Una proprieta’ della mediana• Consideriamo la somma delle differenze in valore
assoluto fra ogni valore e la mediana. Questa somma èminore di quella che otterremmo utilizzando, invece dellamediana, qualsiasi altro valore tra i dati raccolti.
• Esempio: un’impresa deve rifornire sei supermercati lungouna strada la cui distanza dal capoluogo èrispettivamente:3 6 13 19 22 25L’impresa vuole costruire un magazzino in posizione
centrale, cosicché sia minima la somma delle sue distanzedai supermercati.Si trova con la mediana ((13+19)/2=16), infatti laseguente somma è la minima possibile:
|3-16|+ |6-16| + |13-16| + |19-16| + |22-16| + |25-16|
= 44
8/19/2019 Statistica: Concetti Fondamentali
23/75
Premessa alle medie: sommatoria e
produttoria
8/19/2019 Statistica: Concetti Fondamentali
24/75
Media aritmetica• Dati 5 numeri: 2, 5, 6, 7, 9, la loro
media è data da:
8/19/2019 Statistica: Concetti Fondamentali
25/75
Media aritmetica ponderata• Supponiamo di avere una serie di valori (x1,x2,...,xn) e
supponiamo di conoscere con quale frequenza si ripeteognuno di essi (f1,f2,...,fn): nella media ponderata(pesata), i singoli valori, prima di essere sommati vengonomoltiplicati con il peso (ponderazione) a loro assegnato. Il
peso di ciascun valore è in genere rappresentato dalnumero di volte in cui i valori figurano (frequenza), mapuò significare anche l'importanza (oggettiva o soggettiva)che il singolo valore riveste nella distribuzione. Ladivisione di conseguenza non viene fatta con il numero divalori, ma con la somma dei pesi.
• Esempio: i CFU universitari, supponiamo di averesuperato un esame da 3 crediti con 30, uno da 2 con 27 euno da 4 con 29. La media sarà:
8/19/2019 Statistica: Concetti Fondamentali
26/75
Media geometrica• La media geometrica, basandosi su prodotti e
non su somme, risente di meno della presenzadi termini "estremi", ovvero lontani dal gruppo.
• Ad esempio data la distribuzione: 10, 9, 11, 14,97 la media aritmetica (28,2) risente dellapresenza di quel 97 così alto, mentre lageometrica (16,8) da un risultato più vicino a
quella che potrebbe essere la moda. Diciamoche la media geometrica fa sì che eventualipicchi anomali nella distribuzione non necondizionino l'analisi.
8/19/2019 Statistica: Concetti Fondamentali
27/75
Media geometrica• Essa ha un chiaro significato geometrico: ad esempio la
media geometrica di due numeri è la lunghezza del lato diun quadrato equivalente ad un rettangolo che abbia i lati
di modulo pari ai due numeri. Lo stesso vale in unnumero di dimensioni superiore.• La media geometrica trova impiego soprattutto dove i
valori considerati vengono per loro natura moltiplicati tradi loro e non sommati. Esempio tipico sono i tassi dicrescita, come i tassi d'interesse o i tassi d'inflazione.
• Una caratteristica è che valori piccoli (rispetto alla mediaaritmetica) sono molto più influenti dei valori grandi. Inparticolare, è sufficiente la presenza di un unico valorenullo per annullare la media.
8/19/2019 Statistica: Concetti Fondamentali
28/75
La media geometrica
8/19/2019 Statistica: Concetti Fondamentali
29/75
Media quadratica• La media quadratica è quella che viene
maggiormente influenzata dai valori
molto piccoli e molto grandi delladistribuzione e quindi viene usata perevidenziare i valori che si discostano
molto dai valori centrali.• Essa è altresì usata per quei casi in cui ivalori sono elevati al quadrato.
8/19/2019 Statistica: Concetti Fondamentali
30/75
Media quadratica
8/19/2019 Statistica: Concetti Fondamentali
31/75
Media armonicaGiorno Tempo
impiegato
Velocità
media
Lunedì 30 28
Martedì 20 42
Mercoledì 24 35
Giovedì 21 40
Venerdì 35 24
Si riporta il tempo impiegatoda un dipendente chepercorre 14 chilometri da
casa al posto di lavoro e lavelocità media.
Per determinare la velocitàmedia usiamo la mediaarmonica, in quanto si tratta
di una media di un rapporto:
La media armonica è fortemente influenzata dagli elementi di modulominore: rispetto alla media aritmetica risente meno dell'influenza di outlier
(valori anomali) grandi, ma è influenzata notevolmente dagli outlier piccoli.
8/19/2019 Statistica: Concetti Fondamentali
32/75
La scelta della media• La media aritmetica rappresenta globalmente i dati e si può
sostituire ad essi senza mutare il significato generale, ma va unita amoda e mediana .
• La mediana ha la caratteristica di non essere influenzata dai valoriparticolarmente differenti.
• La moda indica il valore che più spesso si verifica effettivamente.• La media geometrica ha un valore tendenzialmente simile alla
mediana , ed è utilizzata per analizzare fenomeni che variano nel
tempo.• La media armonica è utile per calcolare valori medi che nascono
dal rapporto di altri dati• La media quadratica permette di tener contro di valori
particolarmente distanti dai centrali
8/19/2019 Statistica: Concetti Fondamentali
33/75
Campo di variazioneScarto semplice medioScarto quadratico medioCoefficiente di variazione
8/19/2019 Statistica: Concetti Fondamentali
34/75
Gli indici di variabilita’
8/19/2019 Statistica: Concetti Fondamentali
35/75
Il campo di variazione
8/19/2019 Statistica: Concetti Fondamentali
36/75
Lo scarto semplice medio
8/19/2019 Statistica: Concetti Fondamentali
37/75
Lo scarto quadratico medio (deviazione standard)
8/19/2019 Statistica: Concetti Fondamentali
38/75
Il coefficiente di variazione
• Permette di confrontare due fenomeni,anche differenti per unità di misura.
• Esempio:
Fenomeno Media σ
Stipendi 1070 € 348 € 32,5 %
Età 38 anni 10 anni 26,3 %
8/19/2019 Statistica: Concetti Fondamentali
39/75
Uso e caratteristiche
8/19/2019 Statistica: Concetti Fondamentali
40/75
Come nasce la Curva di Gauss• Se analizziamo la distribuzione di un campione di persone che
seguono un certo programma televisivo per decadi di età,potremmo otteniamo un grafico come quello a sinistra
• Si tratta di una curva dalla classica forma a campana che ha unmassimo attorno alla media dei valori misurati e può essere più omeno stretta a seconda della deviazione standard (dispersione)
• La distribuzione di Gauss è spesso detta normale. L'aggettivo èsignificativo perché indica che moltissimi fenomeni possono esseredescritti da una curva gaussiana, o essere Gauss-like : hanno unadistribuzione normale le stature, i pesi, le misure toraciche dellepersone, i valori ottenuti con misurazioni ripetute di una stessagrandezza (se esse sono soggette solo ad errori accidentali), i valoridei pezzi lavorati dalle macchine (soggetti ad errori di lavorazionee di misurazione).
• Nelle distribuzioni normali media aritmetica, moda e mediana
coincidono nel valore M, calcolabile, nel quale la curva raggiunge ilsuo valore massimo• Supponiamo di considerare l'altezza degli italiani maschi.
Analizziamo un campione di 1.000 soggetti. Probabilmenteotterremmo una curva a campana, centrata attorno a una media,del tipo 174 cm di media con una "deviazione standard" di circa 20cm, cioè il 95% dei soggetti analizzati sarebbe compreso fra 154 cme 194 cm.
8/19/2019 Statistica: Concetti Fondamentali
41/75
Come nasce
• Prendendo inconsiderazione un graficoche rappresenti le
frequenze, più aumenta ilnumero di misurazioni,più questo si avvicineràad una forma a campana(detta curva di Gauss)che si può calcolare con
la seguente equazione:
8/19/2019 Statistica: Concetti Fondamentali
42/75
Distribuzione normale• I risultati rispetteranno le frequenze
indicate in figura, se la misurazione èstata effettuata correttamente.
• Ad esempio, se tra 1000 persone siosserva un peso medio di 73 Kg conuno scarto quadratico medio di 5 Kg,si può affermare che circa 683persone hanno un peso compreso fra68 e 78 Kg, e circa 954 personehanno un peso compreso tra 63 Kg e83 Kg.
• Così, se le lampadine prodotte dauna ditta hanno una durata media di900 ore con uno scarto quadraticomedio di 30 ore, si può affermareche il 68,27% delle lampadine avràuna durata compresa fra 870 ore e930 ore, e la quasi totalità dellelampadine (il 99,73%) avrà unadurata compresa fra 810 e 990 ore.
8/19/2019 Statistica: Concetti Fondamentali
43/75
La curva normale standardizzata
8/19/2019 Statistica: Concetti Fondamentali
44/75
Con il calcolo integrale si ottiene:
8/19/2019 Statistica: Concetti Fondamentali
45/75
8/19/2019 Statistica: Concetti Fondamentali
46/75
Minimi quadratiUso peculiare della curva di Gauss
8/19/2019 Statistica: Concetti Fondamentali
47/75
Il problema dell’errore • Nelle misurazioni è sempre possibile fare errori
sistematici (che però si possono correggerefacilmente una volta compresi) ed erroriaccidentali , che hanno sempre interessato glistatisti, specie poiché molto comuni nelle raccoltedi dati e determinanti per la credibilità sia dellestatistiche che delle previsioni.
• In particolare nascono due domande correlate: – Come si correggono gli errori accidentali?[esigenza pratica] – Come si distribuiscono gli errori accidentali?
[esigenza puramente scientifica]
8/19/2019 Statistica: Concetti Fondamentali
48/75
Come si correggono• La correzione degli errori si basa sul
principio secondo cui «la media aritmetica
di molteplici misure discordanti diun’unica grandezza fornisce la valutazionepiù plausibile della grandezza e siidentificherebbe con essa se il numerodelle misure fosse infinitamente grande»
(principio di Legendre)• Base numerica: il principio dei minimi
quadrati.
8/19/2019 Statistica: Concetti Fondamentali
49/75
Come si distribuiscono: Gauss• Supponiamo ora di effettuare tante misurazioni di una stessa
grandezza con uno strumento; avremo risultati differenti,dovuti all'inevitabile imprecisione del nostro strumento e delnostro operato, che sono detti errori accidentali.
• Se rappresentiamo le misure ottenute su un grafico, se il numerodi misurazioni è molto grande, al limite infinito, la curva cheotterremo è proprio la curva di Gauss.
• In una popolazione la distribuzione dei dati assume unadistribuzione simmetrica. Se σ è molto piccolo (e dunque lo è loscarto dalla media) i dati sono molto concentrati rispetto alla
media stessa, dunque tanto più precisi sono i dati.
8/19/2019 Statistica: Concetti Fondamentali
50/75
Pendolo
8/19/2019 Statistica: Concetti Fondamentali
51/75
8/19/2019 Statistica: Concetti Fondamentali
52/75
Cos’e’ il calcolo combinatorio?
Ci sono determinate situazioni in cui può esserenecessario valutare quanti raggruppamenti sianopossibili partendo da un numero di oggetti.
Un esempio: nel gioco del Superenalotto si deveindovinare una serie di sei numeri compresi fra 1 e 90.Si può sapere quante sono tutte le sestine possibili equindi quanti soldi sono necessari per giocarle tutte?
Proprio di questo si occupa il calcolo combinatorio:studia i modi per raggruppare e/o ordinare gli elementidi un insieme definito.
8/19/2019 Statistica: Concetti Fondamentali
53/75
Disposizione sempliceSi dice
disposizione semplice
di n oggetti di classe k ogniallineamento di k oggetti scelti fra gli n, dove l’ordine
degli elementi ha importanza (es. 4-3-2 è diverso da 3-4-2)
elementi k
k n k n n n n D ..
, 1...21
8/19/2019 Statistica: Concetti Fondamentali
54/75
Ad esempio: nel nostro giardino vogliamo
piantare 3 piante da frutto e abbiamo a disposizione4 diversi tipi (A,B,C,D). In quanti modi li possiamodisporre?
Questo stesso risultato si può ottenere con la formuladella diapositiva precedente:
A
B
C D
C
B D
D
B C
B
A
C D
C
A D
D
A C
C
A
B D
B
A D
D
A B
D
A
B C
B
A C
C
A B
242341341443,4 D
8/19/2019 Statistica: Concetti Fondamentali
55/75
Disposizione con ripetizioniPuò essere necessario calcolare il numero possibile didisposizioni
, nelle quali sia contemplata anche
un’eventuale ripetizione degli elementi. Con un insiemedi n elementi diversi da raggruppare in disposizioni da k elementi ciascuna:
k r
k n n D
,
8/19/2019 Statistica: Concetti Fondamentali
56/75
Un interessante esempio ci viene dalla decifrazione delcodice genetico: gli scienziati agli inizi del XX secolo
ormai sapevano che i geni si trovavano sul DNA e leinformazioni erano codificate dalle 4 diverse tipologiedi nucleotidi (A,G,C,T); inoltre erano propensi acredere che l’espressione del messaggio genetico
avvenisse secondo la relazione un gene-una proteina. Sisapeva che le unità base delle proteine erano i 20amminoacidi. Ma come potevano 4 soli nucleotidicodificare per ben 20 amminoacidi? Evidentemente erapossibile che un gruppo di nucleotidi (anche con
ripetizioni) codificasse per un singolo amminoacido.Ma quanti elementi per gruppo?
triplettaunadacodificatoèoamminoacidogni,644
164
3
3,4
2
2,4
si D
no D
r
r
8/19/2019 Statistica: Concetti Fondamentali
57/75
PermutazioniLe permutazioni sono disposizioni semplici particolari incui n=k. In tal senso da un insieme di n elementi siformeranno gruppi di n elementi che differiscono soloper l’ordine.
Il prodotto di un numero n con tutti i numeri interi chelo precedono escluso lo zero si chiama fattoriale e siindica con
n
123...21
1...211...21,
n n n P
n n n n n k n n n n D
n
n n
8/19/2019 Statistica: Concetti Fondamentali
58/75
Ad esempio: 5 persone hanno a disposizione 5 poltrone
per sedersi. Se vogliamo sapere il numero delle possibilicombinazioni, basta calcolare5 (“cinque fattoriale ”).
12012345!5
123...21!
5
P
n n n n P n
8/19/2019 Statistica: Concetti Fondamentali
59/75
Permutazioni con ripetizioniEsistono dei casi particolari di permutazione in cui idiversi allineamenti possono presentare ripetizioni delmedesimo elemento. In una
permutazione con
ripetizioni
, se i diversi raggruppamenti sono formati da
n elementi non distinti e:• il primo è ripetuto r 1 volte• il secondo r 2 volte• …
• l’n-esimo r n volteallora:
n
r r r n
r r r
n P n
...!!
!
21
..., 21
8/19/2019 Statistica: Concetti Fondamentali
60/75
Ad esempio: vogliamo calcolare con precisione il
numero di anagrammi possibili (anche senza significato)della parola tovaglia . Sono 8 elementi con la ripetizionedella a (2 volte).
20160!2
!82,8 r P
8/19/2019 Statistica: Concetti Fondamentali
61/75
Combinazione sempliceLe
combinazioni
, a differenza delle disposizioni, sonoallineamenti di k elementi presi da un insieme di n
elementi, senza considerare l’ordine con cui vengonodisposti. Così unacombinazione semplice
di n oggetti diclasse k:
!
1...21!,
,k
k n n n n k
D C k n k n
8/19/2019 Statistica: Concetti Fondamentali
62/75
43949268123458687888990
!
1...21
5,90
,
C
k
k n n n n C k n
Un esempio: nel gioco della tombola, quante sono lecinquine che si possono fare? Le cinquine non possonodifferire tra loro solo per l’ordine, ma almeno per unnumero: quindi il risultato è dato dalle combinazionisemplici di classe 5 dall’insieme dei 90 numeri.
8/19/2019 Statistica: Concetti Fondamentali
63/75
Combinazione con ripetizioniAnalogamente alle disposizioni, che si dividono insemplici e con ripetizioni, così anche le
combinazioni
,
oltre a quelle semplici, possono contemplare anchel’eventualità delle ripetizioni. Le combinazioni conripetizioni di n elementi di classe k si risolvono:
!
1...21,
k
k nnnnC
r
k n
8/19/2019 Statistica: Concetti Fondamentali
64/75
Un esempio:Quanti modi ci sono di distribuire a 2 bambini distinguibili 4
caramelle indistinguibili, contando anche i casi in cui uno deibambini non riceve nessuna caramella?
Infatti sono: 0-4, 1-3, 2-2, 3-1, 4-0.Equivalentemente, le combinazioni con ripetizioniinformano sul numero di possibili n-ple di addendi non
negativi la cui somma sia k (considerando diverse n-ple in cuieguali addendi compaiano in ordine differente); nel suddettoesempio, sono mostrate le cinque diverse duple di somma 4.
5
!4
)!142(4,2
r
k nC
8/19/2019 Statistica: Concetti Fondamentali
65/75
La teoria delle probabilità è in fondosoltanto senso comune ridotto acalcolo.
Pierre Simon Laplace
8/19/2019 Statistica: Concetti Fondamentali
66/75
Dal certo alla non determinazione
Quando Galileo Galilei nel XVII secolo iniziò acomprendere l’utilità della matematica applicata allescienze sperimentali, essa cominciò un percorso di
“unione” della certezza dei suoi nessi con la probabilitàdell’esperienza. Molti problemi reali, infatti, eranotanto complessi che l’utilizzo degli strumenti classici sirese impossibile. Alla matematica del certo, così, siimposero i
modelli non deterministici
, che, con
strumenti matematici, lavorano in contesti dove laparzialità delle conoscenze o la complessità deiproblemi non assicurano piena certezza ai risultati.
8/19/2019 Statistica: Concetti Fondamentali
67/75
Termini di baseEvento aleatorio è l’oggetto del calcolo delleprobabilità (ad es. il lancio di un dado).Esperimento aleatorio è un esperimento dall’esito
imprevedibile (ad es. lanciare il dado e leggerne lafaccia superiore).Spazio campionario
è la totalità di tutti i possibili esiti diun esperimento aleatorio (ad es. {1-2-3-4-5-6} per il
lancio del dado) e si indica con .Punto campionario
è un singolo esito di un esperimentoaleatorio (ad es. {1} per il lancio del dado).
8/19/2019 Statistica: Concetti Fondamentali
68/75
EventiL’evento elementare è costituito da un singolo punto campionario(ad es. esce {1} lanciando un dado).L’evento composto è un evento non elementare (ad es. esce prima{1}, poi {2} nel lancio del dado).L’evento impossibile non si può mai verificare (ad es. che esca {-3});
l’evento certo è quello che coincide con (che esca un numerocompreso fra 1 e 6).L’evento unione A∪B è quello che si realizza quando si realizza o Ao B o entrambi.L’evento intersezione A∩B è quello che si realizza se si realizzano siaA sia B.L’evento contrario di A è quello che si realizza se non si realizza A eche unito a questo coincide con Ω.Due eventi sono incompatibili se il realizzarsi dell’uno esclude ilrealizzarsi dell’altro e la loro intersezione è impossibile.
8/19/2019 Statistica: Concetti Fondamentali
69/75
La probabilita’ Lo scopo del calcolo delle probabilità è di attribuire ungrado di aspettativa
(un numero) ad un evento.
La probabilità di un evento E è quel numero cherappresenta la fiducia che attribuiamo al fatto che E siverifichi.
8/19/2019 Statistica: Concetti Fondamentali
70/75
Definizione classicaLa probabilità di un evento aleatorio è uguale alrapporto tra il numero dei casi favorevoli e il numerodei casi ugualmente possibili.
Un esempio: qual è la probabilità che, estraendo unacarta da un mazzo di 52 carte, ne esca una di cuori chenon sia l’asso? I casi favorevoli sono 12 (13 meno l’asso)
mentre i possibili 52.
231,052
12p
8/19/2019 Statistica: Concetti Fondamentali
71/75
Definizione frequentistaNel caso di molti eventi aleatori non è possibile usare ladefinizione classica o perché è ignoto il numero di casifavorevoli o possibili, o perché i casi possibili non sonopossibili alla medesima maniera. In tal caso si preferisceassumere come probabilità empirica di un evento la suafrequenza relativa
. Naturalmente, rispetto al calcoloteorico offerto dalla def. classica, la definizione
frequentista si riferisce sempre a rilievi e indagini fattenel passato, che possono non conservare il medesimovalore nell’attualità.
8/19/2019 Statistica: Concetti Fondamentali
72/75
Definizione soggettiva
A volte, nella quotidianità, può capitare di fareriferimento al concetto di probabilità riferendosi adeterminati eventi, quali possono ad es. essere attivitàagonistiche o situazioni meteorologiche. In un casocome: «Sono sicuro al 90%», non si può parlare diprobabilità “matematica”, perché non c’è davvero unostudio precedente che dia all’affermazione un valorenecessario; piuttosto si potrebbe parlare di
grado di
fiducia che si attribuisce al verificarsi di un determinatoevento dopo aver coerentemente preso in esame tuttele informazioni a disposizione, anche senza osservazionistatistiche o calcoli di casi favorevoli e possibili.
8/19/2019 Statistica: Concetti Fondamentali
73/75
La legge dei grandi numeriSia la probabilità frequentista sia quella soggettiva sibasano su osservazioni statistiche più o meno accurate eprecise che si basano su una legge che fonda di fatto la
probabilità: in una serie di prove ripetute, un evento simanifesta con una frequenza relativa che, al crescere delnumero delle prove, tende ad avvicinarsi al valoreteorico della probabilità, desumibile dalla definizioneclassica.È proprio questa legge a creare un collegamento fraprobabilità classica ed empirica, e fra queste e lastatistica.
8/19/2019 Statistica: Concetti Fondamentali
74/75
Certezza e probabilita’:
un’applicazione
Per poter determinare conprecisione la posizione e lavelocità (e quindi l'energia) di uncorpo in movimento è necessarioche noi non modifichiamo con lanostra osservazione il fenomeno
che vogliamo studiare.
8/19/2019 Statistica: Concetti Fondamentali
75/75
Bibliografia• Wikipedia• Statistica descrittiva, Bergamini-Trifone-Barozzi
• Argomenti di statistica descrittiva, GiancarloBettuzzi• Dispense di probabilità, Dario Palladino• Nozioni introduttive al calcolo della
probabilità, Giampietro Betti• Matematica a colori, Sebastiano Nicosia• Altri materiali vari