Fonti e strumenti statistici per la comunicazione
Prof.ssa Isabella MingoA.A. 2019-2020
a.a. 2019-2020 Pagina 2
A chi è rivolto il corso?
Agli studenti del secondo anno delle lauree triennali (ord. 270) in
Comunicazione Pubblica e d’Impresa
Superando l'esame si ottengono 6 CFU
a.a. 2019-2020 Pagina 3
Frequenza
E’ richiesto lo stesso programma di esame ai frequentanti e ai non frequentanti.La frequenza non è obbligatoria, ma è consigliata per facilitare la comprensione degli argomenti trattati.Chi decide di frequentare deve iscriversi al corso entro la seconda settimana.La frequenza verrà rilevata raccogliendo le firme in modo casuale nel corso delle lezioni.
a.a. 2019-2020 Pagina 4
TESTI D’ESAME OBBLIGATORI Fonti e Strumenti Statistici per la Comunicazione
Fonti statistiche per la Comunicazione(6 cfu - ord. 270)
L. Bocci, I. Mingo(2013), Statistiche, istruzioni per l’uso. Fonti e strumenti per l’analisi dei dati. Edizioni Nuova Cultura
E’ in preparazione una nuova edizione:L. Bocci, I. Mingo(2019), Statistiche, tra produzione e fruizione. Fonti e strumenti per l’analisi dei dati. Edizioni Nuova Cultura
ISTAT, BES 2018 Il benessere equo sostenibile in Italia. (fino a pag. 94)
(https://www.istat.it/it/files//2018/12/Bes_2018.pdf)
Le slide delle lezioni saranno pubblicate in bacheca alla fine di ogni settimana del corso
a.a. 2019-2020 Pagina 5
Bibliografia aggiuntiva (testi di approfondimento facoltativi)
Libri di esercizi: R. Baragona, A. Bonacci, C. Grassetti, M. Gungui, I. Tedesco,
Complementi ed esercizi di Statistica, Edizioni SEAM, Roma, 1998
M. Fraire, A. Rizzi, Esercizi di statistica, Carocci, 2001
a.a. 2019-2020 Pagina 6
6 domande aperte e/o esercizi: ciascunadomanda avrà il punteggio assegnato per unarisposta corretta e completa; la somma deipunti di ciascuna domanda è pari a 30Durata 2 ore.L’esame si considera superato se il votomaggiore o uguale a 18La prenotazione è obbligatoria, tramite Infostud
ESAMEFonti e Strumenti statistici per la Comunicazione
Fonti statistiche per la Comunicazione(6 cfu - ord. 270)
Per i frequentanti
L’esame può essere svolto in tre steps:1)una prova intermedia scritta a metà del corso, sulle parti di programma svolte (analisi monovariata).
2)un project work, riguardante la trattazione di un argomento concordato con il docente, utilizzando dati di fonti statistiche. I project works vengono presentati alla fine del corso in aula.
3)una prova finale scritta, sui restanti argomenti (indici,rapporti, analisi bivariata), svolta durante gli appelli previstidal calendario didattico.
a.a. 2019-2020
Il project work• I frequentanti possono svolgere un project work che li
esonererà da una parte della prova di esame (2 quesiti delvalore massimo di 10 punti)
• Il project work deve avere come obiettivo generale quello dicomunicare, ad un target prescelto alcune informazioniquantitative su un tema individuato dal gruppo di lavoro,costituito da 3-4 studenti.
• I prodotti del project work da presentare sono i seguenti:
– Una presentazione di 8/10 slides che dovranno essere presentate incirca 10/12 minuti durante una lezione a fine corso. Le slides possonoessere sostituite da un video di circa 5 minuti.
– Un razionale (relazione scritta di 3 cartelle di circa 6000 caratteri) in cui si illustra la presentazione (o il video)a.a. 2011-2012ADFSC - InformazioniADFSC Pagina 8
Pagina 9
Programma e testi d’esame per studenti dell’ordinamento 509
Fonti statistiche e indicatori socio-culturali-Statistica sociale
Esame da 4 CFU L. Bocci, I. Mingo, (2012). Statistiche, istruzioni per
l’uso, Nuova Cultura [capp.1 (par.1.1, 1.2, 1.5, 1.6), 2, 3, 4, 5, 10]
I. Mingo, M. Savioli (2011), Tempi di vita moderni, Il loisir della società italiana. Guerini Scientifica, [esclusi capp. 3, 4, 7]
I contenuti e le lezioni
Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre)Parte I : I dati: introduzione alla terminologia; L’analisi monovariata (lezioni dal 26 settembre al 17 ottobre)Parte II : La costruzione e l’uso di variabili “complesse” (lezioni dal 24 ottobre al 31 ottobre)Parte III : Le fonti statistiche e l’analisi secondaria (lezioni dal 5 novembre al 21 novembre)Parte IV: L’analisi bivariata per caratteri qualitativi e quantitativi lezioni dal 26 novembre al 12 dicembre)
FSSC - I.Mingo
a.a. 2019-2020 Pagina 11
InformazioniTutte le informazioni sul corso sono pubblicate sulla bacheca elettronica sul sito di Dipartimento CoRis
(http://www.coris.uniroma1.it/corso/26428)
Contatti:Isabella Mingo e-mail: [email protected] ricevimento: merc. 10.00-12.00, stanza B11A
(I piano sede via Salaria 113) tel.0649918447
a.a. 2011-2012
Obiettivi del corso• Fornire le conoscenze e le competenze necessarie
per : un uso consapevole delle informazioni quantitative,
che non può prescindere dalla conoscenza dellacomplessità dei processi di produzione dei dati ad operadelle fonti statistiche nazionali e internazionali.
interpretare e analizzare in senso critico taliinformazioni, organizzate sempre più spesso in banchedati di grandi dimensioni disponibili on-line.
• Alla fine del corso lo studente avrà acquisito:– le conoscenze necessarie per l'individuazione delle fonti
statistiche adeguate ai propri bisogni conoscitivi .– le competenze per l'uso e la rielaborazione dei
prodotti statistici nell'ambito di un proprio progetto diindagine, in cui le statistiche diventano indicatori difenomeni semplici e complessi.
Concetti chiave
Fonti statistiche
Prodotti statistici
Analisi dei dati statistici
a.a. 2019-2020
E’ una scienza che ha per oggetto lo studio,mediante metodi matematici, di fenomenicollettivi suscettibili di misurazione e didescrizione quantitativa.
Si basa sulla raccolta di dati riguardanti lemanifestazioni individuali con cui tali fenomeni simanifestano.
Fornisce regole, strumenti e tecniche checonsentono la raccolta e l’analisi quantitativa dellecaratteristiche dei fenomeni collettivi.
Che cos’è la statistica?
Che cosa sono i fenomeni collettivi? Fenomeni relativi a una collettività di casi singoli
o a una collettività di osservazioni su un singolocaso. Richiedono un insieme di osservazioni detti
individuali o singoli.
Esempi di fenomeni collettivi: reddito nazionale natalità occupazione e disoccupazione soddisfazione degli utenti consumi culturali • …..
Le caratteristiche che ci permettono di analizzare e descrivere un fenomeno vengono denominate caratteri o variabili statistiche.
Fenomeni collettivi semplici o complessi
Sono fenomeni collettivi semplici quelli delineabili attraversoun solo carattereEs.: L’età degli individui è un fenomeno completamentedescritto dal carattere che misura il numero di anni cheintercorrono dalla nascita al momento in cui si rileval’informazione.
Sono fenomeni collettivi complessi o multivariati quellidescritti da un insieme di caratteri.
Es.: Il consumo culturale degli individui è un fenomenocollettivo multivariato poiché può essere descrittoconsiderando molti caratteri: numero di libri letti, spettacoliteatrali, cinematografici a cui si è assistito, musei visitati…
Statistica descrittiva/inferenziale
Statistica descrittiva• ha l’obiettivo di organizzare,
riassumere e presentare i dati sottoforma tabellare e grafica in modoordinato.
• I suoi strumenti permettono di:– sistematizzare l’informazione mediante
distribuzioni semplici e complesse– sintetizzare l’informazione attraverso
famiglie di indici: valori percentuali,medi, indici di variabilità, rapportistatistici, relazioni statistiche, ecc.
Statistica inferenziale: • Procedure, messe a punto con
l'ausilio della Teoria dellaProbabilità, che consentono digeneralizzare le osservazioniottenute su una parte di unapopolazione statistica- dettacampione – all’intera popolazione.
• Si ottengono così le stime deglielementi distintivi dei caratteri chedefiniscono il fenomeno nellapopolazione, e che vengonogeneralmente chiamate stime deiparametri nella popolazione.
Carattere statistico: caratteristica da studiare, rilevata sulle unità statistiche.
Unità statistica (u.s.): unità elementare che presenta le caratteristiche (caratteri) oggetto di studio.
Popolazione statistica: insieme di u.s. omogenee rispetto ad uno o più caratteri.
Alcuni concetti preliminari
Esempio:Qual è la regione italiana più estesa?
Unità statistiche
Caratteristica o carattere o variabile
Fonte:Istat 2011
a.a. 2019-2020
Esempio:Gli utenti di un servizio erogato dai Municipi di RomaCaratteri e unitàNella tabella seguente:- quali e quanti sono i caratteri?- quali e quante sono le unità statistiche?- qual è la popolazione di riferimento?
I.Mingo 2014
Intervistati Municipio Sesso Cittadinanza Età Titolo di studio Reddito mensileAP 001 IX MUNICIPIO femmina italiana 30 medio superiore 1500AP 004 IX MUNICIPIO maschio estera 41 laurea magistrale 2800BO 005 VIII MUNICIPIO maschio italiana 52 laurea magistrale 1900BO 007 VIII MUNICIPIO maschio italiana 73 medio inferiore 850BO 008 VIII MUNICIPIO maschio italiana 44 medio superiore 1200BR 018 XVII MUNICIPIO femmina estera 35 post laurea 900BR 020 XVII MUNICIPIO femmina italiana 61 laurea magistrale 3000FL 043 IV MUNICIPIO femmina italiana 72 laurea magistrale 2800FL 079 IV MUNICIPIO maschio estera 78 medio inferiore 1100FL 085 IV MUNICIPIO maschio italiana 69 medio inferiore 750FM 001 II MUNICIPIO femmina italiana 45 medio superiore 2300
Unità statisticaE’ un’entità reale (persona, animale, oggetto, territorio) o virtuale (es. evento) che presenta le caratteristiche oggetto di studio.
•Non è necessariamente una persona fisica• Es: nello studio del fenomeno «vendita di quotidiani» le
unità statistiche di riferimento potrebbero essere sono lediverse Testate;
• Es: nello studio delle Imprese che producono automobili leunità statistiche di riferimento sono le imprese
•Non è necessariamente rappresentata da un singolo elemento.• Es: nello studio del fenomeno relativo al consumo delle
famiglie, l’unità statistica di riferimento è la famiglia e quindi un insieme di individui.
Termini equivalenti per indicare una unità statistica sono elemento, soggetto, oggetto, caso o individuo.
Popolazione statisticaL’ insieme di unità statistiche, omogenee rispetto ad una o più caratteri osservabili su di esse.Può essere:
Finita, se costituito da un numero finito di unità statistiche.Es. aziende esistenti in una certa area in un determinatoperiodo .
Infinita, se costituita da un numero illimitato di unitàstatistiche, tanto che non è possibile definirne una listacompiuta. Es. pezzi producibili da una fabbrica a ciclo continuo.
Reale (o empirica) quando tutte le unità della popolazionesono osservabili;
Teorica (o virtuale) quando alcune unità, che potrebbero odovrebbero far parte della popolazione statistica diriferimento, non sono rilevabili. Es. visitatori potenziali di un museo.
a.a. 2019-2020
Caratteri statistici
Modalità: modi in cui un carattere si può presentare Esaustive : devono rappresentare tutti i possibili
modi di essere del carattere Non sovrapposte : ogni u.s. presenta una ed una
sola modalità
Osservare o rilevare un carattere sulle u.s. significa attribuire a tali u.s. una modalità del carattere secondo determinate regole e con certi contenuti
u x
x rappresenta la modalità del carattere Xassociata all’u.s. u
Esempio:Caratteri e modalità
Nella tabella seguente:- quali sono i caratteri?- quali sono le modalità?
I.Mingo 2014
Intervistati Municipio Sesso Cittadinanza Età Titolo di studio Reddito mensileAP 001 IX MUNICIPIO femmina italiana 30 medio superiore 1500AP 004 IX MUNICIPIO maschio estera 41 laurea magistrale 2800BO 005 VIII MUNICIPIO maschio italiana 52 laurea magistrale 1900BO 007 VIII MUNICIPIO maschio italiana 73 medio inferiore 850BO 008 VIII MUNICIPIO maschio italiana 44 medio superiore 1200BR 018 XVII MUNICIPIO femmina estera 35 post laurea 900BR 020 XVII MUNICIPIO femmina italiana 61 laurea magistrale 3000FL 043 IV MUNICIPIO femmina italiana 72 laurea magistrale 2800FL 079 IV MUNICIPIO maschio estera 78 medio inferiore 1100FL 085 IV MUNICIPIO maschio italiana 69 medio inferiore 750FM 001 II MUNICIPIO femmina italiana 45 medio superiore 2300
modalità
Tipi di caratteri (1/2)
• Caratteri qualitativi (mutabili statistiche)
• Le modalità sono espresse da attributi.
• E’ possibile associare a ciascuna modalità unnumero intero che tuttavia non ha alcun valorenumerico: rappresenta solo un codiceconvenzionale
Codifica dei caratteri qualitativi: esempio
a.a. 2019-2020
IdentificativoMunicipio Sesso Nazionalità Età Titolo di studio RedditoAP 001 9 2 1 30 3 1500AP 004 9 1 2 41 5 2800BO 005 8 1 1 52 5 1900BO 007 8 1 1 73 2 850BO 008 8 1 1 44 3 1200BR 018 17 2 2 35 6 900BR 020 17 2 1 61 5 3000FL 043 4 2 1 72 5 2800FL 079 4 1 1 69 2 1100FL 085 4 1 1 69 2 750FM 001 2 2 1 45 3 2300
Sesso1= Maschio2= Femmina
Nazionalità1= Italiana2= Estera
Caratteri qualitativi : esempi
Carattere Modalità
Sesso M (0), F (1)
Stato civile nubile/celibe (2), coniugato (4), divorziato (6), vedovo (8)
Settore attività economica
agricoltura (1), industria (2), servizi (o terziario) (3)
Titolo di studio Nessun Titolo (1), Lic. El.(2), Lic. Media inf. (3), Diploma (4), DL1 (5), DL2 (6) Dottorato (7)
Statura Bassa, Media, Alta
Tipi di caratteri (2/2)• Caratteri Quantitativi (Variabile Statistica):
modalità espresse da valori numerici.Possono essere:Discreti: le modalità sono numeri che
costituiscono un insieme discreto di valori;possono, quindi, essere i numeri interi. Esempi: numero di figli, di nati, di maschi, di
anziani, di imprese.
Continui: le modalità possono essere tutti inumeri, anche non interi, cioè reali,compresi entro un intervallo di valori in cui ilcarattere è misurabile. Esempi: peso, altezza, reddito
a.a.2011-2012
Caratteri, Unità, Popolazione: esempiScopo dell’indagine
•Indagine sulle carriere degli iscritti ai Corso di Laurea triennali in Comunicazione della Sapienza di Roma
POPOLAZIONE
•Studenti iscritti ai Corsi di Comunicazione Pubblica e d’Impresa e di Scienze e tecnologie della Comunicazione
UNITÀ STATISTICA
•Studente
CARATTERI
•Anno di corso, Esami sostenuti, Età, Tipo di diploma
a.a. 2019-2020
Scopo dell’indagine
•Indagine sulla qualità della vita dei residenti nella provincia di Rieti
POPOLAZIONE
•Popolazione residente nella provincia di Rieti
UNITÀ STATISTICHE
•Persone residenti
CARATTERI
•Genere, età, Professione, Reddito, Soddisfazione
Caratteri, Unità, Popolazione: esempi
Scopo dell’indagine
•Indagine sulle condizioni economiche dei Paesi UE
POPOLAZIONE
•Paesi dell’UE
UNITÀ STATISTICHE
•Singoli Stati UE
CARATTERI
•Esportazioni, Importazioni, PIL, Tasso di disoccupazione
a.a. 2019-2020
Scopo dell’indagine
•Indagine sulle condizioni economiche delle imprese italiane
POPOLAZIONE
•Imprese italiane
UNITÀ STATISTICHE
•Singole Imprese italiane
CARATTERI
•Fatturato, Numero dei dipendenti
“Misurazione” : caratteri qualitativi Scala nominale o Mutabile Sconnessa
Nessun ordine tra le modalità Date due modalità è possibile affermare solo se
sono uguali o diverse
Es: Sesso, Stato civile, Sett. attività economica
Scala Ordinale o Mutabile Ordinata Esiste un ordine tra le modalità Date due modalità è possibile non solo affermare
se queste sono uguali o diverse, ma anche stabilireun ordinamento oggettivo, specificando qualeprecede l’altra.
Mutabili rettilinee: Tit. studio, Grado militare Mutabili cicliche: Mese di nascita, Giorno della
settimana di nascita …a.a. 2011-2012
Esiste un’unità di misura delle modalità numeriche
Variabile a scala di intervalli non esiste uno zero assoluto: il valore (modalità) 0
non significa assenza di proprietà del carattere, ma indica una situazione convenzionale.
Operazioni: uguale/diverso; maggiore/minore; somma/sottrazione.
Esempi: Temperatura Celsius, Q.I.
Variabile a scala di rapporti esiste uno zero assoluto, naturale e non arbitrario Operazioni: uguale/diverso; maggiore/minore;
somma/sottrazione; moltiplicazione/divisione Esempi: Nati, Morti, Reddito, Peso
a.a. 2011-2012
Misurazione: caratteri quantitativi
Esempio: variabile a scala di intervalliTemperatura in gradi Celsius e Farenheit
F=32 +1,8 x C
Città C F
Mosca -17,8 0,0
Milano 0,0 32,0
Roma 5,0 41,0
Napoli 10,0 50,0
Palermo 20,0 68,0
Differenze di 10 gradi C corrispondono a differenze di 18 gradi FUna temperatura doppia in gradi C non corrisponde al doppio in gradi F
In sintesi:
a.a. 2011-2012
Livelli di misura e operazioni logico-matematiche
= o > o < + o - x o /
Sconnessa si no no no
Ordinale si si no no
Scala intervalli si si si no
Scala rapporti si si si si
Classificazione gerarchica
Stabilire il tipo dei seguenti caratteri(Qualitativo Sconnesso, Qualitativo Ordinale, Quantitativo Discreto,
Quantitativo continuo):
• Livello di istruzione• Partito votato nelle ultime elezioni• Salario in Euro• Marca di cellulare preferita• Città di residenza• Tempo dedicato allo sport alla settimana (ore)• Numero di film visti in una settimana• Condizione professionale • Grado di soddisfazione di un cliente (per niente /moltissimo)• Corso di Laurea
Esercizio
Trasformazioni della scala di misura
ADA
Nominale Ordinale Scala di intervalli
Scala di rapporti
Nominale Introdurre parametri
Introdurre parametri
Introdurre parametri
Ordinale Non tenere conto dell’ordine
Introdurre parametri
Introdurre parametri
Introdurre parametri
Scala di intervalli
Suddividere in classi e non tenere conto dell’ordine
Suddividere in classi
Scala di rapporti
Suddividere in classi e non tenere conto dell’ordine
Suddividere in classi
Trasformazione di un carattere: da quantitativo a qualitativo ordinale, esempio
• Supponiamo di aver rilevato il reddito annuo lordo su un collettivo di occupati : il reddito minimo e’ 4000 euro, il massimo 50.000 euro
• Si tratta di un carattere quantitativo a scala di rapporti.• Può essere trasformato in una mutabile ordinale raggruppando in
classi le modalità numeriche ed associando a ciascuna di esse un attributo.
• Le classi devono essere esaustive e non sovrapposte.
Classi di reddito Attributo[da 4.000 a 10.000) Basso
[da 10.000 a 20.000) Medio-basso
[da 20.000 a 25.000) Medio
[da 25.000, a35-000) Medio-alto
[da 35.000 a 50.000] Alto
[ Estremo incluso
( Estremo escluso
Trasformazione di un carattere: da qualitativo a quantitativo esempio
•Supponiamo di aver rilevato la mutabile ordinale “titolo di studio” in uncollettivo di occupati, distinguendo nessun titolo, licenza elementare,media inferiore, diploma, laurea triennale, laurea magistrale.
• La mutabile ordinale può essere trasformata in carattere quantitativofacendo corrispondere a ciascuna modalità il numero di anni scolasticinecessari per conseguire il titolo corrispondente.
Modalità attributo Modalità numericaNessun titolo 0
Licenza elementare 5Licenza media
inferiore8
Diploma 13Laurea triennale 16
Laurea magistrale 18
La struttura dei dati
Carattere Qualitativo (mutabile statistica)
Carattere Quantitativo (variabile statistica)
Collettivo statistico
Unità statistica
Osservazione di uno o più caratteri
Tabelle di datiTabella di dati: insieme di informazioni organizzate secondo diverse righe e diverse colonneTabella “unità x caratteri” (o tabella “unità xvariabili”o matrice dei dati)ciascuna riga è associata ad una u.s.ciascuna colonna è associata ad un carattereuna cella è la realizzazione del carattere (in
colonna) su una u.s. (in riga)
Matrice dei dati: esempioA B C D E F G H I J K M N P Q
UNITA' genere LaureaNO Tesi VotoL Durata LavOggi Settore Qualifica Contratto OreLav LavAdeguato UnivOggi Solo Redditou1 F STC 4 101 3 NO, non cerco 0 0 0 0 0 3 0 0u2 M STC 4 111 3 SI 11 22 3 10 1 1 NO 0u3 F SCPO 7 110 3 SI 40 12 3 40 1 3 SI 5u4 F STC 3 108 3 NO, in cerca 0 0 0 0 0 3 0 0u5 M SCPO 12 99 3 NO, non cerco 0 0 0 0 0 1 0 0u6 F COOP 6 110 3 SI 17 22 5 18 1 3 0 1u7 M COOP 13 96 3 SI 30 12 4 40 1 3 SI 2u8 M STC 4 107 3 SI 15 7 1 12 1 1 SI 1u9 F SCPO 7 104 3 NO, non cerco 0 0 0 0 0 2 0 0u10 F STC 3 110 3 NO, non cerco 0 0 0 0 0 3 0 0u11 M SCPO 16 105 3 SI 14 2 7 16 1 1 SI 3u12 F SCPO 4 108 3 NO, non cerco 0 0 0 0 0 1 0 0u13 F SCPO 11 108 3 NO, non cerco 0 0 0 0 0 2 0 0u14 F SCPO 4 102 4 NO, non cerco 0 0 0 0 0 1 0 0u15 F STC 4 103 3 NO, non cerco 0 0 0 0 0 1 0 0u16 F SCPO 9 108 4 SI 45 7 6 20 1 1 SI 1u17 F SCPO 7 103 3 NO, in cerca 0 0 0 0 0 3 0 0u18 F SCPO 11 111 3 NO, in cerca 0 0 0 0 0 1 0 0u19 M SCPO 11 105 3 NO, in cerca 0 0 0 0 0 3 0 0u20 F STC 2 103 3 NO, non cerco 0 0 0 0 0 1 0 0u21 F SCPO 9 109 4 NO, non cerco 0 0 0 0 0 1 0 0u22 M STC 1 111 5 SI 18 23 8 36 1 1 SI 5u23 M STC 3 104 3 NO, non cerco 0 0 0 0 0 1 0 0u24 F SCPO 2 111 4 NO, non cerco 0 0 0 0 0 3 0 0u25 M SCPO 5 109 3 NO, non cerco 0 0 0 0 0 1 0 0u26 F STC 3 107 5 SI 15 1 6 x 2 1 NO 2
La manipolazione dei dati può riguardare non soltanto i caratteri osservati, ma anche le unità statistiche che possono essere aggregate secondo criteri utili alle finalità dell’indagineSi è rilevato su alcuni individui laureati alcuni caratteri, si può passare dalle unità statistiche laureati
alle unità statistiche corsi di laurea
Trasformazione delle unità statistiche
FSSC Mingo 2019-2020
La tabella dei microdati
Unità statistica di rilevazione Corso di laurea
Conclusione del percorso di
studioVoto di laurea
Intervistato 1 Economia In corso 100
Intervistato 2 Economia Fuori corso 106
Intervistato 3 Comunicazione In corso 110
Intervistato 4 Comunicazione Fuori corso 104
Intervistato 5 Comunicazione Fuori corso 101
Intervistato 6 Ingegneria In corso 90
Intervistato 7 Ingegneria In corso 110
Si vuole focalizzare l’analisi non tanto sui singolilaureati quanto sui corsi di laurea, per faremergere eventuali analogie e differenze inmerito ai voti e alla possibilità di licenziarelaureati in corsoI dati statistici che si andranno ad analizzarenon saranno quelli riguardanti i singoliintervistati, ma quelli ottenuti attraversoopportune elaborazioni dei microdatiQueste elaborazioni danno luogo ai macrodati
Trasformazione delle unità statistiche
Dai microdati ai macrodati
I laureati sono aggregati in gruppi in base alla medesima modalità del carattere “corso di laurea” tanti gruppi quante sono le modalità del carattere
“corso di laurea” unità di analisiPer gli altri caratteri si sceglie una appropriata funzione di aggregazione delle modalità che tenga conto della tipologia del carattere per la mutabile dicotomica “conclusione del
percorso di studio” si contano, per ogni unità di analisi, i laureati in corso e quelli fuori corso
per la variabile a scala di rapporti “voto di laurea” si calcola il voto medio alla laurea per ciascuna unità di analisi
Dai microdati ai macrodati: procedura
Unità statistiche di rilevazione: unità elementari su cui vengono rilevati i caratteri danno luogo ai microdati: insieme di dati
riguardanti le unità elementariUnità statistiche di analisi: unità primarie di interesse per l’analisi, a cui vengono riferiti i caratteri oggetto di studio può coincidere con quella di rilevazione può riferirsi ad aggregazioni di tali unità (la
famiglia, la scuola, l’azienda, il corso), in tal caso danno luogo ai macrodati.
Microdati e macrodati
Matrice unità/caratteri o tabelle di datiTabella ai dati: insieme di informazioni organizzate secondo diverse righe e diverse colonneTabella “unità x caratteri” (o tabella “unità xvariabili” o matrice dei dati)ciascuna riga è associata ad una u.s.ciascuna colonna è associata ad un carattereuna cella è la realizzazione del carattere (in
colonna) su una u.s. (in riga)
Matrice dei dati microdati o macrodati
A B C D E F G H I J K M N P QUNITA' genere LaureaNO Tesi VotoL Durata LavOggi Settore Qualifica Contratto OreLav LavAdeguato UnivOggi Solo Redditou1 F STC 4 101 3 NO, non cerco 0 0 0 0 0 3 0 0u2 M STC 4 111 3 SI 11 22 3 10 1 1 NO 0u3 F SCPO 7 110 3 SI 40 12 3 40 1 3 SI 5u4 F STC 3 108 3 NO, in cerca 0 0 0 0 0 3 0 0u5 M SCPO 12 99 3 NO, non cerco 0 0 0 0 0 1 0 0u6 F COOP 6 110 3 SI 17 22 5 18 1 3 0 1u7 M COOP 13 96 3 SI 30 12 4 40 1 3 SI 2u8 M STC 4 107 3 SI 15 7 1 12 1 1 SI 1u9 F SCPO 7 104 3 NO, non cerco 0 0 0 0 0 2 0 0u10 F STC 3 110 3 NO, non cerco 0 0 0 0 0 3 0 0u11 M SCPO 16 105 3 SI 14 2 7 16 1 1 SI 3u12 F SCPO 4 108 3 NO, non cerco 0 0 0 0 0 1 0 0u13 F SCPO 11 108 3 NO, non cerco 0 0 0 0 0 2 0 0u14 F SCPO 4 102 4 NO, non cerco 0 0 0 0 0 1 0 0u15 F STC 4 103 3 NO, non cerco 0 0 0 0 0 1 0 0u16 F SCPO 9 108 4 SI 45 7 6 20 1 1 SI 1u17 F SCPO 7 103 3 NO, in cerca 0 0 0 0 0 3 0 0u18 F SCPO 11 111 3 NO, in cerca 0 0 0 0 0 1 0 0u19 M SCPO 11 105 3 NO, in cerca 0 0 0 0 0 3 0 0u20 F STC 2 103 3 NO, non cerco 0 0 0 0 0 1 0 0u21 F SCPO 9 109 4 NO, non cerco 0 0 0 0 0 1 0 0u22 M STC 1 111 5 SI 18 23 8 36 1 1 SI 5u23 M STC 3 104 3 NO, non cerco 0 0 0 0 0 1 0 0u24 F SCPO 2 111 4 NO, non cerco 0 0 0 0 0 3 0 0u25 M SCPO 5 109 3 NO, non cerco 0 0 0 0 0 1 0 0u26 F STC 3 107 5 SI 15 1 6 x 2 1 NO 2
La matrice unità/caratteri: esempioDa un’indagine condotta ad un anno dalla laurea sui laureati nell’a.a. 2016/2017 ad un corso di laurea triennale della nostra facoltà, si sono ottenuti i seguenti microdati:
Distribuzione unitaria
Tabella “unità x variabili” è una distribuzione unitaria multiplaunitaria perché è rappresentata ciascuna
u.s.multipla perché sono osservati più
caratteri su una medesima u.s.
Una sola colonna della tabella distribuzione unitaria semplice
Esempio: Distribuzione …
A B C D E FUNITA' sesso LaureaNO Tesi VotoL Duratau1 F STC 4 101 3u2 M STC 4 111 3u3 F SCPO 7 110 3u4 F STC 3 108 3u5 M SCPO 12 99 3u6 F COOP 6 110 3u7 M COOP 13 96 3u8 M STC 4 107 3u9 F SCPO 7 104 3u10 F STC 3 110 3u11 M SCPO 16 105 3u12 F SCPO 4 108 3u13 F SCPO 11 108 3u14 F SCPO 4 102 4u15 F STC 4 103 3u16 F SCPO 9 108 4u17 F SCPO 7 103 3u18 F SCPO 11 111 3u19 M SCPO 11 105 3u20 F STC 2 103 3u21 F SCPO 9 109 4u22 M STC 1 111 5u23 M STC 3 104 3u24 F SCPO 2 111 4u25 M SCPO 5 109 3u26 F STC 3 107 5
Unitaria Multipla Unitaria SempliceA B
UNITA' sessou1 Fu2 Mu3 Fu4 Fu5 Mu6 Fu7 Mu8 Mu9 Fu10 Fu11 Mu12 Fu13 Fu14 Fu15 Fu16 Fu17 Fu18 Fu19 Mu20 Fu21 Fu22 Mu23 Mu24 Fu25 Mu26 F
La distribuzione Statistica di …Frequenze AssoluteNecessità di sintesiLista delle modalità che il carattere può assumereConteggio del numero di u.s. del collettivo considerato che presentano la singola modalità (freq. Assoluta)
CARATTERE FREQUENZE ASSOLUTE
Modalità uno
Numero di unità statistiche del collettivo considerato che
presentano la modalità uno del carattere
Modalità due
Numero di unità statistiche del collettivo considerato che
presentano la modalità due del carattere
… …
Modalità kappa
Numero di unità statistiche del collettivo considerato che
presentano la modalità kappa del carattere
Dalla distribuzione unitaria a quella di frequenza esempio
Cognome sesso età Livello soddisfazione
Tipo albergo(categoria)
Giorni permanenza
Bianchi F 28 basso 2 4
Alimov F 52 medio 3 6
More M 19 alto 4 2
Wieser F 23 alto 3 10
Lincoln M 60 medio 5 8
a.a. 2019-2020
Distribuzione di frequenza assoluta• Elencazione del numero delle volte che una modalità di un
carattere viene osservata nel collettivo.• Corrisponde alla suddivisione delle unità statistiche in
sottogruppi.
Sesso frequenza
F 3
M 2
totale 5
Livello soddisfazione
frequenza
basso 1
medio 2
alto 2
Totale 5
Osservazioni:•Evidenzia le caratteristiche del fenomeno•Implica perdita di informazione
a.a. 2019-2020
Frequenze assolute: la notazione
X : Carattere osservatox1 , x2 ,…, xi ,…, xK : K modalità
assunte del carattere Xxi modalità genericaxK ultima modalità Se X quantitativo
x1< x2<…< xi<…< xKn : numero di u.s. che
compongono il collettivon1 , n2 ,…, ni ,…, nK : freq. Assol.
associate alle K modalitàn1+ n2+… + ni+…+ nK=n
Car. X FREQUENZE ASSOLUTE
x1 n1
x2 n2
… …
xi ni
… …
xK nK
Totale n