Date post: | 16-Apr-2017 |
Category: |
Data & Analytics |
Upload: | miur-ministero-dellistruzione-delluniversita-e-della-ricerca |
View: | 3,461 times |
Download: | 1 times |
1
Il compito del gruppo di lavoro
• mappare , in chiave anche comparata a livello europeo einternazionale, i principali centri, universitari e non, che operanonel settore dei “Big Data” con riferimento alla formazione ecostruzione di competenze;
• identificare le possibili misure che il sistema formativo italianodovrebbe adottare per essere in linea con le migliori prassiinternazionali valorizzando le proprie specificità e, ove possibile,assumere un ruolo guida in questo settore in rapida evoluzione;
• effettuare la ricognizione delle banche dati del Ministero ,relative al settore dell’istruzione scolastica, dell’università edell’alta formazione artistica e musicale, nonché della ricercascientifica, e proporre azioni che il Ministero potrebbeintraprendere per valorizzare le stesse e renderle strumento utileall’elaborazione di scelte di policy strategiche.
I componenti del gruppo
Fabio BELTRAM SNSSabrina BONO MIURFrancesco CASTANÒ ISTATDavide D’AMICO MIURLuca DE BIASE Nòva24Letizia MELINA MIURDonatella SOLDA MIURRoberto TORRINI Banca d’Italia
La modalità di lavoro
• ascolto della comunità nazionale con inviti diretti eautosegnalazioni;
• tre incontri con gruppi di esperti nel campo della formazione edella ricerca;
• richiesti contributi specifici da parte di esperti;
• analizzata la struttura delle basi di dati del MIUR;
• analizzate le policy europee e internazionali;
• beneficiato del contributo continuo di altri sia interni sia esterni alMIUR.
Caratteristiche dei big data
VOLUME VELOCITÀ
VARIETÀ
VALORE
VOLUME
Caratteristiche dei big data
VELOCITÀ e VARIETÀ
rilevazionimeteo
sensoripagamenti
POS
data warehouse
bilanciaziendali
social network
video-sorveglianza
documentidi testo
datisanitari
destrutturatistruttura
ricercascientifica
mercatifinanziari
strutturati
tem
po r
eale
velo
cità
stat
ici
Caratteristiche dei big data
VALORE
Caratteristiche dei big data
Un esempio
Un esempioData-driven rating
Un esempio
strategieeconomiche/
policy
Data-driven rating
Un esempio
strategieeconomiche/
policy
valutazionemodel free
Data-driven rating
strategieeconomiche/
policy
valutazionemodel free
Real time
DATA DRIVEN RATINGUna visione sistemicaper misurare il rischio dicredito
Competenze e dati
economia matematica informatica statistica
rischio di credito
teoria dellereti
text miningsentiment analysis
significatività
bilancidefaultmercato
social network
machine learning
rete di pagamentirete di ownership
CORPORATE RATING
visione sistemica
società αbilanciocreditimercato
società β
società λ
società ξ
società ε
società δsocietà θ
Da singolo a sistema
società αbilanciocreditimercato
società β
società λ
società ξ
società ε
società δsocietà θ
Da singolo a sistema
Accesso a risorse di calcolo
Rapportopubblicoprivato
Multi-disciplinarietà
Repereribilitàdei dati
Sfide
ppp
La formazione e i big data
ANALISI
PROPOSTE
• Sviluppo di competenze digitali nella scuola
• Modifiche al sistema formativo, valutativo, di monitoraggio
• Alta formazione: laurea, laurea magistrale, PhD, master
Censimento dell’offerta
Università L LM MasterOfferta in altri cdl
Bologna I L, LM
Firenze I, II L, LM
Genova ⚫ ⚫¹ D
L'Aquila ⚫¹
MI Bicocca I
MI Bocconi ⚫¹
PoliMI ⚫¹
Molise I
Padova ⚫²
Pisa ⚫ II
Università L LM MasterOfferta in altri cdl
Luiss I
Roma -Sapienza
⚫ II L, LM
Roma –Tor Vergata
⚫¹ II
Siena ⚫¹²
Torino ⚫ II
PoliTO II³ LM
Trieste -SISSA
II
Venezia ⚫¹ ⚫¹
Università
Bolzano LM
Cassino LM
Ferrara L, LM, D
Insubria D
Lucca – IMT D
Messina L, LM
Milano - Statale LM, D
Napoli – Federico II LM
Università
Padova L, LM
Palermo LM
Pavia LM
Politecnico delle Marche LM
Roma TRE LM
Salerno LM
Trento LM
Censimento dell’offerta
La formazione universitaria è il livello ottimale per fornire glistrumenti richiesti dal fenomeno emergente dei Big Data.
Inserire moduli di data science in tutti i corsi di studio, apartire dalle lauree triennali , per esporre gli studenti al cambiodi paradigma che investe tutte le discipline spingendo verso unapproccio scientifico data driven, con la scoperta di cheemergono dalle grandi masse di dati disponibili: esperimenti suidati visti non solo come validazione di teorie e modelli, ma anchecome scoperta di pattern emergenti che suggeriscono agliscienziati nuove teorie e nuovi modelli, in grado di spiegare più afondo la complessità dei fenomeni sociali, economici, biologici,tecnologici, culturali
Alta formazione:laurea, laurea magistrale, PhD , Master
• Inserire moduli di data science in tutti i corsi di studio
• aggiornamento paradigmi formativi e della distribuzione deicrediti
• finanziamento di progetti comuni tra data scientists ed esperti disettore (sanità, economia, scienze sociali e umane…)
• programma di reclutamento dei docenti
• centri di ateneo capaci di fornire i crediti in ambito big data
CORSI DI LAUREA (TRIENNALI)
Alta formazione:laurea, laurea magistrale, PhD , Master
Servizi 27,01%
Informatica 18,80%
Manifattura 12,79%
Grande distribuzione 9,57%
Rifiuti 8,16%
Finanza e Assicurazioni 8,09%
Vendita all'ingrosso 5,67%
Educazione 3,03%
Altri servizi (no PA) 1,70%
Turismo 1,21%
Sanità 1,04%
Immobiliare 0,76%
Edilizia 0,62%
Trasporti 0,46%PA 0,42%Management 0,28%Arte e Cultura 0,18%
Estrazione materie prime 0,11%
Utenze 0,11%
Altro %
La richiesta di competenze BD nelmercato del lavoro (USA, 2014)
LAUREA MAGISTRALE
Elementi di data science sono necessari all’interno dell’offerta ditutti i percorsi, ma qui si colloca il livello ideale per laformazione di specialisti in data science .Aspetto centrale della programmazione di questi percorsi dilaurea è la necessità di renderli adatti ad accogliere laureatiprovenienti da background diversi per formare degli specialisti disettore capaci di utilizzare in maniera avanzata e indipendente inuovi strumenti del mondo dei Big Data in specifici settoriscientifici e professionali .
Alta formazione:laurea, laurea magistrale, PhD , Master
LAUREA MAGISTRALE
• Inserire moduli di data science in tutti i corsi di studio
• percorsi di laurea magistrale focalizzati potrebbero in molticasi essere inseriti in una varietà di classi disciplinari distinte aseconda dello specifico settore nel quale il data scientistsvolgerà la sua attività (ad es. settore biomedico, scienzesociali e umane)
• La collocazione in diverse classi disciplinari a seconda dellospecifico settore è utile a evitare ostacoli in ingresso ebarriere disciplinari per il prosieguo della vitaaccademica/professionale degli studenti.
Alta formazione:laurea, laurea magistrale, PhD , Master
PhD
Considerazioni simili alle LM, rafforzate, si applicano allapossibilità di attivare percorsi di formazione dottorale , inoltre:
• necessità di una documentata capacità di ricercadell’ateneo ospite
• nuovi dottorati potrebbero gemmare da esperienze di successoin dottorati esistenti attraverso il coinvolgimento di competenzedelle nuove metodologie
• specifico piano di finanziamento di borse dottorali
• limitato numero di dottorati focalizzati sulla figura del datascientist, ma spazio anche a borse riservate a candidati con unbackground specifico da inserire all’interno di percorsi più“convenzionali” (economia, farmacologia, etc.).
Alta formazione:laurea, laurea magistrale, PhD , Master
MASTER
Offerta esiste, ma è poco omogenea. Opportuno introdurreprocessi di accreditamento.
• Finalità principale di questi percorsi professionalizzantidovrebbero essere formazione continua e aggiornamentoprofessionale , anche in collaborazione con le imprese
• Si raccomanda l’introduzione di percorsi intensivi sull’utilizzodelle nuove metodologie riservati agli esperti di determinatisettori disciplinari/professionali. Esempi: master aperti aeconomisti, scienziati politici, farmacologi, epidemiologi...
Alta formazione:laurea, laurea magistrale, PhD , Master
Scuola : sviluppo delle competenze digitali, aggiornamento dell’approccio formativo
• raccordo con il Piano Nazionale per la Scuola Digitale pertrasformare i digital native da consumatori a consumatoricritici e produttori di contenuti digitali
Il PNSD, lanciato nell’Ottobre 2015, è il documento strategico con cui il MIURha definito il posizionamento del sistema scolastico nell’era digitale
• formazione al “valore del dato ” come parte di un processo dialfabetizzazione digitale
Scuola : sviluppo delle competenze digitali, aggiornamento dell’approccio formativo
UN’ESPERIENZA BIG DATA PER OGNI STUDENTE/SSA
Tra le azioni del PNSD più direttamente riferibili al tema deiBig Data:
Azione #15: dal prossimo anno scolastico, il MIURfinanzierà 25 curricula didattici applicabili a tutta la scuola,con due specifici percorsi dedicati ai dati (Big e Open Data);
Azione #20: Girls in Tech & Science, per orientare,rafforzare e accelerare le competenze delle ragazze
• Big data sono stimolo per l’adozione di metodologiedidattiche innovative basate su ambienti digitali
• questi metodi rendono possibile il riuso dei materiali pervalutazione (a tutti i livelli e in tempo quasi reale),monitoraggio e ricerca didattica
• questi processi devono essere trasparenti : il personale dellascuola, gli studenti e i loro genitori, tutti gli utilizzatori dellepiattaforme di apprendimento devono essere consapevolidell’uso che viene fatto dei dati generati dalle interazioni sullepiattaforme didattiche digitali
Scuola : sviluppo delle competenze digitali, aggiornamento dell’approccio formativo
TITOLO
• Il rapporto ha mappato il sistema informativo del MIUR,organizzato nei tre sottosistemi dell’ISTRUZIONEdell’UNIVERSITÀ e della RICERCA, le loro macro-aree e iprocessi e dati connessi.
• Il patrimonio di informazioni del MIUR può essere classificatosulla base dei soggetti a cui le stesse si riferiscono. Si possonoindividuare tre principali categorie:
1. singole istituzioni (scuole, università, enti di ricerca e altre istituzioni di altaformazione): informazioni sulle strutture, sull’offerta formativa, sulle risorse economiche eumane, sulla produzione scientifica e quelle derivanti dalle attività di autovalutazione evalutazione;
2. studenti : informazioni relative al percorso formativo e ai principali eventi nella carrierascolastica e universitaria;
3. personale docente e amministrativo : informazioni sul percorso professionale e sultrattamento economico, ma anche, in maniera eterogenea per le diverse carriere, sullaproduzione scientifica, sugli incarichi ricoperti e la formazione.
Struttura e fruibilità dei dati MIUR
TITOLO
L’autonomia che contraddistingue i diversi comparti ha contribuitoallo sviluppo di distinte modalità di gestione delle informazioni,generando un’eterogeneità di repository poco comunicanti traloro.
Le informazioni sono già oggi utilizzate per la formulazione dellepolitiche e per l’analisi dei sistemi scolastico, universitario e dellaricerca. Sono anche in parte a disposizione delle singole istituzioniper le loro scelte gestionali e al più ampio pubblico attraverso deiportali dedicati.
Il Ministero è però oggi nelle condizioni di compiere un saltoqualitativo in ottica Big Data e implementare una strategia disistematica valorizzazione e integrazione del propriopatrimonio informativo
Struttura e fruibilità dei dati MIUR
Una strategia Big Data per il MIUR
• Aumentare la capacità di governare, sia dal punto di vistagestionale sia analitico, queste immense moli di informazioni
� implementare un ambiente ministeriale (virtualmente) centralizzato didata e content management
� garantire la interoperabilità dei diversi data base, indipendentemente daiprocessi amministrativi da cui originano, delle amministrazioni a cui siriferiscono, dei sistemi gestionali adottati
� consolidare i dati ed eliminare le ridondanze
• Integrare/arricchire le informazioni con dati provenienti daaltre amministrazioni (Ministero del Lavoro, Istat, Inail, etc.)
• Integrare/arricchire le informazioni sfruttando in una logica BigData anche le informazioni liberamente ricavabili dal web edai social network
• Diffondere in formato aperto i dati, ferma restando l’esigenzadi assicurare i necessari profili di privacy
Approccio bottom-up che garantisca risultati a breve termine,rilasciati con continuità e frequenza, convergendo allo stessotempo su una visione integrata di lungo termine
A breve termine: • Interventi di adeguamento di qualità sulle basi di dati esistenti e definizione
delle politiche di manutenzione e aggiornamento.
• Ricognizione dei dati di altri enti e statistiche internazionali e progetto dellemodalità di raccordo e integrazione con le basi dati MIUR.
• Definire l’architettura tecnologica e progettare le modalità tecniche diintegrazione a livello dati e applicazioni.
A medio termine:• Creare un livello semantico di ontologie per integrare tutte le informazioni, sia
presenti nelle basi dati ministeriali che ottenute dalle fonti esterne.
• Integrare tutti gli archivi integrati e le fonti dati ausiliarie
• Valorizzare e connettere le strutture preposte alla gestione e all’analisi dei dati
Una strategia Big Data per il MIUR
TITOLO
Sulla base delle diverse esigenze conoscitive si possono individuare diversidestinatari:
• il decisore politico , nello specifico il Ministero e gli organismi preposti allavalutazione, direttamente coinvolti nella gestione, nella formulazione dellepolitiche e nella valutazione degli esiti;
• le singole amministrazioni governate dal Ministero (le scuole, le università,gli enti di ricerca), che dalla disponibilità di dati sulla propria e sulle altrestrutture possono trarre le necessarie indicazioni per le scelte gestionali e diorientamento dell’attività didattica e di ricerca;
• il Sistema Statistico Nazionale che utilizza le informazioni statisticheprodotte dalle amministrazioni sui diversi ambiti della società e dell’economia;
• il mondo della ricerca , che in maniera indipendente è interessato all’analisidei percorsi di studio e professionali degli studenti, e all’analisi dellagovernance del sistema scolastico universitario e della ricerca;
• i singoli cittadini e le famiglie che hanno interesse ad acquisire informazionisul sistema scolastico e universitario;
• il mondo degli sviluppatori di applicazioni , piattaforme e servizi a contenutoinformativo, che possono costruire a partire dalle informazioni pubbliche delMinistero nuove soluzioni a carattere sociale e commerciale.
A chi interessano i dati del MIUR?
TITOLOLa piattaforma Scuola in Chiaro assieme alle informazioni diffuse tramiteil sito Universitaly renderanno fruibili le informazioni attraversopiattaforme che permettano il pieno accesso ai dati pubblici, con modalitàspecifiche in relazione ai profili dell’utenza (pubblico non specialista,utenti che intendano riutilizzare i dati per scopi di ricerca o commerciali).
Raccomandazioni: il MIUR• si faccia promotore della pubblicazione dei propri dati,
adeguatamente documentati e tecnicamente disponibiliadottando le più moderne soluzioni,
• si coordini con altre basi e flussi di dati pubblici,
• attivi politiche di interazione, analisi e partenariato con il settoreprivato per generare prodotti e servizi ad alta intensitàinformativa.
Il portale unico dei dati della Scuola e Universitaly
TITOLOLa disseminazione dei risultati della ricerca migliora le relazionifra scienza (accademia e ricerca) e società, accrescendo da unlato l’impatto e i benefici della R&S sulla società stessa edall’altro aumentando consapevolezza e fiducia dei cittadini.
Viene così massimizzato il ritorno dell’investimento pubblico inricerca, in piena ottica di responsabilità sociale della Ricerca edell’innovazione, rinforzando la relazione tra scienza e società.
La circolazione dei risultati della ricerca, permettendone il lorosuccessivo riuso, fa in modo che questi abbiano maggioreimpatto
I dati della ricerca : l’Open Science
TITOLO
Il gruppo raccomanda :
• incentivi per i ricercatori , a partire dalle procedure divalutazione MIUR sulla produttività dei ricercatori (VQR), inmodo che sia premiato il riutilizzo e la citazione dei dati da loromessi a disposizione;
• emanazione di bandi competitivi per il finanziamento diprogetti di ricerca che abbiano i Big Data sia come metodo, siacome oggetto di studio;
• un piano di sensibilizzazione sul valore della condivisionedei dati da parte dei ricercatori con modalità che tutelino laproprietà intellettuale;
• sviluppo di infrastrutture elettroniche di ricerca che sianocapaci di ospitare grandi moli di dati per la loro condivisione econservazione nel tempo.
I dati della ricerca : l’Open Science
Conclusioni
• Big data sono campo emergente di cui vediamo già le primericadute a livello globale, ma soprattutto vediamo il potenziale perun impatto di straordinario rilievo e grandissima pervasività;
• l’Italia è nelle condizioni di assumere un ruolo competitivo nelloscenario internazionale, ma i diversi attori pubblici e privatidevono agire con tempestività ;
• l’attuazione delle proposte qui delineate consentirà al MIUR nonsolo di beneficiare degli sviluppi offerti dalla Data Science nellosvolgimento delle proprie funzioni, ma anche di proporre unmodello di best practice che potrà avere un prezioso effettotraino su altri settori della pubblica amministrazione,