+ All Categories
Home > Documents > Open data in una scienza sempre più data-intensive

Open data in una scienza sempre più data-intensive

Date post: 16-Feb-2016
Category:
Upload: ingo
View: 43 times
Download: 0 times
Share this document with a friend
Description:
Paola Gargiulo CINECA, Roma [email protected]. Torino, Aula Magna dell’Università, 24 ottobre 2012. Open data in una scienza sempre più data-intensive. Agenda. Open Research Data: ovvero… Due storie Open Research Data: chi Open Research Data: perché - PowerPoint PPT Presentation
27
Open data in una scienza sempre più data- intensive Paola Gargiulo CINECA, Roma [email protected] Torino, Aula Magna dell’Università, 24 ottobre 2012
Transcript
Page 1: Open data in una scienza sempre più data-intensive

Open datain una scienza sempre più data-intensive

Paola GargiuloCINECA, Roma

[email protected]

Torino, Aula Magna dell’Università, 24 ottobre 2012

Page 2: Open data in una scienza sempre più data-intensive

Agenda

Open Research Data: ovvero…Due storie Open Research Data: chiOpen Research Data: perchéOpen Research Data: progetti in corso

Page 3: Open data in una scienza sempre più data-intensive

Open Research Data, ovvero…

• …dati di base della ricerca finanziata con i fondi pubblici

• …dati grezzi (raw data)• …i dati di cui già si parla nell’articolo scientifico

pubblicato su rivistasulla carta potevamo pubblicare solo un riassunto

della ricerca, sotto forma di “articolo” su rivista sul web possiamo integrare con l’intero set di

dati, offrendo un quadro più completo dell’intera ricerca, con i vantaggi che vedremo

Page 4: Open data in una scienza sempre più data-intensive

Open Research Data, ovvero...

• dati di qualsiasi entità

• dati eterogenei tra loro (mappe, genomi, formule matematiche, scientifiche, bioscienza, biodiversità,etc)

• dati utilizzati per creare modelli climatici, aerodinamici, molecolari, bioinformatica;

• video e immagini di archivio

• descrizione di opere archeologiche, antropologiche

• dati quantitativi e qualitativi utilizzati nelle scienze sociali

• dati elettronici e indici per campioni di fossili o di tessuti

Page 5: Open data in una scienza sempre più data-intensive

Courtesy: Roberta Turra – [email protected]

Dati strutturati• Matrici di dati• Dati transazionali

Grafi • Web e Social network • Stutture molecolari

Dati Ordinati • Dati spaziali • Serie storiche • Sequenze • Sequenze genetiche

Dati non strutturati• Documenti testuali• Immagini• Audio e Video

Open Research Data - Tipologie

Page 6: Open data in una scienza sempre più data-intensive

Open Research Data, ovvero…

• NON i dati della ricerca applicata• NON i dati correlati ai brevetti• NON dati personali• NON dati confidenziali• NON segreti industriali• NON dati di produzione

… solo i dati di base della ricerca…… che sono alla base dei prodotti innovativi…

Page 7: Open data in una scienza sempre più data-intensive

Open Research Data: workflow delle attività

Acquisizione ed elaborazione

Collaborazione e visualizzazione

Disseminazione e condivisione

Archiviazione e conservazione

Analisi e data mining

Page 8: Open data in una scienza sempre più data-intensive

È un’idea nuova?

• molti ricercatori già scambiano i dati (Virtual Observatory, CERN…)

• alcune discipline (Genomics) funzionano solo in virtù della condivisione dei dati

• alcune riviste (Nature Genetics) già richiedono la pubblicazione dei dati insieme all’articolo; molte riviste Open Access lo consigliano

• ci sono già databases aperti in tutte le discipline

Page 10: Open data in una scienza sempre più data-intensive

Due storie / 1

• nel 1989 Tim Berners Lee, al CERN, propone il protocollo HTTP per la trasmissione di dati/ipertesti nellacomunità dei fisici

• nasce così il World Wide Web (WWW)… cosa sarebbe successo se allora Tim

Berners Lee o il CERN avessero deciso di tenere CHIUSO il protocollo e i dati per il suo sviluppo?

Page 11: Open data in una scienza sempre più data-intensive

Due storie / 2

Nel 2006 Ilaria Capua sequenzia per prima il virus dell’influenza aviaria (N5H1)

• l’OMS chiede di depositarlo nel suo database (chiuso)• Ilaria Capua decide di depositare la sequenza in

un database aperto, GenBank, sfidando il sistema corrente, convinta che solo la condivisione dei dati e un approccio trans-disciplinare può favorire la ricerca

• lancia su Nature l’iniziativa GISAID (Global Initiative on Sharing All Influenza Data) cui rispondono 70 ricercatori fra cui 7 Premi Nobel

• da allora, l’OMS ha adottato il suo approccio trans-disciplinare per le strategie pre-epidemiche, che riguarda la salute di tutti noi…

… tutto dalla visione aperta di una ricercatrice…

Page 12: Open data in una scienza sempre più data-intensive

Open Research Data: chi / 1

Neelie Kroesvice presidente Commissione Europea e Commissaria per la Digital Agenda

• «Taxpayers, all of us, deserve the widest possible social and economic benefits from publicly funded research»

• «Data are the new oil»• «You can give away your data now – and generate

revenue and jobs, and even save money from the better information and decisions that will flow»

• «Big data means big opportunities»• «This is a return to the origins of modern science;

where the philosophy was all about open access and achieving progress»

Neelie Kroes blog, http://blogs.ec.europa.eu/neelie-kroes/

Page 13: Open data in una scienza sempre più data-intensive

Open Research Data: chi / 2

Tim Berners Lee• 2009: raw data now!

«Put your data on the Web! Let’s unlock our data and reframe the way we use it together»

http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html

• 2010: the year open data went worldwide«Data combination gives much better answers than data itself»

http://www.ted.com/talks/tim_berners_lee_the_year_open_data_went_worldwide.html

• Progetto Linked data oltre 330 databases aperti,connessi fra loro http://linkeddata.org/

• «The data work only open and connected…»

Page 14: Open data in una scienza sempre più data-intensive

Open Research Data: perché / 1

• per una scienza più solida: meglio basarsi sui DATI che sull’INTERPRETAZIONE degli stessi contenuta negli articoli…per confrontare/dibattere con i propri datiper creare nuova conoscenza aggiungendo i

propri datiper favorire un approccio inter-disciplinare o

trans-disciplinare, per dare risposta ai grandi quesiti della nostra epoca (es. cambiamento climatico)

Page 15: Open data in una scienza sempre più data-intensive

Open Research Data: perché / 2

• per una scienza più efficiente/efficace: i dati già raccolti possono essere riusati senza ulteriori spese,

da differenti prospettive/differenti approcci se i dati circolano rapidamente e globalmente, la creazione

di conoscenza accelerapresupposto: che i dati siano archiviati, catalogati,

ricercabili e accessibili infrastruttura adeguata interoperabilità/standard

Due rapporti europei suquesti aspetti:

Riding the wave. How Europe can gain from the rising tide of scientific data, 2010

Preparing for data driven infrastructure, 2012

Page 16: Open data in una scienza sempre più data-intensive

Open Research Data: perché / 3

• per una scienza più trasparentei dati possono essere riusati per scoprire

frodi/falsificazioni/interpretazioni errate o parziali

Retraction Watch blog che lista i casi di articoli ritrattati non è mai a corto di post…http://retractionwatch.wordpress.com/

Page 17: Open data in una scienza sempre più data-intensive

Open Research Data: perché / 4

• per una società più competitiva:le piccole-medie imprese non hanno

accesso ai dati della ricerca, chiusa in riviste con abbonamenti esosi

se avessero accesso ai dati,immetterebbero sulmercato i loro prodottiDUE ANNI prima

Access to Research and Technical Information in Denmark, Report, May 2011

Page 18: Open data in una scienza sempre più data-intensive

Open Research Data: perché / 5

• per una società più efficiente:con nuove tecniche di data-mining si

possono creare nuovi dati, con valore aggiunto per l’intera società

McKinsey stima che nel solosettore della Sanità in USAutilizzando il data-mining suidatasets aperti si creerebbeun valore di 300 miliardi $, e un risparmio dell’8% nelle spese sanitarie

Big data: The next frontier for innovation, competition, and productivity, 2011

Page 19: Open data in una scienza sempre più data-intensive

Open Research Data: perché / 6

• per una società della conoscenza:cittadini più informatidecisori politici possono prendere decisioni

migliori basandosi sui dati disponibili• per una società più partecipativa:

scienza aperta significacitizen cyberscience:i cittadini comunipartecipano allaraccolta di datihttp://citizencyberscience.net/

Page 20: Open data in una scienza sempre più data-intensive

Open Research Data: perché / 7

• per la società del futuroi dati vanno conservati per il lungo periododevono essere accessibili in forma

strutturata e integra per le prossime generazioni

• per una società che crescela cura, la gestione e la conservazione dei

data sets richiede nuove professionalitàsi aprono prospettive di lavoro/formazione

Page 21: Open data in una scienza sempre più data-intensive

Open Research Data: progetti in corso

OpenAIRE e OpenAIRE plus• un portale per

l’accesso ai risultatie ai dati dellaricerca finanziatanel 7° ProgrammaQuadro

• questionari/follow up http://www.openaire.eu/it

Page 22: Open data in una scienza sempre più data-intensive

EUDAT: progetto collaborativo europeo per un’infrastruttura comune per i dati

• evitare un nuovodigital divide:l’Europa deveprocedere allostesso passo

http://www.eudat.eu/

Open Research Data: progetti in corso

Page 23: Open data in una scienza sempre più data-intensive

Open Research Data: progetti in corso in Italia

smartData: progetto finanziato dal CINECA per gestire le nuove problematiche “BigData” ed HPC fornendo, accanto all'infrastruttura per la

produzione, l'archiviazione e la fruizione dei dati, un servizio di analisi avanzata sui dati prodotti dagli utenti che ne favorisce il riuso anche da parte di altre comunità scientifiche

Page 24: Open data in una scienza sempre più data-intensive

MAPPA - Metodologia Applicate alla Predittività del Potenziale Archeologico

• Il primo open digital archaeological archive italiano, che rende accessibili tutti i dati pubblici delle indagini archeologiche

• Uso di sistemi e procedure standardizzate per la redazione e la gestione dei dati archeologici

http://mappaproject.arch.unipi.it/

Open Research Data: progetti in corso in Italia

Page 25: Open data in una scienza sempre più data-intensive

Open Research Data: progetti in corso

DATACite, progettocollaborativo per ladescrizione standarddei datasets e la lorocitabilità via DOI

• per l’Italia: CRUI• altri riferimenti tecniciCODATA, http://www.codata.org/ Open Data Commons,

http://opendatacommons.org/ http://www.datacite.org/

Page 26: Open data in una scienza sempre più data-intensive

Indagine sulla gestionedei dati della ricerca in Italia

http://survey.caspur.it/index.php?sid=54849&lang=it

Indagine attualmentein corso stato dell’arte della produzione, gestione e conservazione dei dati della ricerca in Italia

Page 27: Open data in una scienza sempre più data-intensive

http://www.openaire.eu/it http://www.medoanet.eu/ [email protected]

Grazie per l’attenzione


Recommended