Cloud e big data

Post on 18-Nov-2014

447 views 2 download

description

Cloud & Big Data

transcript

CLOUD & BIG DATA

Diapositive a cura di: Lorenzo Nardo e Manuel Boscolo

CLOUD ALLA RISCOSSA!Negli ultimi anni tutte le maggiori aziende, i social network e il mobile per una maggiore praticità e risparmio di risorse proprie, si affidano ai servizi di Cloud Computing. Ed ormai tutto ciòche carichiamo nel web viene assorbito nella nuvola.

CLOUD BIG DATALa simbiosi di Big Data e Cloud Computing è inequivocabile, i dati e tutti i contenuti sensibili per le esigenze di chi ne richiede l’analisi oramai sono pressochè interamente ospitate nella nuvola che ora ha un valore inestimabile.

CLOUD COMPUTING

CLOUD COMPUTING

Cloud computing: è un insieme di tecnologie informatiche che permettono l'utilizzo di risorse, i data service e le funzionalità offerte in remoto.

CARATTERISTICHE CHIAVE

On-demand self-service

Broad network access

Resource pooling

Rapid elasticity

Measured Service

Il consumatore può unilateralmente disporre di capacità di calcolo.Le risorse di calcolo sono messe al servizio di tutti i consumatori.I Sistemi Cloud automaticamente controllano e ottimizzano le risorse.Le capacità sono disponibili in rete e sono accessibili tramite meccanismi standard.Le risorse possono essere rapidamente ed elasticamente incrementate per scalare la potenza e rapidamente ed elasticamente liberate per rilasciarla.

TRE ATTORI PRINCIPALI• Fornitore di servizi (il provider): offre servizi (server

virtuali, storage, applicazioni complete) generalmente secondo un modello "pay-per-use“ o free.

• Cliente amministratore: sceglie e configura i servizi offerti dal fornitore, generalmente offrendo un valore aggiunto come ad esempio applicazioni software.

• Cliente finale: utilizza i servizi opportunamente configurati dal cliente amministratore.

(In determinati casi d'uso il cliente amministratore e il cliente finale possono coincidere)

3 LIVELLI DI SERVIZI

Application

Platform

Infrastructure

SaaS (Software as a Service)

PaaS (Platform as a Service)

Iaas (Infrastructure as a Service)

I PRINCIPALI PLAYER

VANTAGGI vs

SVANTAGGI

VANTAGGI PER L’UTENTE• Nessun software da scaricare e installare sul proprio

computer.• Non si deve acquistare una licenza software. Ci si abbona

al servizio, che spesso è gratuito.• Nessuna necessità di upgrade del software quando

vengono aggiunte nuove funzioni o eliminati problemi esistenti.• Si può accedere ai propri documenti da ogni computer

connesso in rete.• È possibile condividere i documenti con altri utenti, senza

bisogno di un proprio server• Nessun problema in caso di crash del proprio computer: i documenti sono al sicuro sul server.

SVANTAGGI PER L’UTENTE• È necessaria una connessione internet con banda adeguata.

• Data security, tutti i dati risiedono su un server remoto, di cui non si ha il controllo (anche se si possono effettuare regolari

backup).

• Data privacy, i dati sono visibili ed utilizzabili da terzi che non sempre agisco in buona fede.

• Completezza funzionale. Attualmente, le funzioni fornite dalle applicazioni “cloud” sono meno complete di quelle fornite dai software tradizionali.

• Non è agevole lavorare off-line, per ricevere e trasmettere le modifiche occorre essere connessi.

VANTAGGI PER LE AZIENDEriduzione dei costi

• Eliminazione/riduzione delle infrastrutture software/hardware e dei costi del personale per la gestione dei sistemi.

• Riduzione/eliminazione dei costi fissi • Scalabilità dei servizi, tutto quello che serve, quando

serve, solo se serve.

• Costi “pay-per-use”

VANTAGGI PER LE AZIENDE

Taglio costi fissi

Es. scalabilità

migliori servizi

• Servizi sviluppati e gestiti dai migliori professionisti, con le migliori competenze.

• Servizi sempre aggiornati e in continua evoluzione.

• Servizi altamente flessibili.

VANTAGGI PER LE AZIENDE

SVANTAGGI PER LE AZIENDE• I dati risiedono su un server remoto, di cui si ha

scarso controllo, ne conseguono possibili problemi d’integrità dei dati. (es. caso Amazon)

• Più alto rischio di furto di dati e informazioni, non sempre tutelata della privacy. (es. Playstation Network)

• Servizi standardizzati, non sempre soddisfano a pieno le esigenze aziendali.

• Non è agevole lavorare off-line, per ricevere e trasmettere le modifiche occorre essere connessi.

IN FUTURO…

OBIETTIVI e SFIDE PER IL FUTURO• Incremento dei sistemi di sicurezza per la tutela

della privacy e per la salvaguardia dei dati.• Incremento delle collaborazioni tra le diverse

aziende fornitrici di servizi “Cloud”. • Incremento dei servizi in termini di quantità e

qualità (velocità, affidabilità, grado di personalizzazione).

• Crescita di nuove competenze.• Stabilire “regole” e “codici” comuni, adottabili

tra i diversi produttori.

CONCETTI DI BASE

“BIG DATA”

Definizione:

Big data è il termine per descrivere una raccolta di dataset così grande e complessa da richiedere strumenti differenti da quelli tradizionali, in tutte le fasi del processo: dall‘acquisizione, alla curation, passando per condivisione, analisi e visualizzazione.

Da Wikipedia, l'enciclopedia libera.

Terminologia• Un dataset (o data set) è una collezione

di dati.• Il Datacenter o Centro Elaborazione

Dati (CED) è l'unità organizzativa che coordina e mantiene le

apparecchiature ed i servizi di gestione dei dati.

Terminologia• Data curation: è la gestione dei dati al fine di

scoprire, recuperare, mantenere, aggiungere valore, permettere il riutilizzo dei dati, garantendone contemporaneamente l'autenticazione, l'archiviazione, la gestione e la preservazione.

A COSA SERVONO?

Perché utilizzare i Big Data?Il motivo principale è la possibilità di effettuare Business Analytics in contesti dove oggi non sarebbe possibile o lo sarebbe con tempi e costi inaccettabili.

Si pensi poi a Facebook, Linkedin, Twitter:

alcune tecnologie Big Data si sono sviluppate

proprio in ambito social network.

E il motivo è piuttosto evidente, visto che i Big Data applicati ai

social mettono nelle mani dei dipartimenti marketing potenti strumenti di analisi

su potenziali clienti finali.

Ambiti di utilizzo

• Sicurezza (lotta alla criminalità, prevenzione di disastri).

• Scienza (meteorologia, medicina).• Tecniche di marketing (individuazione dei

trend di vendita in particolari contesti).• Rilevazioni real-time (monitoraggi di sistemi

complessi).

ANALISI DEI BIG DATA

Una crescita esponenziale

L’utilizzo sempre più diffuso dei social media, e degli smartphones che raccolgono e generano dati costantemente, il crescente uso di Internet, così come l’utilizzo di sensori che misurano e monitorano ogni cosa, fa sì che il volume dei dati prodotti in tutto il mondo stia crescendo in modo vertiginoso.

Il 90% dei dati oggi esistenti sono stati generati negli ultimi 2 anni. Il ritmo con cui queste informazioni sono prodotte è talmente alto che ogni due giorni è creato un volume di dati pari alla quantità di informazioni generate dall’umanità intera fino al 2003.

Paradigma delle “V”

• VOLUME : quantità dei dati trattati• VELOCITA’ : l’estrazione di queste informazioni deve avvenire

velocemente, i dati devono essere utilizzabili prima che diventino inutili

• VARIETA’: i dati da trattare sono ETEROGENEI (testo, video, ricerche web, transazioni finanziarie, pagamenti con carta di credito, etc.)

• VARIABILITA’: (Valore/Veridicità) occorre contestualizzare il dato (da che ambito proviene? è indispensabile filtrarlo oppure no?)

• VIRALITA’: i Big Data stanno crescendo in maniera esponenziale nella rete e si espandono come un vero e proprio virus.

BIG DATA & PRIVACY

BIG DATA & PRIVACYEnormi banche dati, che possono anche essere

istituzionali, raccolgono un’infinità di dati sensibili che riguardano gli utenti della rete.

La semplice trasformazione in forma anonima delle informazioni raccolte non garantisce la loro protezione quando vengono elaborate, sono quindi allo studio sistemi alternativi.

Questi sistemi alternativi in genere fanno riferimento alla cosiddetta crittografia omomorfica che consente di eseguire calcoli su dati cifrati senza prima decrittarli.

La IBM sostiene chel'informatico Craig Gentry aveva sviluppato un sistema pratico, completamente omomorfico, già nel 2009, ma i critici hanno detto che la tecnologia era troppo complessa, lenta e poco pratica per un uso

effettivo sul cloud. Siamo quindi ancora in attesa…

BIG DATA & PRIVACY

BIG DATA & PRIVACYA volte, infatti, le informazione possono trapelare ed

essere usate al di fuori del loro ambito specifico come nello scandalo denominato “Datagate”…

Vedi : http://it.wikipedia.org/wiki/Datagate

SCENARI

CHI SFRUTTA I BIG DATA?Si può cominciare a parlare di Big Data quando la mole di dati

presa in considerazione è nell’ordine degli Zettabyte (miliardi di Terabyte).

Da considerare sono anche le agenzie governative come l’NSA(National Security Agency).

Ambito italianoIn Italia, quando si parla di “Big Data”, in realtà si

intendono Business Intelligence e Data Mining, data la ridotta quantità di dati da analizzare.

Esempi:• L’ultima edizione di Sanremo, 150 mila tweet durante la finale; un

volume che può essere racchiuso in 77 MB (Foglio Excel)• Analisi politiche sui tweet del corpo elettorale italiano (3,5M di italiani

hanno utilizzato Twitter durante la campagna elettorale) svolte con strumenti tradizionali.

IL FUTURO DEI BIG DATA

CONCLUSIONI

La grande sfida, per le aziende che stanno investendo sui big data, sembra essere la

• capacità di formulare domande intelligenti e• concorrere alla nascita di competenze in

grado di gestire le risposte.

La figura del data scientist sarà centrale nei prossimi anni.Sia matematico che Informatico, deve capire di statistica, saper usare un foglio excel ed aiutare l’azienda per la quale lavora a interpretare il presente per prevedere il

prossimo futuro. Non è una figura mistica ma un nuovo professionista, lo“scienziato dei dati”.

CONCLUSIONI

L'aumento esponenziale della conoscenza porta alla “preveggenza” e dalla somma delle parti si può comprendere il tutto; ma solo l’uomo può formulare delle ipotesi.

Chi meglio di altri riuscirà ad estrapolare e plasmare questa enorme quantità di dati a disposizione avrà un posto

privilegiato nel mercato di domani.

CONCLUSIONI

SITOGRAFIA• http://it.wikipedia.org/wiki/Big_data• http://blog.debiase.com/2013/05/che-cosa-pensereste-se-vi-

dicessero-che-in-italia-i-big-data-non-esistono/• http://www.beantech.it/blog/articoli/big-data-cosa-sono-e-

loro-utilizzo/• http://www.lescienze.it/news/2014/03/10/news/

privacy_big_data_crittografia_raccolta_dati-2044533/• http://www.linkiesta.it/cosa-fare-dei-big-data• http://www.rainews.it/dl/rainews/articoli/data-scientist-il-

lavoro-sexy-50712477-5a83-4682-8f73-522428eb3281.html