CLOUD & BIG DATA Diapositive a cura di: Lorenzo Nardo e Manuel Boscolo
Transcript
1. CLOUD & BIG DATA Diapositive a cura di: Lorenzo Nardo e
Manuel Boscolo
2. CLOUD ALLA RISCOSSA! Negli ultimi anni tutte le maggiori
aziende, i social network e il mobile per una maggiore praticit e
risparmio di risorse proprie, si affidano ai servizi di Cloud
Computing. Ed ormai tutto ci che carichiamo nel web viene assorbito
nella nuvola.
3. CLOUD BIG DATA La simbiosi di Big Data e Cloud Computing
inequivocabile, i dati e tutti i contenuti sensibili per le
esigenze di chi ne richiede lanalisi oramai sono pressoch
interamente ospitate nella nuvola che ora ha un valore
inestimabile.
4. CLOUD COMPUTING
5. CLOUD COMPUTING Cloud computing: un insieme di tecnologie
informatiche che permettono l'utilizzo di risorse, i data service e
le funzionalit offerte in remoto.
6. CARATTERISTICHE CHIAVE On-demand self- service Broad network
access Resourc e pooling Rapid elasticity Measure d Service Il
consumatore pu unilateralmente disporre di capacit di calcolo. Le
risorse di calcolo sono messe al servizio di tutti i consumatori. I
Sistemi Cloud automaticamente controllano e ottimizzano le risorse.
Le capacit sono disponibili in rete e sono accessibili tramite
meccanismi standard. Le risorse possono essere rapidamente ed
elasticamente incrementate per scalare la potenza e rapidamente ed
elasticamente liberate per rilasciarla.
7. TRE ATTORI PRINCIPALI Fornitore di servizi (il provider):
offre servizi (server virtuali, storage, applicazioni complete)
generalmente secondo un modello "pay-per-use o free. Cliente
amministratore: sceglie e configura i servizi offerti dal
fornitore, generalmente offrendo un valore aggiunto come ad esempio
applicazioni software. Cliente finale: utilizza i servizi
opportunamente configurati dal cliente amministratore. (In
determinati casi d'uso il cliente amministratore e il cliente
finale possono coincidere)
8. 3 LIVELLI DI SERVIZI Application Platform Infrastructure
SaaS (Software as a Service) PaaS (Platform as a Service) Iaas
(Infrastructure as a Service)
9. I PRINCIPALI PLAYER
10. VANTAGGI vs SVANTAGGI
11. VANTAGGI PER LUTENTE Nessun software da scaricare e
installare sul proprio computer. Non si deve acquistare una licenza
software. Ci si abbona al servizio, che spesso gratuito. Nessuna
necessit di upgrade del software quando vengono aggiunte nuove
funzioni o eliminati problemi esistenti. Si pu accedere ai propri
documenti da ogni computer connesso in rete. possibile condividere
i documenti con altri utenti, senza bisogno di un proprio server
Nessun problema in caso di crash del proprio computer: i documenti
sono al sicuro sul server.
12. SVANTAGGI PER LUTENTE necessaria una connessione internet
con banda adeguata. Data security, tutti i dati risiedono su un
server remoto, di cui non si ha il controllo (anche se si possono
effettuare regolari backup). Data privacy, i dati sono visibili ed
utilizzabili da terzi che non sempre agisco in buona fede.
Completezza funzionale. Attualmente, le funzioni fornite dalle
applicazioni cloud sono meno complete di quelle fornite dai
software tradizionali. Non agevole lavorare off-line, per ricevere
e trasmettere le modifiche occorre essere connessi.
13. VANTAGGI PER LE AZIENDE riduzione dei costi
Eliminazione/riduzione delle infrastrutture software/hardware e dei
costi del personale per la gestione dei sistemi.
Riduzione/eliminazione dei costi fissi Scalabilit dei servizi,
tutto quello che serve, quando serve, solo se serve. Costi
pay-per-use
14. VANTAGGI PER LE AZIENDE Taglio costi fissi Es.
scalabilit
15. migliori servizi Servizi sviluppati e gestiti dai migliori
professionisti, con le migliori competenze. Servizi sempre
aggiornati e in continua evoluzione. Servizi altamente flessibili.
VANTAGGI PER LE AZIENDE
16. SVANTAGGI PER LE AZIENDE I dati risiedono su un server
remoto, di cui si ha scarso controllo, ne conseguono possibili
problemi dintegrit dei dati. (es. caso Amazon) Pi alto rischio di
furto di dati e informazioni, non sempre tutelata della privacy.
(es. Playstation Network) Servizi standardizzati, non sempre
soddisfano a pieno le esigenze aziendali. Non agevole lavorare
off-line, per ricevere e trasmettere le modifiche occorre essere
connessi.
17. IN FUTURO
18. OBIETTIVI e SFIDE PER IL FUTURO Incremento dei sistemi di
sicurezza per la tutela della privacy e per la salvaguardia dei
dati. Incremento delle collaborazioni tra le diverse aziende
fornitrici di servizi Cloud. Incremento dei servizi in termini di
quantit e qualit (velocit, affidabilit, grado di
personalizzazione). Crescita di nuove competenze. Stabilire regole
e codici comuni, adottabili tra i diversi produttori.
19. CONCETTI DI BASE
20. BIGDATA Definizione: Big data il termine per descrivere una
raccolta di dataset cos grande e complessa da richiedere strumenti
differenti da quelli tradizionali, in tutte le fasi del processo:
dallacquisizione, alla curation, passando per condivisione, analisi
e visualizzazione. Da Wikipedia, l'enciclopedia libera.
21. Terminologia Un dataset (o data set) una collezione di
dati. Il Datacenter o Centro Elaborazione Dati (CED) l'unit
organizzativa che coordina e mantiene le apparecchiature ed i
servizi di gestione dei dati.
22. Terminologia Data curation: la gestione dei dati al fine di
scoprire, recuperare, mantenere, aggiungere valore, permettere il
riutilizzo dei dati, garantendone contemporaneamente
l'autenticazione, l'archiviazione, la gestione e la
preservazione.
23. A COSA SERVONO?
24. Perch utilizzare i Big Data? Il motivo principale la
possibilit di effettuare Business Analytics in contesti dove oggi
non sarebbe possibile o lo sarebbe con tempi e costi inaccettabili.
Si pensi poi a Facebook, Linkedin, Twitter: alcune tecnologie Big
Data si sono sviluppate proprio in ambito social network. E il
motivo piuttosto evidente, visto che i Big Data applicati ai social
mettono nelle mani dei dipartimenti marketing potenti strumenti di
analisi su potenziali clienti finali.
25. Ambiti di utilizzo Sicurezza (lotta alla criminalit,
prevenzione di disastri). Scienza (meteorologia, medicina).
Tecniche di marketing (individuazione dei trend di vendita in
particolari contesti). Rilevazioni real-time (monitoraggi di
sistemi complessi).
26. ANALISI DEI BIG DATA
27. Una crescita esponenziale Lutilizzo sempre pi diffuso dei
social media, e degli smartphones che raccolgono e generano dati
costantemente, il crescente uso di Internet, cos come lutilizzo di
sensori che misurano e monitorano ogni cosa, fa s che il volume dei
dati prodotti in tutto il mondo stia crescendo in modo vertiginoso.
Il 90% dei dati oggi esistenti sono stati generati negli ultimi 2
anni. Il ritmo con cui queste informazioni sono prodotte talmente
alto che ogni due giorni creato un volume di dati pari alla quantit
di informazioni generate dallumanit intera fino al 2003.
28. Paradigma delle V VOLUME : quantit dei dati trattati
VELOCITA : lestrazione di queste informazioni deve avvenire
velocemente, i dati devono essere utilizzabili prima che diventino
inutili VARIETA: i dati da trattare sono ETEROGENEI (testo, video,
ricerche web, transazioni finanziarie, pagamenti con carta di
credito, etc.) VARIABILITA: (Valore/Veridicit) occorre
contestualizzare il dato (da che ambito proviene? indispensabile
filtrarlo oppure no?) VIRALITA: i Big Data stanno crescendo in
maniera esponenziale nella rete e si espandono come un vero e
proprio virus.
29. BIG DATA & PRIVACY
30. BIG DATA & PRIVACY Enormi banche dati, che possono
anche essere istituzionali, raccolgono uninfinit di dati sensibili
che riguardano gli utenti della rete. La semplice trasformazione in
forma anonima delle informazioni raccolte non garantisce la loro
protezione quando vengono elaborate, sono quindi allo studio
sistemi alternativi.
31. Questi sistemi alternativi in genere fanno riferimento alla
cosiddetta crittografia omomorfica che consente di eseguire calcoli
su dati cifrati senza prima decrittarli. La IBM sostiene che
l'informatico Craig Gentry aveva sviluppato un sistema pratico,
completamente omomorfico, gi nel 2009, ma i critici hanno detto che
la tecnologia era troppo complessa, lenta e poco pratica per un uso
effettivo sul cloud. Siamo quindi ancora in attesa BIG DATA &
PRIVACY
32. BIG DATA & PRIVACY A volte, infatti, le informazione
possono trapelare ed essere usate al di fuori del loro ambito
specifico come nello scandalo denominato Datagate Vedi :
http://it.wikipedia.org/wiki/Datagate
33. SCENARI
34. CHI SFRUTTA I BIG DATA? Si pu cominciare a parlare di Big
Data quando la mole di dati presa in considerazione nellordine
degli Zettabyte (miliardi di Terabyte). Da considerare sono anche
le agenzie governative come lNSA(National Security Agency).
35. Ambito italiano In Italia, quando si parla di Big Data, in
realt si intendono Business Intelligence e Data Mining, data la
ridotta quantit di dati da analizzare. Esempi: Lultima edizione di
Sanremo, 150 mila tweet durante la finale; un volume che pu essere
racchiuso in 77 MB (Foglio Excel) Analisi politiche sui tweet del
corpo elettorale italiano (3,5M di italiani hanno utilizzato
Twitter durante la campagna elettorale) svolte con strumenti
tradizionali.
36. IL FUTURO DEI BIG DATA
37. CONCLUSIONI La grande sfida, per le aziende che stanno
investendo sui big data, sembra essere la capacit di formulare
domande intelligenti e concorrere alla nascita di competenze in
grado di gestire le risposte.
38. La figura del data scientist sar centrale nei prossimi
anni. Sia matematico che Informatico, deve capire di statistica,
saper usare un foglio excel ed aiutare lazienda per la quale lavora
a interpretare il presente per prevedere il prossimo futuro. Non
una figura mistica ma un nuovo professionista, lo scienziato dei
dati. CONCLUSIONI
39. L'aumento esponenziale della conoscenza porta alla
preveggenza e dalla somma delle parti si pu comprendere il tutto;
ma solo luomo pu formulare delle ipotesi. Chi meglio di altri
riuscir ad estrapolare e plasmare questa enorme quantit di dati a
disposizione avr un posto privilegiato nel mercato di domani.
CONCLUSIONI