+ All Categories
Home > Documents > Big Data : volume di dati livelli variabili di complessità generati a velocità differenti non...

Big Data : volume di dati livelli variabili di complessità generati a velocità differenti non...

Date post: 02-May-2015
Category:
Upload: noemi-sala
View: 212 times
Download: 0 times
Share this document with a friend
38
Big Data : volume di dati livelli variabili di complessità generati a velocità differenti non elaborabili con tecnologie tradizionali
Transcript
Page 1: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

Big Data : volume di dati livelli variabili di complessità generati a velocità differenti non elaborabili con tecnologie tradizionali

Page 2: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

LE TRE V

Volume: gestione di moltissimi dati

Velocità: gestione in tempo reale

Varietà: fonti e tipologie diverse

Page 3: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

DUE V IN PIÙ

Veridicità: attendibilità dei dati raccolti

Volatilità: tempo di validità dei dati

Page 4: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

PERCHÉ UTILIZZARE I BIG DATA

Opportunità di conoscenza Capire il mondo reale Opportunità commerciali

Page 5: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

DATI NON STRUTTURATI

Non possiedono un modello prestabilito Non sono organizzati Possono causare ambiguità Sono costituiti da:

› Testo› Audio› Video› Flussi di click› …

Page 6: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

RACCOLTA DI DATI ORDINARI

Raccolta di informazioni Classificazione in categorie prestabilite Organizzazione secondo uno schema preciso Memorizzazione fisica dei dati

Page 7: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

ELABORAZIONE DEI BIG DATA

Collezione e memorizzazione dei dati

Classificazione per categorie

Trasformazione dei dati

Generazione dei risultati trovati

Page 8: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

ANALISI DEI COMPORTAMENTI

SOCIALI

Page 9: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

ANALISI DEI SENTIMENTI

ASCOLTARE

CAPIRE

RIELABORARE

VISUALIZZARE

Page 10: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

HEDONOMETER

Script pattern matching:› individuare tokens› stabilire il pattern delle frequenze in un testo

Set di parole:› Google books› Twitter› Canzoni 1960/2007› New York Times 1987/2007

Grado di felicitá:› Amazon’s Mechanical Turk

http://www.hedonometer.org/index.html

Page 11: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

havg(T) = livello di felicitá della frase T

havg (wi) = felicitá di ciascuna parola

Fi = frequenza della i-esima parola

Page 12: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

TWITTER ANALYSIS

484 miloni di tweets 9.8 milioni di persone Luglio 2009 e Gennaio 2012 54 piú larghe cittá della Gran Bretagna

Parole cercate: PAURA, GIOIA, RABBIA, TRISTEZZA

PAPER: <<Big Data Analysis of News and Social Media Content>>Ilias Flaounas, Thomas Lansdall-Welfare, Nello Cristianini Intelligent Systems Laboratory, University of Bristol

Page 13: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

GRAFICO DELLA GIOIA

GRAFICO

DELLA RABBIA

TIMELINE GENERATE

Page 14: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

GRAFICO SETTIMANA

LE

GRAFICO GIORNALIER

O

PAPER: <<Temporal patterns of happiness in a global social network: Hedonometrics and Twitter>> P. Sheridan Dodds, K. Decker Harris, I. Kloumann, Center of complex systems of the university of Vermont

Page 15: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

VOICES FROM THE BLOG

http://www.blogsvoices.unimi.it

Page 16: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

LIMITAZIONI

AMBIGUITÁ SENSI MULTIPLI TONO SARCASMO SOPRANNOMI IMMAGINI

Page 17: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

CONSIDERAZIONI

«Il Big Data ha avuto un impatto nello studio del comportamento umano simile all’introduzione del microscopio o del telescopio nei campi della biologia e dell’astronomia»

Zeynep Tufekci “Big Questions for Social Media Big Data”

Page 18: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

BIG DATA E

LE AZIENDE

Page 19: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

BIG DATA vs MARKETING

Big Data aiutano a comprendere le dinamiche del proprio mercato di riferimento

Per riuscire a trarne il massimo bisogna sodisfare alcuni requisiti:› Nuova mentalità› Leadership› Team di ricerca› Gestione dei dati

Page 20: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

BIG DATA vs ROI

Big Data + Marketing = ROI enorme

¿RisultatoOperativo

Capitale investito nettooperatvo

Page 21: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

Perché le aziende ti conoscono

meglio della tua famiglia

Attraverso un’analisi dei dati il negozio Target è riuscito a scoprire che una ragazza era incinta, ancora prima che lo sapessero i suoi genitori.

Fedelity Card

Informazioni Personali

+Informazioni di

Vendita

Big Data

Page 22: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

AMAZON 152 milioni di conti cliente

Ricerche+

Acquisti+

Desideri

Big DataPubblicit

à

Amazon Web Services:• Raccolta• Archiviazione• Calcolo• Condivisione

Page 23: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

AMAZON CLOUD DRIVE

5 GB gratis 1.000 GB massimo 2 GB trasferimento massimo per file $ 0.50 per GB Online software Cloud Player

Page 24: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

SPEDIZIONE ANTICIPATA

Obiettivi: Restringere tempi di attesa Predire gli ordini del cliente

« Se non lo vuoi, te lo regaliamo! »

Page 25: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

SPEDIZIONE CON DRONIAmazon Prime Air:

15 KM massimo 2 KG massimo Spediti 30/60 minuti dall’ordine Ricevuti nella stessa giornata dell’ordine

Page 26: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

Servizi per: Utenti:

› Motore di ricerca› Chrome› Gmail

Aziende:› Pubblicità con testo› Pubblicità multimediale

Page 27: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

GOOGLE NOW OGGI

Schede: Traffico Meteo Sport Attività Appuntamenti

Trasporto pubblico Attrazioni nelle vicinanze Amici nelle vicinanze Notizie

Page 28: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

GOOGLE NOW DOMANI Salvataggio posizione parcheggio Conto alla rovescia Promemoria pagamento bollette

DATI GOOGLE NOW

Cronologia delle posizioni GPS Gmail Calendario Contatti Ricerche Google

Page 29: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

RICERCA TRAMITE IMMAGINE

Ricerca per: Trascinamento Caricamento URL Click su un’immagine Web

Risultati: Immagine stessa Immagini simili Siti web contenenti immagini

simili

Page 30: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

Caratteristiche: 80 lingue traduzione automatica statistica possibilità di cambiare il testo tradotto

scegliendo alternative da un elenco esistente

News: « Improve this translation »

Page 31: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

Google Translate : App

immissione vocale fotocamera scrittura a mano

libera modalità offline

Page 32: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

INFORMATION RETRIEVAL

Reperimento delle informazioni:È l'insieme delle tecniche utilizzate per gestire oggetti contenenti informazioni

Page 33: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

INFORMATION RETRIEVAL

Permette di:

Rappresentare Memorizzare Organizzare

Page 34: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

INFORMATION RETRIEVAL

Soddisfa: Il bisogno informativo

dell’utente

Gestistione: Ricerca di informazioni,

non di dati

Possibile restituzione di risultati non pertinenti

Page 35: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

È un movimento che promuove il non utilizzo del modello relazionale.

Identifica: un'ampia varietà di tecnologie legate ai database

Risponde: al crescente volume di dati memorizzati sulla Rete alle modalità e alla frequenza di accesso ai dati alla necessitá di performance e di potenza di

calcolo

Page 36: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

NOSQL I PUNTI DI FORZA

Scalabilitá

Prestazioni migliori

Schemi dinamici

Facile da utilizzare

Flessibile

Page 37: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

È un framework che supporta applicazioni distribuite con elevato accesso ai dati

Permette di lavorare con migliaia di nodi e petabyte di dati

Page 38: Big Data :  volume di dati  livelli variabili di complessità  generati a velocità differenti  non elaborabili con tecnologie tradizionali.

Yahoo! è il più grande contributore a questo progetto

È usato anche da: AOL, Ebay, Facebook, IBM, ImageShack, Joost, Linkedin, Spotify, The New York Times e Twitter


Recommended