Date post: | 08-Aug-2015 |
Category: |
Technology |
Upload: | lorenzo-ridi |
View: | 114 times |
Download: | 1 times |
Business Intelligence
La Business Intelligence è un processo di trasformazione di dati e informazioni in conoscenza, utile ad ottenere valutazioni e stime riguardo al contesto aziendale proprio e del mercato cui si partecipa, al fine di incrementare il proprio vantaggio competitivo.
Small VolumeQuantità limitate
(Megabytes/Gigabytes)di dati da analizzare.
Batch processingOperazioni schedulate che
analizzano ogni volta tutti i dati disponibili. I risultati sono
disponibili dopo ore/giorni.
Low varietyRelativa omogeneità nel formato e nella tipologia dei dati (log, record
database)
Big Data
“Big Data is high-volume, high-velocity and high-variety information assets that demand cost-effective, innovative forms of information processing for enhanced insight and decision making.”
(Doug Laney, Gartner)
High VolumeGrandi quantità
(Terabytes/Petabytes)di dati da analizzare
High VelocityElaborazione di centinaia di input al secondo. Visualizzazione near real-time dei risultati aggregati.
High VarietyMolteplici formati e tipi di informazione (log, record
database, Documenti, Dati geografici, Dati social)
Nuove sorgenti di dati per il business
SocialMedia
GeographicalData
VideoPlatforms
WebAnalytics
Internet ofThings
Not your father’s BI
Maggiori quantità di dati
Maggior varietà dei dati
Analisi near-real-time
Le piattaforme on-premise non sostengono aumenti di carico (o lo fanno con costi proibitivi)
Servono nuovi strumenti cloud flessibili e performanti
Who needs Big Data?
Qual è il target?Aziende che hanno necessità di orientare il loro business sulla base dei dati attualmente prodotti (e finora inutilizzati).
● Non solo grandi aziende:○ la caratteristica Cloud dell’architettura la rende interessante anche per SMB (non ci
sono costi fissi);○ è però più facile coinvolgerle se hanno già conoscenze di BI.
● Non solo Big Data:○ non necessariamente l’architettura deve gestire un flusso di Terabytes di dati;○ il sistema è progettato per sostenere la crescita del business (o eventuali picchi
momentanei di carico).
La soluzione Noovle
Un’architettura che integra in modo efficace i più affermati strumenti per il Big Data● Talend, Hadoop, MapReduce, Big Query, BIME, Tableau.
Interamente operativa sul Cloud di Google● Big Data at the speed of Google: App Engine, Compute Engine, Cloud
Storage, Big Query● Pay-what-you-use: nessun costo fisso o di manutenzione
Facilmente configurabile (o ri-configurabile) secondo le esigenze del business, ovunque, in ogni momento● Interfacce di amministrazione Web facili da usare e mobile-friendly● Facile configurazione e condivisione delle interfacce di reporting (BIME,
Tableau)
Google Cloud Platform
Compute
App Engine
Compute Engine
Storage
Cloud Datastore
Cloud Storage
Cloud SQL
Big Data & Services
Big Query
Cloud Endpoints
Google-tested e Business Ready
Google Cloud PlatformGoogle App Engine
Google App Engine permette di eseguire applicazioni Web sull’infrastruttura di Google.
● Le applicazioni App Engine sono facili da realizzare, facili da mantenere e facili da espandere insieme alle esigenze di traffico e storage dati.
● Con App Engine, non ci sono server da mantenere: basta caricare l’applicazione, ed è già pronta per servire gli utenti.
Google Cloud PlatformGoogle Cloud Datastore
Google Cloud Datastore è la soluzione di storage noSQL di Google.
● Scalabilità infinita● Accesso Schema-less● Capacità SQL-like● Accesso HTTP via JSON o Protocol Buffer● Transazioni ACID● Ridondanza built-in
Google Cloud PlatformGoogle Cloud Storage
Google Cloud Storage è la soluzione di file storage di Google Cloud Platform.
● Versionamento● Infinita capacità di storage● Trasferimenti ripristinabili● Object Change Notifications● Durable Reduced Availability● SLA / Supporto
Google Cloud PlatformGoogle BigQuery
Google BigQuery è la soluzione Big Data Analytics di Google Cloud Platform.
● Query interattive o batch (“behind the scenes”)
● Semplice importazione dei dati: modalità batch o streaming
● Costi contenuti e trasparenti● Potenti strumenti di visualizzazione e
ricerca
GigyaConnected Consumer Management Suite
Gigya è una suite di strumenti che consente di connettersi con i propri clienti, controllare i loro dati e guidare le scelte di social marketing.
● Connessione agli utenti tramite i servizi di Social Login
● Recupero e normalizzazione dei dati dei clienti (Identity Storage)
● Creazione di un’esperienza social on-site.
Google AnalyticsPiattaforma di Web Analytics
Google Analytics è una piattaforma per la generazione di statistiche Web dettagliate.
● Analisi delle interazioni degli utenti con siti Web e/o applicazioni mobile.
● Creazione di reportistiche personalizzate
● Gestione di complesse campagne di marketing
● Analisi unificata monitorando il traffico di diversi siti in simultanea.
TalendPiattaforma ETL (Extract-Transform-Load)
Talend è una piattaforma di ETL che consente di estrarre, aggregare e trasformare i dati provenienti dalla propria infrastruttura IT.
● Oltre 800 connettori per acquisire dati da qualunque sorgente (DB, ERP etc.)
● Potente gestione dei metadati.● Flessibilità nel deployment in
ambienti di produzione robusti.
MapRDistribuzione Enterprise Apache™ Hadoop®
MapR è una distribuzione di livello Enterprise della piattaforma Apache™ Hadoop®, con supporto per oltre 20 strumenti open source per il Big Data.
● Inizializza e gestisce un cluster Hadoop in modo semplice
● Totalmente integrato con Google Compute Engine.
EgonData Quality Solution
Egon è una suite di strumenti, thesaurus, metodologie e conoscenze in grado di operare a 360° sui temi della qualità dati e trattamento delle informazioni internazionali.
● Normalizzazione indirizzi● Geocodifica● Deduplica● Normalizzazione dati personali
Geocoding &Mapping
NEW APPLICATIONSENTERPRISEAPPLICATIONS
CHANNELS
WEB BASEDAPPLICATIONS
MARKET
LEGACY
Data Validation & Postal validation
Data Management & Data Enrichment
Duplicate check & Data integration
BIMECloud Analytics
Bime è uno strumento di Data Analytics as-a-Service: consente di creare e condividere dashboard di visualizzazione personalizzate.
● Connessione con sorgenti dati cloud e on-premise.
● Analisi di complesse metriche di business.
● Condivisione delle dashboard via email o su Web
JasperReportsPixel-perfect reporting
JasperReports è una libreria di reporting che produce documenti pixel-perfect in una grande quantità di formati: PDF, HTML, Excel, OpenOffice, Word.
GeoCMSContent Management System Geografico
GeoCMS è una piattaforma per la ricerca e la gestione in totale autonomia di informazioni geolocalizzate.
● Locator: fatti trovare dai tuoi clienti● GeoMarketing: Analisi dei dati sul
territorio● OpenData: pubblicazione dei dati
territoriali in totale autonomia
Case study (1/3)Trasformazione, storage e visualizzazione real-time di dati di log
● Gestione dei log di transazioni su dispositivi mobile per azienda di Mobile Commerce (>15M di transazioni al giorno a regime).
● Trasformazione (Google App Engine) e analisi (in Google Analytics) di log prodotti da operazioni effettuate su dispositivi mobili.
● Storage dei dati su piattaforma Google Big Query.● Realizzazione di interfacce di reporting e monitoraggio near-real-time con BIME.
>15Mreq/day
Case study (2/3)Soluzione DWH Cloud
ObiettivoRealizzazione di dashboard interattive real-time sui dati provenienti dal Data Warehouse on-premise di una grande compagnia assicurativa.
Challenges● Alto numero di accessi concorrenti
alle dashboard (la soluzione on-premise non riesce a gestire il carico).
● Personalizzazione delle dashboard sulla base dei profili utente definiti sulla piattaforma Google Apps in uso nell’azienda.
DWH
data
users
Utenti Google Apps
Profilazione Dashboard BIME
On-
prem
ise
Clou
d
Case study (3/3)Generazione DB anagrafica e DWH da flussi dati retailer
ObiettivoGestione dei flussi dati anagrafico (carte loyalty) e giornaliero (transazioni, venduto) per un importante azienda nel settore food.Deduplica, normalizzazione e storage dei dati, generazione di un DWH su piattaforma Big Query, calcolo dei KPI.
FlussiAnagrafica
Flussigiornalieri
(transazioni)Analisi dati giornalieri
Deduplica anagrafiche
StorageCSV/JSON DWH
ElaborazioneKPI