Post on 03-Dec-2014
description
transcript
Continuità Operativa & Disaster Ricovery
Comune di Alzano Lombardo
IL CASO PRATICO
Bergamo Giugno 2013
2
Definizioni
CONTINUITÀ OPERATIVA (CO)l’insieme delle attività e delle politiche adottate per ottemperare all’obbligo di assicurare la continuità nel funzionamento dell’organizzazione; è parte integrante dei processi e delle politiche di sicurezza di un’organizzazione.
CONTINUITÀ OPERATIVA ICT la capacità di un organizzazione di adottare, attraverso accorgimenti, procedure e soluzioni tecnico-organizzative, misure di reazione e risposta ad eventi imprevisti che possono compromettere, anche parzialmente, all’interno o all’esterno dell’organizzazione, il normale funzionamento dei servizi ICT utilizzati per lo svolgimento delle funzioni istituzionali.
3
Definizioni
DISASTER RECOVERY (DR)
nell’ottica dell’art. 50 bis del CAD, l’insieme delle misure tecniche e organizzative adottate per assicurare all’organizzazione il funzionamento del centro elaborazione dati e delle procedure e applicazioni informatiche dell’organizzazione stessa, in siti alternativi a quelli primari/di produzione, a fronte di eventi che provochino, o possano provocare, indisponibilità prolungate.
4
Gestione del rischio
Il processo di gestione del rischio
5
Mappatura settori/servizi
SETTORI/SERVIZI
Area 1 – AFFARI GENERALI Gestione servizi anagrafici
Gestione servizi stato civile
Gestione servizi elettorali
Gestione relazioni col pubblico
…
Area 2 – FINANZIARIA-PROGRAMMAZIONE E BILANCIO
Area 3 - URBANISTICA
Area 4 – LAVORI PUBBLICI
Area 5 – SERVIZI ALLA PERSONA
Area 6 – POLIZIA LOCALE
Area 7 – EDILIZIA PRIVATA
6
Identificazione delle risorse
RISORSE
DATI CARTACEI
DATI ELETTRONICI
DATABASE
POSTA
FILE SYSTEM
HARDWARE
INFRASTRUTTURA FISICA
RETE
RISORSA UMANA
SISTEMI OPERATIVI E SOFTWARE
7
Relazioni di dipendenza fra risorse
8
9
Una volta mappati i processi occorre definire gli eventi cui sono esposti che potrebbero compromettere in maniera grave la continuità operativa e conseguentemente l’erogazione del servizio.
Identificazione di eventi anomali e scenari di rischio
Va ripetuto per ogni associazione Evento/Risorsa/Servizio
Risorse Eventi (P)P = probabilità di accadimento
10
11
Allagamenti/esondazioni/ alluvioniTerremotoFrane/smottamenti/crolli
Incendi
Fulmini - Interruzione energia elettrica
Guasto/malfunzionamento sistemi IT/rete Comunale
Negligenza grave dei dipendenti - Epidemie
Interruzione servizi di telecomunicazione (fonia e dati)
Furto - Attacchi esterni tramite reti informatiche
Eventi anomali
12
Scenari di rischio
1 - Malfunzionamento dei sistemi, delle applicazioni e delle infrastrutture
2 - Attacchi o eventi naturali di tipo accidentale
3 - Disastro: l’effetto di un evento improvviso che ha come impatto gravi e prolungati danni e/o perdite per l’amministrazione.
Definizione MTPD, RTO RPO processi critici
MTPD - Tempo massimo entro il quale l’area/servizio deve essere in grado di svolgere nuovamente tutte le sue funzioni
RTO – Tempo entro cui l’area/servizio deve necessariamente ripartire ad un livello minimo (ripartenza in emergenza)
RPO – Perdita dati tollerata: massimo tempo intercorso tra la produzione di un dato e la sua messa in sicurezza; fornisce la misura della massima quantità di dati che il sistema può perdere a causa di guasto improvviso 13
14
In ambito Continuità
Operativa/DR tutti i
SERVIZI erogati all’utente
dall’amministrazione sono
PROCESSI CRITICI
15
GENERALE
Dati generali
Nome Amministrazione COMUNE DI ALZANO LOMBARDO
Sede centrale ( città) ALZANO LOMBARDO
Settore di attività Comuni
Unità Organizzativa AREA 1 - AFFARI GENERALI
Responsabile CO/DR Vincenzo Camizzi
AOO (Area Org.Omog.)/ENTE
Indirizzo PEC per le comunicazioni protocollo@pec.comune.alzano.bg.it
Data compilazione 27/03/2013
Codice fiscale 00220080162
Autovalutazione dei Servizi demografici
http://apps.digitpa.gov.it/Autovalutazione/web/autovalutazione.php
16
SERVIZIOTipologia di servizio Nome servizio SERVIZI DEMOGRAFICITipologia di utenza eterogeneaTipo di dati trattati amministrativiL'interruzione blocca un altro servizio noModalità prevalente di interazione con gli utenti sportelloGiorni alla settimana nei quali viene erogato il servizio cinque giorni su setteOre al giorno nelle quali viene erogato il servizio fino a 6 ore al giornoSono presenti procedure alternative sìE' possibile recuperare la mancata acquisizione dei dati sìE' necessario recuperare i dati non acquisiti sìL'interruzione determina un immediato disagio agli utenti sìPrincipale danno per l'Amministrazione inadempienza amministrativaLivello di danno per l'Amministrazione medioPrincipale tipo di danno per l'utente finale inadempienza amministrativaLivello di danno per l'utente finale medioTempo massimo tollerabile tra la produzione di un dato e il suo salvataggio (RPO) 1 giorno
Tempo massimo tollerabile di indisponibilità del servizio (RTO) 1 giorno Indice di criticità del servizio 3
17
ORGANIZZAZIONEComplessità organizzativa dell'Amministrazione o della AOO che eroga il servizioNumero di Unità Organizzative 1Numero di sedi 1Dimensione territoriale comunaleNumero dei responsabili privacy 1Numero dei trattamenti censiti nel DPS 1-5Numerosità degli addetti tramite i quali vengono erogati i servizi 1-10
Numerosità degli utenti esterni 10.001-100.000
Indice di criticità dell'organizzazione 2
18
PAGINA TECNOLOGIATecnologia dell'Amministrazione o della AOO che eroga il servizioPresenza di un dipartimento IT InternoNumerosità addetti IT 1-5Architettura elaborativa MistaArchitettura applicativa Client/serverNumero di server utilizzati dal servizio 4-10Numero di postazioni di lavoro 1-10Numero degli archivi utilizzati dal servizio 1-100Istanze di DB usate dal servizio 1Dimensione totale degli archivi usati dal servizio 11-100 Gbyte
Indice di criticità della tecnologia 3
19
DATI DI SINTESIRiepilogo degli indici di criticità
Direttrice ValoreServizio 3Organizzazione 2Tecnologia 3Indice complessivo di criticità 3Valutazione complessiva Classe di criticità risultante MediaSoluzione tecnologica minima Tier 3
Tier 3: il trasferimento dei dati dal sito primario e quello di DR avviene attraverso un collegamento di rete tra i due siti. Questa soluzione, che può prevedere tempi di ripristino più veloci rispetto ai Tier recedenti, rende necessario dotarsi di collegamenti di rete con adeguati parametri di disponibilità, velocità di trasferimento e sicurezza (sia della linea, sia delle caratteristiche dipendenti dalla quantità di dati da trasportare).
Servizio
OrganizzazioneTecnologia
012345678910
3
23
20
Le soluzioni tecnologiche (TIER)
21
Disegno struttura IT
Backup locale
Solo macchine fisiche
Medesima attività non ridondata
Impatto pc utenti su linea comunale
Alcuni pc critici
22
Struttura IT reingegnerizzata
23
SCENARIO 1- MALFUNZIONAMENTO DEI SISTEMI, DELLE APPLICAZIONI E DELLE INFRASTRUTTURE: GUASTO GRAVE AI PC
PCSoluzione Tecnica: ZERO
CLIENT
Con muletto a disposizione
Con Zero Client a disposizione
tempo di posizionamento e riconfigurazione : 2-4h
tempo di assegnazione a risorsa e posizionamento: 15 min
Senza muletto a disposizione
Senza Zero Client a disposizione
tempo acquisto: 3-5 gg tempo acquisto: 3-5 gg
tempo configurazione: 1gtempo di inserimento in rete: 15 min
24
SCENARIO 1- MALFUNZIONAMENTO DEI SISTEMI, DELLE APPLICAZIONI E DELLE INFRASTRUTTURE: GUASTO GRAVE AI PC
PCSoluzione Tecnica: ZERO
CLIENT
TRANSITORIO/CONTINUITÀ
SERVIZIO SOSPESO
Accessibilità totale alla macchina virtuale da qualunque postazione attraverso l'uso di remote desktop
25
26
SCENARIO 2 - ATTACCHI O EVENTI NATURALI DI TIPO ACCIDENTALE: FULMINE CAUSA UN GUASTO GRAVE AD UN SERVER
SERVERSoluzione Tecnica:
STRUTTURA IT REINGEGNERIZZATA
Con server/risorse a disposizione
tempo di caricamento dei servizi offerti dal server: 8h
tempo di configurazione e restore dati: 2h
Senza server/risorse a disposizione
tempo acquisto: 1-5 gg tempo acquisto: 1-5 gg
tempo configurazione e restore dati: 1g
tempo di configurazione e restore dati: 2h
27
SCENARIO 2 - ATTACCHI O EVENTI NATURALI DI TIPO ACCIDENTALE: FULMINE CAUSA UN GUASTO GRAVE AD UN SERVER
SERVERSoluzione Tecnica:
STRUTTURA IT REINGEGNERIZZATA
TRANSITORIO/CONTINUITÀ
SERVIZIO SOSPESO
Accensione (anche in automatico) delle macchine virtuali sul server integro e accessibilità totale ai servizi con un degrado delle prestazioni.
28
SCENARIO 3 -DISASTRO: l’effetto di un evento improvviso che ha come impatto gravi e prolungati danni e/o perdite per l’organizzazione
STRUTTURA ITSoluzione Tecnologica:
STRUTTURA IT REINGEGNERIZZATA
Backup integroRecupero delle macchine virtuali dal sito remoto di
DR
Tempo acquisto materiale: 5-8 g Tempo acquisto materiale: 5-8
gTempo installazione server: 5-8 g
Backup danneggiatoTempo riconfigurazione sistemi: 1gTempo acquisto materiale:
5-8 g
Tempo installazione server: 5-8 g Tempo di trasferimento e
accensione macchine virtuali: 4-8h
Tempo riconfigurazione server e ricaricamento dati: 5-8 g
29
SCENARIO 3 -DISASTRO: l’effetto di un evento improvviso che ha come impatto gravi e prolungati danni e/o perdite per l’organizzazione.
STRUTTURA ITSoluzione Tecnologica:
STRUTTURA IT REINGEGNERIZZATA
TRANSITORIO/CONTINUITÀ
SERVIZI SOSPESI
Possibilità di accendere le macchine virtuali su server di appoggio reperiti per l'emergenza
30
31
SYNETO
DISASTER RECOVERY
Backups quasi istantanei e illimitati
Recupero del dato in pochi minuti
Replicazione incrementale dei Backups in siti remoti
Backup automatici e pianificati
Integrazione con VMWARE
32
SYNETO
33
34
Disegno struttura IT
futuro