SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
SILVIO SALZA - Università di Roma “La Sapienza” – 1
CENTRO DI ECCELLENZA ITALIANO SULLA CONSERVAZIONE DIGITALE
Ciclo di vita del documento informatico
SILVIO SALZA
Università degli Studi di Roma “La Sapienza”
CINI- Consorzio Interuniversitario Nazionale per l’Informatica
Work supported by the European Community under the
Information Society Technologies (IST) program of the 7th FP for RTD
project APARSEN, ref. 269977
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
SILVIO SALZA - Università di Roma “La Sapienza” – 2
LICENZA DI DIRITTO D’AUTORE
Questo materiale è rilasciato sotto licenza Creative Commons CC BY-NC-ND
Questa licenza implica che:
• È possibile copiare e distribuire liberamente questo materiale, a patto che non vengano apportate modifiche e che vengano mantenute le indicazioni di chi è l'autore dell'opera.
• Ciò è però consentito esclusivamente quando avvenga per scopi non commerciali.
• Non è consentito di distribuire opere derivate, cioè contenenti qualsivoglia modifica rispetto al materiale originale.
Per maggiori dettagli si rimanda direttamente alla licenza:
• Riassunto della licenza: http://creativecommons.org/licenses/by-nc-nd/3.0/it/deed.it
• Licenza completa: http://creativecommons.org/licenses/by-nc-nd/3.0/it/legalcode
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Documento cartaceo e documento informatico
3
• Profonde differenze nella natura e nelle modalità di gestione
• Esperienza di millenni contro esperienza di decenni
• Ancora troppi problemi aperti
• Aspetti fondamentali da analizzare e su cui confrontarsi
– Lettura (visualizzazione) del documento
– Autenticazione del documento
– Trasmissione del documento
– Conservazione del documento
La migrazione verso il documento informatico potrà avvenire solo quando tutte le fasi del suo ciclo di vita saranno
adeguatamente supportate
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Problemi del documento informatico
4
• Il documento rischia di restare indissolubilmente legato al sistema con il quale è stato prodotto
• Un’intermediazione scorretta può comportare una
violazione dell’integrità del documento
• Necessari diversi livelli di interpretazione: − Codifica del supporto fisico− Organizzazione del file system − Codifica dei caratteri − Formato del file
La lettura (visualizzazione) del documento richiede l’intermediazione di un sistema informatico
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
La storia dell’archeologo (AD 2011)
5
• Nel 2000 DC un archeologo trova in Mesopotamia una serie
di tavolette di terracotta sumere del 2300 AC costituenti
l’archivio di Sargon di Akkad.
• Malgrado i 4300 anni i segni sulle tavolette sono ancora chiaramente intelligibili
• Basta conoscere la lingua sumera per ‘leggere’ il contenuto dell’archivio
• Non è un problema: molte lingue antiche sono state tramandate, quasi tutte le altre sono state decifrate
Evento notevole, ma non eccezionale: riteniamo ‘normale’ che documenti ‘tradizionali’ sopravvivano per millenni
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
La storia dell’archeologo (AD 4000)
6
• Nel 4000 DC un archeologo trova in Mesopotamia una serie di dischi ottici del 2000 DC, contenenti l’archivio segreto di Saddam Hussein
• Molto probabilmente i dischi sono illeggibili a livello fisico• Comunque, per ‘leggerne’ il contenuto occorrerebbe:
– Un lettore di CD/DVD (ma l’ultimo esemplare è andato perduto nel tragico incendio nel Museo della Scienza e della Tecnica di Washington DC, nel 2560 DC)
– La specifica del formato proprietario dei file (ma questa è andata perduta a seguito clamoroso fallimento di Microsoft nel 2025 DC)
– Una copia di MS Office 97 che giri sulle micro-piattaformeneuroniche sottocutanee a 1024 bit che hanno soppiantato i PC a partire dal XXIII secolo
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Formato del documento informatico
7
A. Indicazione dell’applicazione con cui il documento è stato generato
B. Definizione di una procedura per visualizzarlo con applicazioni diverse
Formato: insieme puntuale di regole in base alle quali deve essere effettuata la visualizzazione (o esibizione) del documento, cioè la
trasformazione dell’informazione binaria contenuta nel docu-mento informatico in forma direttamente leggibile.
NB: il risultato del processo di visualizzazione deve essere in
tutto identico a quello percepito dall’autore del documento .
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Metadati
8
• Tutte le informazioni significative associate al documento informatico, escluse quelle che costituiscono il contenuto del documento stesso
• Informazioni su: modi, tempi e soggetti coinvolti nella formazione, nella sottoscrizione, nella gestione e nella conservazione del documento
• Nei documenti tradizionali i metadati sono in genere un’entità esterna, e gestita separatamente
• Nei documenti informatici (grazie alla maggiore articolazione della struttura) i metadati possono diventare parte integrante del documento
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Documento intelligente
9
• Termine forse non rigoroso, ma ormai entrato nell’uso comune
• Documento autocontenuto: porta sempre con sé tutta l’informazione ad esso associata
• Eventuali sottoscrizioni estendono anche i metadati la validità e le conseguenze dell’azione
• Esistono formati sia aperti che proprietari che supportano il ‘documento intelligente’ (Es. PDF, PDF/A, ODF, Open XML)
Documento informatico che contiene al suo interno tutti
i metadati ad esso associati
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Funzione dei metadati
10
Funzione dei metadati è supportare una serie di operazioni:
– Ricerca: consentono l’individuazione e la verifica dell’esistenza di un documento
– Localizzazione: consentono di rintracciare una particolare occorrenza del documento
– Gestione: consentono di gestire le raccolte di documenti tramite cataloghi e basi di dati
– Interoperabilità semantica: basata su equivalenze tra descrittori in schemi diversi
Molte ricerche su Web sono basate sui metadati associati ai documenti (oltre che sul loro contenuto)
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Tipologie di metadati
11
• Metadati descrittivi: servono per l’identificazione e l’individuazione del documento (es. autore, titolo, anno…)
• Metadati amministrativi e gestionali: sono relativi alle modalità di archiviazione del documento, alla gestione dei diritti per il suo accesso e alla tracciatura dei suoi accessi
• Metadati per la conservazione: documentano gli aspetti tecnici associati alla conservazione del documento
• Metadati strutturali: legano le componenti di risorse complesse o composte, e ne consentono l’accesso e la navigazione
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Standard per i metadati
12
• Garantiscono la definizione di modalità di accesso e gestione generali, cioè indipendenti dal singolo archivio
• Consentono l’impostazione di ricerche che interessano molteplicità e varietà di archivi diversi (es. cataloghi bibliotecari)
• Assicurano l’interoperabilità degli archivi e la migrazione dei documenti
• Tendono a focalizzarsi su aspetti particolari dei metadati:– Semantica: quali parti di informazione vengono create
(definite in base al loro significato)– Contenuto: come l’informazione viene formata (es. come
scrivere un nome o una data)– Sintassi: come l’informazione è codificata
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Migrazione verso il documento informatico
13
• Se ne parla da tanto, soprattutto nella PA, ma mancano ancora alcuni presupposti
• Occorre individuare le fasi e le azioni fondamentali nelle quali si articola il ciclo di vita del documento informatico:
– Analizzare gli impedimenti che frenano la migrazione
– Individuare i fattori abilitanti e le strategie di intervento
• Obiettivo: far decollare la transizione verso il documento informatico sia nella PA che nel settore privato
L’effettiva migrazione potrà compiersi solo quando tutte le fasi del ciclo di vita saranno adeguatamente normate e supportate
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Ciclo di vita del documento informatico
14
FORMAZIONE
GESTIONE
CONSERVAZIONE
Sottoscrizione
Trasmissione
ArchiviazioneRicerca
Visualizzazione
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Macrofasi del ciclo di vita
15
• Formazione del documento: fase complessa e articolata, che
termina quando il documento raggiunge la sua forma finale
• Gestione del documento: copre tutta la vita ‘attiva’ del
documento, dal termine della formazione alla chiusura del
fascicolo
• Conservazione del documento: copre il resto della vita, dalla
chiusura del fascicolo fino alla (eventuale) distruzione del
documento
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Formazione del documento
16
• Fase gestita con strumenti informatici anche nel caso di originali cartacei
• Ciò permette una transizione relativamente indolore verso il documento informatico
• Basta sostituire la stampa con il salvataggio della versione finale
• È una fase delicata perché stabilisce il formato del documento
• Incide pesantemente su tutte le fasi successive: prima digestiofiet in ore
Problema: la formazione del documento avviene spesso in ambienti proprietari, compromettendo così anche le fasi
successive del ciclo di vita
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Formazione: cosa occorre garantire
17
Per rimuovere gli impedimenti relativi alla fase di formazione del documento occorre garantire le seguenti condizioni:
– Indicazione puntuale dei formati da adottare
– Specifica degli insiemi minimi di metadati da associare ai documenti
– Disponibilità e diffusione di strumenti per una corretta ed agevole gestione del processo di formazione.
– Usabilità e accessibilità degli strumenti, chiarezza e semplicità del processo di formazione.
– Facilità d’uso degli strumenti per la sottoscrizione dei documenti informatici
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Gestione del documento
18
• Copre tutta la vita del documento, dal termine della formazione fino alla chiusura del fascicolo
• Fase complessa ed articolata: comporta azioni molteplici e di natura varia: trasmissioni, sottoscrizioni, copie, archiviazione, ricerche ed esibizioni
• Varietà di strumenti informatici in corrispondenza delle varie azioni: ruolo centrale dei sistemi di workflow management
Problema: non tutte le azioni sono adeguatamente coperte, e altrettanto semplici per l’utente che nel caso tradizionale;
ciò costituisce remora al cambiamento
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Gestione: cosa occorre garantire
19
Per rimuovere gli impedimenti relativi alla fase di gestione del documento occorre garantire:
– Regole, procedure, e strumenti a copertura di tutte le azioni: trasmissioni, sottoscrizioni, archiviazione, copie, ricerche ed esibizioni
– Diffusione di strumenti di workflow management, e definizione di un insieme di requisiti minimi di abilitazione
– Semplicità e usabilità per l’utente finale: non far rimpiangere la gestione tradizionale del documento cartaceo, ma di fornire elementi di incentivazione.
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Conservazione del documento
20
• Inizia al termine della fase di gestione e copre tutta la restante vita del documento, dalla chiusura del fascicolo alla sua (eventuale) distruzione
• È finalizzata al mantenimento dei requisiti giuridici ed informativi dei documento e alla possibilità di recuperarlo ed utilizzarlo
• Vari livelli di archivio: – archivio di deposito – archivio di lungo periodo (archivio storico)
Problema: scarsa esperienza sulla conservazione di documenti digitali (circa mezzo secolo): poche storie felici e molti fallimenti
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Conservazione: cosa occorre garantire
21
– Che il documento informatico (inclusi i metadati) si conservi nel tempo integro nel contenuto e nella forma
– Che il documento sia correttamente visualizzabile, nella sua forma originale, anche a grande distanza di tempo
– Che sia possibile dimostrare, anche a grande distanza di tempo, l’integrità del documento, e la validità e l’autenticità di eventuali sottoscrizioni
– Che il documento sia facilmente accessibile e ricercabile in base al contenuto ed ai metadati
– Che l’accesso al documento sia limitato ai soli soggetti autorizzati a farlo
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Azioni fondamentali
22
– Sottoscrizione: consente di garantire l’autenticità e di dare datazione certa al documento
– Trasmissione: consente lo scambio (formalizzato) di documenti tra soggetti remoti
– Archiviazione: comporta la classificazione e l’inserimento nel fascicolo e nell’archivio
– Ricerca e accesso: consente l’individuazione del documento in base al contenuto ed ai metadati
– Visualizzazione: garantisce la presentazione del documento nella stessa forma percepita dall’autore al termine della sua formazione
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Sottoscrizione
23
Problema: insoddisfacente usabilità degli strumenti e scarso
supporto di processi di firma articolati
• Tramite firma elettronica, nelle sue varie forme
• Ma esistono anche altre possibilità!
• La firma digitale conferisce validità legale ai documenti sottoscritti
• La marcatura temporale consente la datazione certa
• Necessario considerare processi di sottoscrizione più articolati:
– Firme multiple (in serie e in parallelo)
– Firme parziali (relative a parti del documento)
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Sottoscrizione: cosa occorre garantire
24
N.B. La firma digitale è alla base di molte procedure
amministrative ma costituisce tuttora una significativa
causa di resistenza da parte di molti utenti
• Semplicità dell’operazione di firma e usabilità da parte di tutti gli interessati
• Semplicità dell’operazione di verifica della firma
• Possibilità di verificare la firma anche a considerevole distanza di tempo (durata dei certificati digitali)
• Supporto di processi di sottoscrizione multipla e parziale: cicli di revisione, visto e firma
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Trasmissione
25
Problema: scarsa diffusione (e cattiva usabilità) di alcuni
strumenti (PEC), scarsa interesse verso altri (Web)
• Punto di forza del documento informatico:
• Abbattimento dei tempi
• Abbattimento dei costi
• Può e deve essere sfruttato per favorire la migrazione
• Diversi canali disponibili:
• Posta elettronica
• Posta elettronica certificata (PEC)
• Trasmissione via web
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Trasmissione: cosa occorre garantire
26
Problema: la posta elettronica è uno strumento troppo debole,
e la PEC è poco usabile e non adatta all’utente finale
• L’integrità dei documenti durante la trasmissione
• La riservatezza delle informazioni contenute nei documenti
• L’identificazione certa della provenienza e della destinazione
• La certezza dei tempi di invio e di consegna, e le relative conferme
• La semplicità e l’usabilità delle procedure e degli strumenti da utilizzare e la possibilità della loro diffusione al grande pubblico
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Archiviazione
27
Problema: non è stata ancora raggiunto un’adeguato
livello di standardizzazione dei metadati
• Azione con cui il documento viene classificato ed inserito in un archivio
• Nella PA avviene tipicamente dopo, o contestualmente alla protocollazione
• Coincide anche con l’inserimento del documento nel fascicolo
• Comporta un arricchimento ed un aggiornamento dei metadati
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Archiviazione: cosa occorre garantire
28
• Integrità, reperibilità e capacità di visualizzare il documento correttamente a distanza di tempo
• Indicazione chiara dei formati adatti alla conservazione
• Standardizzazione dei metadati relativi alla classificazione del documento ed alla sua gestione nell’archivio corrente
• Regole chiare e complete per la gestione dei fascicoli informatici, incluse situazioni transitorie con fascicoli ibridi (contenenti documenti con originali sia cartacei che informatici)
• Indicazioni chiare sui supporti da utilizzare e sulle procedure di controllo
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Ricerca ed accesso
29
• È un notevole punto a favore del documento informatico
• La ricerca deve poter essere effettuata :
– Sui metadati
– Sull’intero contenuto del documento
– Sulle relazioni con soggetti ed altri documenti
• Possibilità di estendere la ricerca ad archivi remoti
• Necessario adottare e gestire complessi schemi di controllo degli accessi
Problema: garantire la riservatezza dei documenti diviene un
problema molto più complesso che nel mondo cartaceo
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Ricerca ed accesso: cosa occorre garantire
30
• Efficienza delle operazioni di ricerca ed accesso (gestione di indici)
• Efficacia delle interfacce per la formulazione delle ricerche
• Strumenti adeguati per il controllo e tracciabilità degli accessi
• Riservatezza del contenuto• Impedire l’individuazione indiretta di documenti tramite
azioni indirette di inferenza
N.B. L’accesso non sistematico ai documenti, basato sul contenuto e non sulla collocazione, è prepotentemente
entrato nelle nostre abitudini e nella nostra quotidianità
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Visualizzazione
31
• Il documento informatico viene percepito come immagine riprodotta da un sistema informatico
• Il documento deve poter essere visualizzato dai soggetti autorizzati in qualsiasi momento del ciclo di vita
• Deve essere possibile esibire il documento a soggetti terzi, eventualmente con valore legale di opponibilità
• Occorrono procedure e mezzi per certificare la corrispondenza dell’immagine visualizzata con l’originale
Problema: la correttezza dell’immagine visualizzata dipende dalla conformità e dal corretto funzionamento del sistema
informatico utilizzato per effettuarla
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Visualizzazione: cosa occorre garantire
32
• Semplicità ed usabilità delle operazioni di visualizzazione
• Possibilità, anche a considerevole distanza di tempo, di visualizzare il documento esattamente come era stato visualizzato dal suo autore all’atto della sua chiusura e/o sottoscrizione
• Procedure per la certificazione dei sistemi con i quali la visualizzazione viene effettuata
• Procedure semplici ed accessibili per la generazione di copie cartacee autentiche di documenti informatici
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Leggibilità dei documenti
33
• Iniziale dipendenza dei formati dagli ambienti di elaborazione (anni ’60 – ’80)
• Proliferazione dei formati proprietari
• Tendenza attuale verso la standardizzazione dei formati
• Pericolo di ‘illeggibilità’ ridotto ma tuttora presente
La leggibilità di un documento informatico dipende dalla possibilità e dalla capacità di interpretare ed elaborare
correttamente i dati binari che costituiscono il documento, secondo le regole stabilite dal formato con cui esso è stato
memorizzato
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Il documento informatico nel nuovo CAD
34
• La nuova versione del CAD (2010) contiene interessanti novità sul documento informatico e sulla gestione del suo ciclo di vita
• Le novità sono soprattutto contenute nelle regole tecniche che sono in corso di elaborazione in DigitPA (AgID)
• Bozze delle regole tecniche sono disponibili da un paio di anni ma il relativo decreto è ancora stato emanato solo per alcune
• Le principali novità interessano:
─ La formazione (e la definizione stessa) del documento
─ La sottoscrizione
─ Il processo di conservazione
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Formazione del documento
35
Indicate diverse modalità di formazione dei documenti informatici:
A. Redazione tramite utilizzo di strumenti software
B. Acquisizione da supporto analogico (direttamente, per copia o per trasmissione)
C. Registrazione di informazioni risultanti da transazioni informatiche, o acquisizione tramite moduli
D. Aggregazione di dati provenienti da una o più basi dati, secondo una struttura predeterminata
Le modalità C e D astraggono ed estendono enormemente il concetto di documento: anche un insieme di dati, localizzabile
in una base di dati può essere considerato un documento
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Dal documento al dato elaborabile
36
• Il concetto di documento è destinato, come molti altri, ad evolvere sotto al spinta del contesto tecnologico
• In una procedura l’informazione viene scambiata tra soggetti diversi tramite documenti
• L’informatizzazione delle procedure sposta l’accento dal contenitoreal contenuto, cioè dal documento all’informazione in esso contenuta
• In molte procedure lo scambio di documenti è stato sostituito dallo scambio di dati
• Es. Bonifico bancario:
─ Vecchio sistema: compilo un modulo cartaceo e lo firmo (documento tradizionale); il modulo viene archiviato
─ Nuovo sistema: inserisco i dati in una form via web dopo essermi autenticato; i dati vengono conservati in un DB
SILVIO SALZA - Università di Roma “La Sapienza” – Ciclo di vita del documento informatico
Immodificabilità
37
L’immodificabilità per i diversi tipi di documento si ottiene tramite:
A. Firma, marcatura, trasmissione per PEC, memorizzazione nel sistema di gestione documentale o di conservazione
B. Memorizzazione nel sistema di gestione documentale o di conservazione
C. e D. In una delle due modalità alternative─ Registrazione dell’esito della transazione e protezione
dell’integrità della base di dati─ Produzione di una snapshot e trasferimento al sistema di
conservazione
Il documento informatico assume la caratteristica di immodifi-cabilità se formato in modo che il contenuto risulti non alterabile durante le fasi di tenuta, di accesso e di conservazione nel tempo