1
Linguaggi di marcatura in ambito giuridico
Prof. Monica Palmirani – CIRSFIDUniversità di Bologna, Facoltà di Giurisprudenza
Corso di Elementi di [email protected]
Standardizzazione
Per standardizzazione si definisce quel processo attraverso il quale una comunità che utilizza procedimenti/tecniche/metodi prima diversi fra loro trovano un punto di armonizzazione e di normalizzazione intorno ad un unico modelloIn informatica la standardizzazione è un elemento importante per
l’interoperabilità dei sistemi informatici (software e processi), la condivisione dei dati (dati)l’uniformità dei protocolli (reti)
2
Standard aperti e standard chiusi
Standard aperti: standard le cui norme tecniche sono note, diffuse, e ampiamente documentateStandard chiusi: standard di fatto imposti sul mercato di cui non si conoscono le norme tecniche e non vi è conoscenza di uso diffusa né documentazione
Non si devono confondere gli standard aperti con l’open sourcePossono esservi standard aperti ma proprietari (RTF- Microsoft)
Formato chiuso: word
3
Formato Aperto: XML
Ruolo degli standard
Specialmente gli standard aperti svolgono i seguenti ruoli:Ruolo socio-economico: armonizzare il mercato, favorire gli attori deboli, mettere in circolo competenzeRuolo normatore: bilanciamento di vari interessi, attutire la forza dei monopoli a favore della qualitàRuolo tecnologico: favorire la leva competitiva e l’innovazione, mettere in circolo conoscenza
Il processo di creazione di uno standard aperto passa attraversofasi di proposta, discussione, convergenza di un compromesso, condivisione, accettazione del compromesso
4
Processo di formazione degli standard
Il processo di creazione di uno standard aperto passa attraversodiverse fasi:proposta da parte di un gruppo (working draft)pubblicazione della propostaraccolta di commenti (call for comments)discussione dei commenti e riformulazione di un nuovo documento working draftconvergenza verso una soluzione di compromesso (Candidate Raccomandation)condivisione della soluzione (Proposed Raccomandation)votazionedefinizione di una <<norma tecnica>> -W3C raccomandation
Esempio nel WAI
5
Organismi di standardizzazione per l’ICT (http://www.cnipa.gov.it/site/_files/Standard.pdf)
W3C: organo di governo degli standard WWW
W3C: organo di governo degli standard WWW
Vantaggi e svantaggi
Vantaggi:l’interoperabilità fra sistemi informatici, dati, reti, processi, etc.circolazione della conoscenza e delle competenze leva al cambiamento e all’innovazione distribuita alla collettivitàgaranzia di aderenza ad un livello condiviso di qualità
SvantaggiLa soluzione di compromesso (lo standard) non necessariamente è la scelta miglioreLe lobby possono influenzare lo standardLa creatività è sacrificata in nome dell’efficienzaLa standardizzazione sfavorisce il pluralismo di pensiero
6
Perché parliamo di standard in ambito giuridico
L’informazione giuridica è una particolare fonte di informazioneEssa deve preservare nel tempo:
Integrità del contenutoValidità legale del contenutoInteroperabilità fra sistemi che la usanoIndipendenza dal supporto su cui è stata creata per garantirne l’accessibilità nel tempo
Nel passaggio dalla carta al digitale (processo di dematerializzazione) l’informazione giuridica necessita di garanzie e qualità e gli standard possono aiutare in questo passaggio
Esempi di standardizzazione di informazione giuridica e XML
NormeinRete: standard nazionali per i nomi URN e per la strutturazione dei testi legislativi in XML
Circolare 6 novembre 2001, n. AIPA/CR/35 “Assegnazione dei nomi uniformi ai documenti giuridici”Circolare 22 aprile 2002 n. AIPA/CR/40 “ Formato per la rappresentazione elettronica dei provvedimenti normativi tramiteil linguaggio di marcatura XML”
Processo civile telematico: standard nazionale per lo scambio elettronico delle pratiche di rito civile fra le cancellerie e gli avvocatiProtocollo Informatico:
Circolare 7 maggio 2001, n. 28 - “Tali informazioni sono incluse nella segnatura informatica di ciascun messaggio protocollato e sono codificate in formato XML ”
eGov: circolazione dei dati fra pubbliche amministrazioni
7
Parliamo di testiIl testo è una forma destrutturataLa semantica delle parti non è esplicitataNecessita di tecnologie apposite per essere rappresentato, elaborato, archiviato, ricercatoNon si può pensare di utilizzare le stesse tecniche dei database a meno di scomporre il testo in campiEs: una fattura è un documento ma la posso comporre in parti strutturate (testa, righe, coda). Il testo viene mappato in campi. La semantica è espressa attraverso la posizione che assume nella tabella (coppia: campo,valore), ma si perde l’integrità del documento
Codice prodotto Quantità Prezzo Sconto
Linguaggio di marcaturaPer linguaggio di marcatura intendiamo un qualsiasi meccanismo di annotazione che consenta di evidenziare una parte del testo ed assegnargli un significatoIl processo di marcatura arricchisce il testo con elementiaggiuntivi i quali racchiudono parti di contenutoGli elementi che consentono di marcare il testo si dicono marcatori e vengono chiamati tagI tag sono composti da un elemento di apertura e da un elemento di chiusura<title>La divina commedia</title>
apertura chiusura
8
Linguaggio di marcatura
Solitamente il linguaggio di marcatura cerca di:lasciare inalterato il documento originale nel suo contenuto rispettando l’autoredistinguere i tag che servono alla stampa/presentazione da quelli che servono per rappresentare il contenutoapporre in modo evidente e separato tutti gli elementi aggiuntivi di arricchimento del testo ossia di informazioni sul documento che non sono contenute nel documento stesso (metadati)non piegare la rappresentazione del documento a nessuna funzione di processo in particolare ma cercare di rappresentare l’essenza ontologica del documento
Esempi
Quando si stampa un libro si appongono delle marcature tipografiche (grassetto, corsivo, sottolineato, ecc.)
Quando si sottolinea con un evidenziatore le parti rilevanti di un testo si applica un processo di marcatura
I glossatori della scuola di Irnerio apponevano segni di distinzione nel testo arricchendo il testo stesso con note
HTML è un linguaggio di marcatura
9
Tipi di Markup
La marcatura può avere diverse funzioni:Puntuazionale – di punteggiaturaPresentazionale – tipograficheProcedurale – di impaginazione, per l’elaborazioneDescrittivo – per descrivere parti significative del testo: titolo, autore, editore di un testoReferenziale – per collegare parti di testo interne fra loro (note a piè di pagina, riferimenti incrociati) o collegare parti di un testo con un altro (link) Meta-markup – per descrivere il modello di marcatura
Breve storia del markup
GCA-GenCode e IBM-GML (1968-70)
GenCode è il risultato della standardizzazione dei codici di tipografia (Graphics CommunicationsAssociation)
Generalized Markup Language di IBM è il linguaggio di markup per la documentazione interna e il prodotto BookMaster
1986: SGML è standard ISO 8879
Nel 1988 il dip. della difesa americano (DoD) adotta SGML per l’iniziativa CALS (Continuous AidedLogistic Support)
10
Breve storia del markup1991: HTML
Tim Berners Lee (CERN - Ginevra) inventa il “World Wide Web”HTML è “ispirato” ad SGML. Solo in seguito verrà corretto per adeguarsi a SGML
1997: XMLNel 1995 il W3C decise di creare un linguaggio di markup con la completezza di SGML e la semplicità di HTML: Extensible Markup Language (XML) Nel 1997 è uscito il primo standard per il linguaggio di markup (XML 1.0). In seguito i linguaggi connessi (XML-Namespaces, X-Pointer, X-Link, XSL, XPath, ecc.)
Alcuni esempi
Rich text format RTF – linguaggio di marcatura
presentazionale di proprietà della Microsoft
LaTex – linguaggio di marcatura a scopi tipografici
HTML – linguaggio di marcatura presentazionale e
referenziale (creare ipertesti)
XML – linguaggio di marcatura descrittivo, meta-
linguaggio
11
HTML
L’HTML è un linguaggio di marcatura Contiene un numero limitato di tag per questo si dice chiuso, non estensibileNon distingue lo strato di rappresentazione del contenuto con lo strato di presentazione grafica del contenuto:
<title> è un tag HTML che definisce il titolo della finestra di un file HTML<b> è un tag HTML che definisce la marcatura in bold della parte racchiusa dal tag
Non è gerarchicoNon è rigoroso (es: vi possono essere tag aperti)
XML
XML – eXstansible Markup Language
Nato per la descrizione documentale viene poi applicato con successo anche nella descrizione di dati strutturati
E’ un meta-linguaggio (linguaggio per creare linguaggi) per questo estensibile ossia si possono definire nuovi tag
Distingue lo strato di rappresentazione del contenuto con lo strato di presentazione grafica del contenuto:
12
XML
E’ gerarchicoE’ rigorosoE’ un formato aperto non proprietarioE’ indipendente dalla piattaforma hardware e softwareE’ indipendente dagli applicativi
Sintassi dei Tag
Tag di apertura e tag di chiusuraVi sono regole di definizione per la composizione dei tag ossia
vi sono caratteri riservati non possono iniziare con numerinon si possono usare spaziè key sensitivei commenti hanno una loro sintassi
<!-- commento -->
13
Regole di well-formed
Un documento si dice wee-formed quando rispetta le regole sintattiche del linguaggio XML
Deve iniziare con una riga dichiarativa chiamata processing instruction<?xml version=“versione” encoding=“codifica”?>Deve esistere sempre un elemento radiceIl tag iniziale corrisponde tag finaleGli elementi vanno chiusi seguendo la gerarchiaI nomi dei tag devono essere univociI valori degli attributi devono essere specificati fra apiciun elemento non può avere due volte lo stesso attributoPer i caratteri riservati si usano gli entity-name
> >< <
La struttura ad albero
14
Struttura ad albero di un XML-schema
Sotto-definizione di una parte dell’albero
15
URI, URN, PURL
Prof. Monica Palmirani – CIRSFIDUniversità di Bologna, Facoltà di Giurisprudenza
Corso di Elementi di [email protected]
URIIETF ha prodotto RFC per definire la sintassi degli:
URI – Uniform resource identifier<uri> ::= <schema> “:” <parte-specifica>URN – Uniform resource name<URN> ::= "urn:" <NID> ":" <NSS>URL – Uniform resource locator
http://host[:port]/path[#fragment][?query]http://www.dexa.org:9004/PC-onlinehttp://normaxml.cirfid.unibo.it/cobo/document.jsp?d=00000055http://www.giustizia.it/cassazione/leggi/dlgs196_2003.html#art56
URL URN
URIURL semi
permanenti
16
Gli indirizzi URL
URL e’ uno schema di denominazione per specificare come e dove sia possibile reperire una risorsa Internet (caso particolare, un documento Web)
Formato di un URL per reperire documento WWW:http: e’ il protocollo alla base del Web. A volte e’ sottinteso.Nome del dominio (obbligatorio): e’ il nome di un computer permanentemente collegato in InternetPercorso del file: e’ il percorso per reperire un file all’interno del computer specificato.Identificatore del frammento (opzionale): indica il nome di una parte specifica del documento.
URN – Uniform Resource Name
L’URN di una risorsa in rete è il nome che identifica in modo univoco la risorsa attraverso le caratteristiche della risorsa e non con un nome di fantasia deciso dall’informaticoL’IETF(Internet Engineering Task Force) ha definito i criteri per costruire l’URN delle risorse nella reteL’URN attraverso una tabella di corrispondenza viene tradotto nell’URL, per la localizzazione della risorsa stessaNIR ha definito regole di naming per gli URN delle risorse giuridiche legislative italiane
17
Caratteristiche dell’URN
Crea un nome logico sulla base delle caratteristiche della risorsaLe caratteristiche devono essere:
Parlanti e significativePermanenti nel tempo e staticheOggettive e facilmente identificabili
Risolutore
Il meccanismo degli URN necessita di un risolutore ossia un software che traduce l’URN il URLURN = nome logico univoco della risorsa in rete e indipendente dalla sua posizione fisicaURL = nome fisico della risorsa in rete
URN URL
urn:nir:stato:decreto.legislativo:2003-06-30;19611.Html174.Htm03196dl.htm
risolutore
18
Vantaggi/svantaggi dell’URN
L’URN rende persistente il riferimento alla risorsa perché utilizza dati logici abbinati alla risorsa che descriveAbbiamo bisogno sempre di un risolutoreNon tutti interpretano nello stesso modo i dati univoci logici abbinati alla risorsa
Perché usare l’URN
Identificazione chiara dei documenti giuridici indipendente dalla localizzazioneIl nome è costruito mediante le caratteristiche di un testo normativo ossia l’autorità, il tipo di atto, gli estremi e non secondo le logiche del programmatoreConsente di ricercare i documenti indipendentemente dalla logica della banca dati Consente di navigare i riferimenti normativi anche fra banche dati diverse. Questo favorisce:
ConsolidamentoRiferimenti passivi
19
Perché usare l’URN
Identificazione chiara dei documenti giuridici indipendente dalla localizzazione fisica
Persistenza del nome nel tempo perché costruito mediante le caratteristiche statiche, oggettive, significative e non secondo le logiche del programmatore
Accesso alle risorse indipendentemente dalla logica della banca dati
Interoperabilità fra banche dati diverse
Esempio di URN in NormaInRetedelle risorse giuridiche
urn:nir:regione.umbria;giunta:delibera:1998-02-12;14:allegato.a;confini.parco
urn:nir:stato:decreto.legislativo;appalti.pubblici:1992-07-24;358
urn:nir:stato:legge:1996-12-31;675@1997-05-09;1997-05-10
AUTORITA’ TIPODOC ESTREMI ANNESSINIR
data pubblicazione della modifica
data applicazione della modifica
20
URN delle risorse giuridiche in NIR
Esempio di URN
Legge n. 675 del 31 dicembre 1996
urn:nir:stato:legge:1996-12-31;675<autorità> ":" <provvedimento> ":" <estremi>
<estremi> ::= <date> ";" <numeri>
URI di AKOMA NTOSO e Metalex
Esempio di URI
Legge n. 675 del 31 dicembre 1996
it/act/1996-12-13/675/itait/act/1996-12-13/675/ita@ originaleit/act/1996-12-13/675/ita@2002-01-01 versione it/act/1996-12-13/675/ita@2002-01-01/main.xml
Country/typeAct/dateAct/numAct/langAct@version/main.xml
21
URI/URN: quando si producono le versioni
VersioningChain
Temporal Axis
t0 tnti ti+1 tn+1t1 t2
….V0 V1 V2 V5 V7V6….
M0 M1Mn-1
….
Sequence of Modifications
(t2, t5, t12)
L’URN acquista dopo la @ la data di applicazione della modifica
urn@t2 urn@t5 urn@t8 urn@t12urn
t7
WORK
EXPRESSIONCOMPONENTS
MANIFESTATION
ITEM
ACT 3/2006au/act/2006-12-12/34
N
N
N
1
COMPONENTS
1
1
VERSION n.2 of the ACT 3/2006au/act/2006-12-12/34/eng@2008
Document model
FILE XMLof the VERSION 2 of the ACT 3/2006au/act/2006-12-12/34/eng@2008/main.xml
Specific FILE XML on the server of the VERSION 2 of the ACT 3/2006
mainschedule1schedule2table1
COMPONENTS
22
WORK
EXPRESSIONCOMPONENTS
MANIFESTATION
ITEM
ACT 3/2006
N
N
N
1
COMPONENTS
1
1
VERSION 2 of the ACT 3/2006
Metadata model
FILE XMLof the VERSION 2 of the ACT 3/2006
Specific FILE XML on the server of the VERSION 2 of the ACT 3/2006
mainschedule1schedule2table1
Metadata
Metadata
Metadata
Metadata
XML elementi di base
Prof. Monica Palmirani – CIRSFIDUniversità di Bologna, Facoltà di Giurisprudenza
Corso di Elementi di [email protected]
23
Componenti essenziali dell’XML
ElementiAttributiEntitàNamespace
Gli elementiElementi = ossatura del file XML
Elementi = etichette per la qualificazione del testoEsiste sempre un elemento radice detto root
L’elemento viene definito tramite i due tag di apertura e chiusura
<tipoDoc>Decreto legislativo</tipoDoc> elemento tipoDoc<numDoc>171</numDoc> elemento numDoc
<titoloDoc>Disposizioni in materia di tutela della vita privata nel settore delle telecomunicazioni, in attuazione della direttiva 97/66/CE del Parlamento europeo e del Consiglio, ed in tema di attività giornalistica
</titoloDoc> elemento titoloDoc
<dataDoc norm="19980513">13 maggio 1998</dataDoc> elemento dataDoc
24
Elementi e sotto_elementi<intestazione>
<tipoDoc> Decreto legislativo</tipoDoc> <numDoc>171</numDoc> <titoloDoc >Disposizioni in materia di tutela della vita privata nel settore
delle telecomunicazioni, in attuazione della direttiva 97/66/CE del Parlamento europeo e del Consiglio, ed in tema di attività giornalistica</titoloDoc>
<titoloDoc tipo=“breve” nome=“Codice Privacy”/> <dataDoc norm=“19980513”>13 maggio 98</dataDoc>
</intestazione>
intestazione è formato dai sotto elementitipoDoc, numDoc, titoloDoc, dataDoc
La gerarchia è data dalla chiusura dei tag e dal meccanismo di inclusione degli stessi
Attributi
Gli attributi sono informazioni note del testo ma non presenti nel testo e quindi devono essere inseriti in appositi spazi mediante il meccanismo denominato “nome-valore”Il nome è fissoIl valore varia<pubblicazione tipo="Gazzetta Ufficiale" num="127" norm="19980603" /> Attributi dell’elemento pubblicazione:
TipoNumNorm (data pubblicazione normalizzata ossia annomesegiorno)
NOME VALORE
25
Documenti ben formati e validi
un documento XML è ben formato (well-formed) quando rispetta le regole di sintassi del linguaggio stesso
un documento XML è valido se è conforme ad un modello prestabilito che ne descrive gli elementi, la struttura, i vincoli fra gli elementi
tali vincoli vengono definite mediante una grammaticadefinire un modello consente di passare dallo strato di meta-linguaggio al linguaggio
vi sono due diverse tecnologie per definire modelli:
DTD – document type definition
XML - Schema
Differenze fra DTD e XML-schema
DTD sono nate primasono più leggibili all’uomosono più adatte a modellare testinon possono definire le tipologie di datinon possono definire classi ed ereditarietà fra classinon si possono imporre limitazioni ai tipiliste di attributi uguali non si possono definireusano un linguaggio di definizione non XML
26
Differenze fra DTD e XML-schema
XML-schema sono nate dopo per sanare le precedenti lacunesono meno leggibili all’uomo più leggibili alla macchinasono più adatte a modellare dati strutturatipossono definire tipologie di dati complessipossono definire classi ed ereditarietà fra classipossono imporre limitazioni ai tipisi possono definire liste di attributi ugualisono definite in XML
Esercitazione
<?xml version="1.0" encoding="ISO-8859-1"?>Elemento ROOTMarcare con gli elementi baseInserire gli attributiVerificare la well-formedInserire la DTDValidare al sitohttp://www.stg.brown.edu/service/xmlvalid/
27
Perché definire modelli
per creare standardizzazioneper incentivare l’interoperabilità sia fra gli uomini sia
fra gli applicativiper dare regole prescrittiveper formalizzare regole descrittiveper creare schemi di comportamento uniformi
(processi)per condividere metadati all’interno di una comunità
Sintassi delle DTDELEMENTIATTRIBUTIENTITA’NAMESPACE
Le DTD si possono definire sia dentro il documento XML direttamente<!DOCTYPE nome_elemento_root [ definizione della DTD ]>
Sia esternamente in un file separato. In questo caso occorre richiamarlo dal file XML con l’istruzione<!DOCTYPE nome_elemento_root SYSTEM|PUBLICURI>
28
Sintassi dell’elemento
<!ELEMENT nome_elemento tipo_elemento>
Il tipo_elemento può essere:#PCDATA - testoANYEMPTYelemento complesso composto da altri elementientitàContent model misto
L’elemento complesso è così definibile:<!ELEMENT nome_elemento (sub_e1, sub_e2, sub_en)>Dove l’ordine di posizionamento dei sub elementi nel testo è vincolante<!ELEMENT nome_elemento (sub_e1| sub_e2| sub_en)>Dove i sub_elementi sono fra loro in alternativa
Content model misto
La sintassi DTD permette il content model misto ma occorre arrivare a compromessiI sub-elementi devono essere dichiarati in alternativa rinunciando così alla caratteristica prescrittiva dell’ordineEsempio
<!ELEMENT intestazione (#PCDATA | tipoDoc | dataDoc | numDoc | titoloDoc | emanante)*>
29
Sintassi dell’elemento
<!ELEMENT nome_elemento tipo_elemento>
L’elemento può essere Facoltativo ? Multiplo obbligatorio + (da 1 a molti)Multiplo facoltativo * (da 0 a molti)
<!ELEMENT nome_elemento ((sub_e1)?, (sub_e2)*, (sub_en)+>
Sintassi degli attributi
<!ATTLIST nome_elementonomeattributo tipo_attributo valori_default>
<!ELEMENT rango EMPTY><!ATTLIST rango
tipo %tiporango; #REQUIRED>
30
Tipi degli attributi
CDATA - testoENTITY – una qualsiasi entità definitaIDIDREFIDREFSLista di valori fra i quali se ne può scegliere uno
<!ATTLIST giurisprudenzaeffetto (normativo | interpretativo) #IMPLIED
>
Default degli attributi
#REQUIRED - obbligatorio#IMPLIED - facoltativo#FIXED – un valore fissato
31
Sintassi delle entità
Parti di testo richiamabili all’interno delle DTD in ogni posizionePermette di definire parti ricorrenti una sola volta e di richiamarleIn questo modo si armonizzano le definizioni, si minimizzano gli errori, si contiene il lavoro di modificazione-aggiornamento della DTD
Entità generali Entità parametricheEntità esterne
Entità generali
Entità generali <!ENTITY CIRSFID “Centro Interdipartimentale di
Filosofia del Diritto e di Informatica Giuridica”>
Uso nel documento XML<testo>Il &CIRSFID si occupa di…</testo>
Risultato espansoIl Centro Interdipartimentale di Filosofia del Diritto …
32
Entità parametriche
Sono oggetti di specifica che si definiscono nel DTD e si usano al suo interno
<!ENTITY % docarticolato "(meta, intestazione, formulainiziale, articolato, formulafinale, conclusione, annessi?)">
<!ELEMENT Legge (%docarticolato;)>
Entità esterne
Sono richiami a pezzi di DTD che sono esterni
<!ENTITY % nrmDTD SYSTEM "./norme.dtd">
33
Dichiarazione del DTD
Due modi di dichiarare l’uso di un DTD dentro al file XML
Richiamare un DTD esterno<!DOCTYPE nome_radice SYSTEM "..\..\DTD\nirloose.dtd">
Inserire il DTD internamente<!DOCTYPE nome_radice [<!ELEMENT…>
]>Misto
Inserire il DTD internamente<!DOCTYPE nome_radice SYSTEM "..\..\DTD\nirloose.dtd“ [
<!ELEMENT]>
Namspace
Elementi diversi possono avere nomi uguali allora come fare?Per risolvere il potenziale conflitto di nomi sui TAG definiti da più comunità si usano dei prefissi prima del nome del tag
prefisso:nometag
Math:title diverso da Phisic:title
34
Parser
Parser non validantiParser validanti
DomCarica tutto l’albero in memoria e lo esamina in modo atomico
SaxCarica solo la parte di albero sollecitata da un evento e quindi ha in memoria solo un frammento del documento
altri
XSLT
XSLT è un linguaggio della famiglia XML per la trasformazione di un file XML in altri file o XML o HTML o altri formatiXSLT trasforma mediante un processo il file originale XMLXSLT viene utilizzato per diversi scopi:
per trasformare un XML in un altro XML - per esempio quando si cambia versione della DTD occorre trasformare il file precedente in un nuovo file XML valido per la nuova DTD per inserire delle istruzioni di processo – per esempio per poi dare il risultato ad DBMSper visualizzare graficamente il file XML e renderlo quindi fruibile tramite i browser
35
Meccanismo XSLT
XML XSLTHTML
XML
Alcuni browser supportano l’engine XSLT standard e quindi fornendo le specifiche di layout si può direttamente dal browser visualizzare il documento nel formato di presentazione desideratoAltri browser non supportano l’engine e quindi occorre trasformare l’XML in HTML
Riferimenti
E. Rusty Harold, W. Scott Means, XML Guida di riferimento, Apogeo, O’Reilly
Cap. 1, 2, 3, 6
36
Metodologia di marcatura di un documento giuridico
Prof. Monica Palmirani – CIRSFIDUniversità di Bologna, Facoltà di Giurisprudenza
Corso di Elementi di [email protected]
Goal
Come marcare un documento giuridico
Di cosa abbiamo bisogno?
Analizzare il documento dal punto di vista giuridico prima di tuttoConoscere lo standard di marcaturaConoscere lo standard di naming delle risorseinformatiche
37
Senario
Abbiamo 3 scenari possibili:marcare un documenro giuridico già redatto (marcare in XML)
usare un tool che converte in modo semi-automaticomediante parser un documento esistenteusare un XMLeditor e maracare manualmente
costruire un documento e nel mentre “salvarlo” in XML (legal drafting)consolidare un documento (consolidamento)
Scenarios
Editor
repository
Local Naming
UniqueNamingURI
38
Analisi giuridica
Methodology
1. Separare il contenuto dal layer di presentazione
2. Analizzare la struttura3. Analizzare i metadati4. Analizzare i riferimenti5. Analizzare le azioni di modifica o di
contenuto nel testo giuridico
39
1. Separare il contenuto dal layer di presentazione
Contenuto: tutto il testo approvato
dall’assemblea o dall’organi preposto
(avente i poteri)
Metadata: ogni dato aggiuntivo di arricchimento
del contenuto
Presentation: stile di pubblicazione o
presentazione (e.g. Official Gazette)
Metadata –number and source of publication
Metadata –number and source of publication
Presentation-orientedtextPresentation-orientedtext
Metadata- date of publicationMetadata- date of publication
Presentation-orientedtextPresentation-orientedtext
Presentation-orientedtextPresentation-orientedtext
40
Presentation-orientedtextPresentation-orientedtext
ContentContent
Metadata- date of publicationMetadata- date of publication
Presentation-orientedtextPresentation-orientedtext
Side notesSide notes
41
Analisi della struttura e dei metadati documentali
Scelta del tipo di documento e URI
Ogni documento ha una sua struttura astrattaPer prima cosa occorre scegliere il tipo di documento all’interno dello standard che meglio accoglie e rappresenta la struttura giuridica e formale del documento da marcareSecondariamente dare un nome al documento – URI – mediante i metadati persistenti che rappresentano il documento
42
I metadati
Ogni standard ha una metodologia per marcare i metadati. Principalmente abbiamo quattro modalità per farlo:
come elementi raggruppati in una parte dedicata a isolare tutti i meta dal contenuto mediante un contenitore metainline ossia isolando una parte di testo e assegnandogli un significato speciale (es. virgolette o rif in NIR, quotedText e ref in Akoma Ntoso)marker ossia inserendo degli elementi vuoti all’interno del testo con attributi idonei. I marker sono collocate on-the-place ossia nel punto esatto in cui servono nel testo (es. ndr in NIR per segnare nel testo la presenza di una nota)mediante attributi di elementi (sconsigliato perché non consente di isolare facilmente il contenuto dal metadato, se vi sono molti attributi non è in forma serializzabile RDF e quindi di difficile gestione, si possono creare anomalie e inconsistenze)
Metadati oggettivi vs. metadati soggettivi
Esistono metadati documentali e oggettivie metadati soggettivi legati più all’interpretazione del contenuto normativo e giuridico del testoPer i primi l’analisi spesso è effettuata insieme all’analisi della struttura perché è difficile distinguere con certezza ciò che è contenuto e metadatoLa data di pubblicazione in gazzetta infatti può essere un metadato della legge, ma è sicuramente contenuto per la copia digitale della gazzetta ufficiale intesa come fonte biblioteconomica di pubblicazioneQueste incertezze ci saranno sempre perché l’oggetto di analisi cambia a seconda della fase del procedimento nella quale si introduce la marcatura
43
Struttura della intestazione o prefaceType of doc - ActTypeProponentTitle - ActTitleNumber - ActNumberDate of assent - ActDateDate of commencement (metadata) - metaDate of publication (metadata) - metaNumber of Gazette (metadata) - metaTable of content (TOC)
Struttura di un atto normativoParte iniziale suddivisa in:
Intestazione – prefacePreambolo – preamble (non sempre c’è es. nella legge non c’è)
Solitamente il premabolo è non normativo (in Italia per esempio) e i link sono tutti da considerarsi statici ossia navigabili e riferibili al documento Il preambolo motiva l’atto normativo o fornisce la storia giuridica che ha condotto all’atto normativo
Parte normativa che può avere diverse forme:articolato (leggi)punti gerarchici (alcuni atti secondari o allegati)blocchi destrutturati (provvedimenti del Garante Privacy)
Parte conclusivafirmetimbriregistrazioni presso la Corte dei Conti
Allegati
44
Metadata –number and source of publication
Metadata –number and source of publication
prefacepreface
preamblepreamble
bodybody
Preambolo in ambitointernazionale
CitationsList of other legislation resources that empower the current document
Recitalsjustifications and motivations
45
Conclusioni
Data della firmaLuogo della firma FirmeTimbto
Annessi o allegati
Tre tipi di allegatiA) Schedules that integrate the main act: they are not independent. E.g.: Tables, annexes, pictures, etc.
B) Schedules that are annexed acts: they are independent. E.g.: International Treaties
C) Informative schedules: they are not normative.
46
Schedule type A)Schedule type A)
imageimage
Example of schedule
Example of main
XML giuridico
Prof. Monica Palmirani – CIRSFIDUniversità di Bologna, Facoltà di Giurisprudenza
Corso di Elementi di [email protected]
47
Molti standard giuridiciFORMEX data model di EUR-LEXMetaLex and SDU BWB LexDania in Denmark, eLaw in AustriaCHLexML in Svizzara,the Crown XML Schema for Legislation in United Kingdom NormeinRete in Italia,AKOMA NTOSO - United Nations Department of Economic and Social Affairs (UNDESA) Pan-African Parliaments OrganizationEnAct - Tasmania, Australia, New Zealand e CanadaLexMLBrazil - Senate of the Brazil Republic United States House of Representatives
Iniziative ibride invece sono:Legifrance in FranceeBundesanzeiger in GermanyFinlex in Finland
Metalex/CEN
MetaLex/CEN – Open XML interchange format for legal and legislative resourcesnato nel 2005standard di interscambio fra standard XML giuridici ossia orientati alle fonti cognitive del dirittoPromosso dal CEN organo di standardizzazione europeo
48
Modellazione dell’atto normativoStrutturale
Struttura principale dell’atto e degli allegatiRiferimenti normativi
Semantico (Metadati)Metadati oggettivi dell’atto (data di pubblicazione, workflow, etc.)Classificazione del documento (thesaurus, etc.)Ciclo di vita dell’attoQualificazione dei riferimenti normativiQualificazione delle disposizioni
Logico-GiuridicoInterpretazione delle disposizioni
Carattaristiche della modellazione XML di documenti giuridici
Document oriented vs. Data orientedDescrittivo e prescrittivo (regole di buona formazione degli atti giuridici)Preservare l’inalterabilità del testo giuridicoSeparare i metadati di processo, di catalogazione, di annotazione, etc. dal contenutoDistinguere le parti presentazionali con contenuto semantico-giuridico dalle specifiche di layoutPattern oriented
49
Carattaristiche della modellazione XML di documenti giuridici
Document oriented vs. Data orientedlo standard che modella i documenti giuridici in XML deve essere rispettoso del documento nella sua interezza in modo che possa “viaggiare” in Internet indipendentemente dagli applicativi, dalle strutture logiche dei database, dalle piattaforme hardwareOrientato al documento e non ai dati, spesso infatti nelle prime implementazioni l’XML era usato come un formato dato di interoperabilità e interscambio fra database o legacy systemQuesto creava necessariamente una frammentazione del testo dentro una logica di database rigido e quindi la ricomposizione poi del testo giuridico risultava mutilata di molti aspetti prettamente legai alla valenza giuridica
Carattaristiche della modellazione XML di documenti giuridici
Descrittivo e prescrittivoTutti gli standard XML giuridici si ispirano a un manuale di buona normazione nazionale o sovra-nazionale e quindi sono perneatida una forte caratteristica di prescrittività (regole del manuale riportate all’interno della DTD o dell’XML-schema)Questo approccio però preclude la marcatura di tutti i testi chenon osservano le regole di buona normazione (regole di legaldrafting – vedi lezione n. 2)Per questo attualmente negli schemi più moderni si contempera sempre una buona dose di flessibilità ad una dose non eccessiva di prescrittività lasciando quest’ultima allo strato applicativoLa descrittività invece viene ampiamente tutelata in modo che il marcatore trovi semplice ed intuitivo marcare utilizzando un certo tag vicino alla propria cultura giuridica (es. section per gli anglofoni è il corrispondente del nostro articolo)
50
Carattaristiche della modellazione XML di documenti giuridici
Preservare l’inalterabilità del testo giuridicoL’inalterabilità del testo giuridico nel tempo è una prerogativa essenziale per la conservazione nel tempo non solo del contenuto informativo ma anche della valenza legale del testo
Carattaristiche della modellazione XML di documenti giuridici
Separare i metadati di processo, di catalogazione, di annotazione, etc. dal contenuto
Separare quindi tutto ciò che è contenuto da quanto invece apposto in un secondo tempo da altri attori (documentalisti, database, applicazioni, protocolli, processi di pubblicazione, etc.) è un elemento essenziale di preservazione della fonte cognitiva del diritto
51
Carattaristiche della modellazione XML di documenti giuridici
Distinguere le parti presentazionali con contenuto semantico-giuridico dalle specifiche di layout
Separare chiaramente la parte presentazionale(layout desiderato a stampa, in gazzetta, sul web, via telefono, etc.) dal contenuto è indice di pulizia, trasparenza e perdurabilità nel tempo del documento giuridico
Esempio dei tre livelli in Akoma Ntoso: contenuto, metadato, ontologia
CONTENT
METADATA
Link to the ONTOLOGY
52
Carattaristiche della modellazione XML di documenti giuridici
Pattern oriented [articoloVitali]Il design dello schema o della DTD deve modellare gli elementi tenendo conto di classi proptotipali che definiscono il comportamento dell’elemento attraverso alcune proprietàQuesto facilita gli applicativi, la presentazione, l’interoperabilità
Tipi di pattern in XMLContainer: insieme di blocchiBlocchi: insieme di paragrafi di testoInline: parte di testo, anche paragrafi interi, con valore semantico (rif, mmod, quotedText)Marker: elemento empty che serve per posizionare in un certo punto del testo un metadato (es. nota al testo)MetaContainer: insieme di metadati
ReferencesBing, J. 2003. The Policies of Legal Information Services: A Perspective of Three Decades. In Yulex2003. Ed. L. A. Bygrave, 37–55. Oslo: Norwegian Research Centre for Computers and Law
Arnold-Moore, T. 1997. Automatic generation of amendment legislation. In Proceedings of the ICAIL1997
Africa i-Parliament, and UNDESA. AKOMA NTOSO, 2007
Commission of the European Communities. 2002. BetterLawmaking 2002. A shared Responsibility, CommissionReport to the European Council, COM(1998) 715 final.
Commission of the European Communities. 2006. A strategic review of Better Regulation in the European