Download - Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Transcript

Linguaggi di marcatura in ambito giuridico

Prof. Monica Palmirani – CIRSFIDUniversità di Bologna, Facoltà di Giurisprudenza

Standardizzazione

Per standardizzazione si definisce quel processo attraverso il quale una comunità che utilizza procedimenti/tecniche/metodi prima diversi fra loro trovano un punto di armonizzazione e di normalizzazione intorno ad un unico modelloIn informatica la standardizzazione è un elemento importante per

l’interoperabilità dei sistemi informatici (software e processi), la condivisione dei dati (dati)l’uniformità dei protocolli (reti)

Page 2: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Standard aperti e standard chiusi

Standard aperti: standard le cui norme tecniche sono note, diffuse, e ampiamente documentateStandard chiusi: standard di fatto imposti sul mercato di cui non si conoscono le norme tecniche e non vi è conoscenza di uso diffusa né documentazione

Non si devono confondere gli standard aperti con l’open sourcePossono esservi standard aperti ma proprietari (RTF- Microsoft)

Formato chiuso: word

Page 3: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Formato Aperto: XML

Ruolo degli standard

Specialmente gli standard aperti svolgono i seguenti ruoli:Ruolo socio-economico: armonizzare il mercato, favorire gli attori deboli, mettere in circolo competenzeRuolo normatore: bilanciamento di vari interessi, attutire la forza dei monopoli a favore della qualitàRuolo tecnologico: favorire la leva competitiva e l’innovazione, mettere in circolo conoscenza

Il processo di creazione di uno standard aperto passa attraversofasi di proposta, discussione, convergenza di un compromesso, condivisione, accettazione del compromesso

Page 4: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Processo di formazione degli standard

Il processo di creazione di uno standard aperto passa attraversodiverse fasi:proposta da parte di un gruppo (working draft)pubblicazione della propostaraccolta di commenti (call for comments)discussione dei commenti e riformulazione di un nuovo documento working draftconvergenza verso una soluzione di compromesso (Candidate Raccomandation)condivisione della soluzione (Proposed Raccomandation)votazionedefinizione di una <<norma tecnica>> -W3C raccomandation

Esempio nel WAI

Page 5: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Organismi di standardizzazione per l’ICT (http://www.cnipa.gov.it/site/_files/Standard.pdf)

W3C: organo di governo degli standard WWW

Vantaggi e svantaggi

Vantaggi:l’interoperabilità fra sistemi informatici, dati, reti, processi, etc.circolazione della conoscenza e delle competenze leva al cambiamento e all’innovazione distribuita alla collettivitàgaranzia di aderenza ad un livello condiviso di qualità

SvantaggiLa soluzione di compromesso (lo standard) non necessariamente è la scelta miglioreLe lobby possono influenzare lo standardLa creatività è sacrificata in nome dell’efficienzaLa standardizzazione sfavorisce il pluralismo di pensiero

Page 6: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Perché parliamo di standard in ambito giuridico

L’informazione giuridica è una particolare fonte di informazioneEssa deve preservare nel tempo:

Integrità del contenutoValidità legale del contenutoInteroperabilità fra sistemi che la usanoIndipendenza dal supporto su cui è stata creata per garantirne l’accessibilità nel tempo

Nel passaggio dalla carta al digitale (processo di dematerializzazione) l’informazione giuridica necessita di garanzie e qualità e gli standard possono aiutare in questo passaggio

Esempi di standardizzazione di informazione giuridica e XML

NormeinRete: standard nazionali per i nomi URN e per la strutturazione dei testi legislativi in XML

Circolare 6 novembre 2001, n. AIPA/CR/35 “Assegnazione dei nomi uniformi ai documenti giuridici”Circolare 22 aprile 2002 n. AIPA/CR/40 “ Formato per la rappresentazione elettronica dei provvedimenti normativi tramiteil linguaggio di marcatura XML”

Processo civile telematico: standard nazionale per lo scambio elettronico delle pratiche di rito civile fra le cancellerie e gli avvocatiProtocollo Informatico:

Circolare 7 maggio 2001, n. 28 - “Tali informazioni sono incluse nella segnatura informatica di ciascun messaggio protocollato e sono codificate in formato XML ”

eGov: circolazione dei dati fra pubbliche amministrazioni

Page 7: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Parliamo di testiIl testo è una forma destrutturataLa semantica delle parti non è esplicitataNecessita di tecnologie apposite per essere rappresentato, elaborato, archiviato, ricercatoNon si può pensare di utilizzare le stesse tecniche dei database a meno di scomporre il testo in campiEs: una fattura è un documento ma la posso comporre in parti strutturate (testa, righe, coda). Il testo viene mappato in campi. La semantica è espressa attraverso la posizione che assume nella tabella (coppia: campo,valore), ma si perde l’integrità del documento

Codice prodotto Quantità Prezzo Sconto

Linguaggio di marcaturaPer linguaggio di marcatura intendiamo un qualsiasi meccanismo di annotazione che consenta di evidenziare una parte del testo ed assegnargli un significatoIl processo di marcatura arricchisce il testo con elementiaggiuntivi i quali racchiudono parti di contenutoGli elementi che consentono di marcare il testo si dicono marcatori e vengono chiamati tagI tag sono composti da un elemento di apertura e da un elemento di chiusura<title>La divina commedia</title>

apertura chiusura

Page 8: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Linguaggio di marcatura

Solitamente il linguaggio di marcatura cerca di:lasciare inalterato il documento originale nel suo contenuto rispettando l’autoredistinguere i tag che servono alla stampa/presentazione da quelli che servono per rappresentare il contenutoapporre in modo evidente e separato tutti gli elementi aggiuntivi di arricchimento del testo ossia di informazioni sul documento che non sono contenute nel documento stesso (metadati)non piegare la rappresentazione del documento a nessuna funzione di processo in particolare ma cercare di rappresentare l’essenza ontologica del documento

Esempi

Quando si stampa un libro si appongono delle marcature tipografiche (grassetto, corsivo, sottolineato, ecc.)

Quando si sottolinea con un evidenziatore le parti rilevanti di un testo si applica un processo di marcatura

I glossatori della scuola di Irnerio apponevano segni di distinzione nel testo arricchendo il testo stesso con note

HTML è un linguaggio di marcatura

Page 9: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Tipi di Markup

La marcatura può avere diverse funzioni:Puntuazionale – di punteggiaturaPresentazionale – tipograficheProcedurale – di impaginazione, per l’elaborazioneDescrittivo – per descrivere parti significative del testo: titolo, autore, editore di un testoReferenziale – per collegare parti di testo interne fra loro (note a piè di pagina, riferimenti incrociati) o collegare parti di un testo con un altro (link) Meta-markup – per descrivere il modello di marcatura

Breve storia del markup

GCA-GenCode e IBM-GML (1968-70)

GenCode è il risultato della standardizzazione dei codici di tipografia (Graphics CommunicationsAssociation)

Generalized Markup Language di IBM è il linguaggio di markup per la documentazione interna e il prodotto BookMaster

1986: SGML è standard ISO 8879

Nel 1988 il dip. della difesa americano (DoD) adotta SGML per l’iniziativa CALS (Continuous AidedLogistic Support)

Page 10: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Breve storia del markup1991: HTML

Tim Berners Lee (CERN - Ginevra) inventa il “World Wide Web”HTML è “ispirato” ad SGML. Solo in seguito verrà corretto per adeguarsi a SGML

1997: XMLNel 1995 il W3C decise di creare un linguaggio di markup con la completezza di SGML e la semplicità di HTML: Extensible Markup Language (XML) Nel 1997 è uscito il primo standard per il linguaggio di markup (XML 1.0). In seguito i linguaggi connessi (XML-Namespaces, X-Pointer, X-Link, XSL, XPath, ecc.)

Alcuni esempi

Rich text format RTF – linguaggio di marcatura

presentazionale di proprietà della Microsoft

LaTex – linguaggio di marcatura a scopi tipografici

HTML – linguaggio di marcatura presentazionale e

referenziale (creare ipertesti)

XML – linguaggio di marcatura descrittivo, meta-

linguaggio

HTML

L’HTML è un linguaggio di marcatura Contiene un numero limitato di tag per questo si dice chiuso, non estensibileNon distingue lo strato di rappresentazione del contenuto con lo strato di presentazione grafica del contenuto:

<title> è un tag HTML che definisce il titolo della finestra di un file HTML<b> è un tag HTML che definisce la marcatura in bold della parte racchiusa dal tag

Non è gerarchicoNon è rigoroso (es: vi possono essere tag aperti)

XML

XML – eXstansible Markup Language

Nato per la descrizione documentale viene poi applicato con successo anche nella descrizione di dati strutturati

E’ un meta-linguaggio (linguaggio per creare linguaggi) per questo estensibile ossia si possono definire nuovi tag

Distingue lo strato di rappresentazione del contenuto con lo strato di presentazione grafica del contenuto:

Page 12: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

XML

E’ gerarchicoE’ rigorosoE’ un formato aperto non proprietarioE’ indipendente dalla piattaforma hardware e softwareE’ indipendente dagli applicativi

Sintassi dei Tag

Tag di apertura e tag di chiusuraVi sono regole di definizione per la composizione dei tag ossia

vi sono caratteri riservati non possono iniziare con numerinon si possono usare spaziè key sensitivei commenti hanno una loro sintassi

Page 13: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Regole di well-formed

Un documento si dice wee-formed quando rispetta le regole sintattiche del linguaggio XML

Deve iniziare con una riga dichiarativa chiamata processing instruction<?xml version=“versione” encoding=“codifica”?>Deve esistere sempre un elemento radiceIl tag iniziale corrisponde tag finaleGli elementi vanno chiusi seguendo la gerarchiaI nomi dei tag devono essere univociI valori degli attributi devono essere specificati fra apiciun elemento non può avere due volte lo stesso attributoPer i caratteri riservati si usano gli entity-name

> &gt< &lt

La struttura ad albero

Page 14: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Struttura ad albero di un XML-schema

Sotto-definizione di una parte dell’albero

Page 15: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

URI, URN, PURL

Prof. Monica Palmirani – CIRSFIDUniversità di Bologna, Facoltà di Giurisprudenza

Corso di Elementi di [email protected]

URIIETF ha prodotto RFC per definire la sintassi degli:

URI – Uniform resource identifier<uri> ::= <schema> “:” <parte-specifica>URN – Uniform resource name<URN> ::= "urn:" <NID> ":" <NSS>URL – Uniform resource locator

http://host[:port]/path[#fragment][?query]http://www.dexa.org:9004/PC-onlinehttp://normaxml.cirfid.unibo.it/cobo/document.jsp?d=00000055http://www.giustizia.it/cassazione/leggi/dlgs196_2003.html#art56

URL URN

URIURL semi

permanenti

Page 16: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Gli indirizzi URL

URL e’ uno schema di denominazione per specificare come e dove sia possibile reperire una risorsa Internet (caso particolare, un documento Web)

Formato di un URL per reperire documento WWW:http: e’ il protocollo alla base del Web. A volte e’ sottinteso.Nome del dominio (obbligatorio): e’ il nome di un computer permanentemente collegato in InternetPercorso del file: e’ il percorso per reperire un file all’interno del computer specificato.Identificatore del frammento (opzionale): indica il nome di una parte specifica del documento.

URN – Uniform Resource Name

L’URN di una risorsa in rete è il nome che identifica in modo univoco la risorsa attraverso le caratteristiche della risorsa e non con un nome di fantasia deciso dall’informaticoL’IETF(Internet Engineering Task Force) ha definito i criteri per costruire l’URN delle risorse nella reteL’URN attraverso una tabella di corrispondenza viene tradotto nell’URL, per la localizzazione della risorsa stessaNIR ha definito regole di naming per gli URN delle risorse giuridiche legislative italiane

Page 17: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Caratteristiche dell’URN

Crea un nome logico sulla base delle caratteristiche della risorsaLe caratteristiche devono essere:

Parlanti e significativePermanenti nel tempo e staticheOggettive e facilmente identificabili

Risolutore

Il meccanismo degli URN necessita di un risolutore ossia un software che traduce l’URN il URLURN = nome logico univoco della risorsa in rete e indipendente dalla sua posizione fisicaURL = nome fisico della risorsa in rete

URN URL

urn:nir:stato:decreto.legislativo:2003-06-30;19611.Html174.Htm03196dl.htm

risolutore

Page 18: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Vantaggi/svantaggi dell’URN

L’URN rende persistente il riferimento alla risorsa perché utilizza dati logici abbinati alla risorsa che descriveAbbiamo bisogno sempre di un risolutoreNon tutti interpretano nello stesso modo i dati univoci logici abbinati alla risorsa

Perché usare l’URN

Identificazione chiara dei documenti giuridici indipendente dalla localizzazioneIl nome è costruito mediante le caratteristiche di un testo normativo ossia l’autorità, il tipo di atto, gli estremi e non secondo le logiche del programmatoreConsente di ricercare i documenti indipendentemente dalla logica della banca dati Consente di navigare i riferimenti normativi anche fra banche dati diverse. Questo favorisce:

ConsolidamentoRiferimenti passivi

Page 19: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Perché usare l’URN

Identificazione chiara dei documenti giuridici indipendente dalla localizzazione fisica

Persistenza del nome nel tempo perché costruito mediante le caratteristiche statiche, oggettive, significative e non secondo le logiche del programmatore

Accesso alle risorse indipendentemente dalla logica della banca dati

Interoperabilità fra banche dati diverse

Esempio di URN in NormaInRetedelle risorse giuridiche

urn:nir:regione.umbria;giunta:delibera:1998-02-12;14:allegato.a;confini.parco

urn:nir:stato:decreto.legislativo;appalti.pubblici:1992-07-24;358

urn:nir:stato:legge:1996-12-31;675@1997-05-09;1997-05-10

AUTORITA’ TIPODOC ESTREMI ANNESSINIR

data pubblicazione della modifica

data applicazione della modifica

Page 20: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

URN delle risorse giuridiche in NIR

Esempio di URN

Legge n. 675 del 31 dicembre 1996

urn:nir:stato:legge:1996-12-31;675<autorità> ":" <provvedimento> ":" <estremi>

URI di AKOMA NTOSO e Metalex

Esempio di URI

Legge n. 675 del 31 dicembre 1996

it/act/1996-12-13/675/itait/act/1996-12-13/675/ita@ originaleit/act/1996-12-13/675/ita@2002-01-01 versione it/act/1996-12-13/675/ita@2002-01-01/main.xml

Country/typeAct/dateAct/numAct/langAct@version/main.xml

Page 21: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

URI/URN: quando si producono le versioni

VersioningChain

Temporal Axis

t0 tnti ti+1 tn+1t1 t2

….V0 V1 V2 V5 V7V6….

M0 M1Mn-1

….

Sequence of Modifications

(t2, t5, t12)

L’URN acquista dopo la @ la data di applicazione della modifica

urn@t2 urn@t5 urn@t8 urn@t12urn

WORK

EXPRESSIONCOMPONENTS

MANIFESTATION

ITEM

ACT 3/2006au/act/2006-12-12/34

COMPONENTS

VERSION n.2 of the ACT 3/2006au/act/2006-12-12/34/eng@2008

Document model

FILE XMLof the VERSION 2 of the ACT 3/2006au/act/2006-12-12/34/eng@2008/main.xml

Specific FILE XML on the server of the VERSION 2 of the ACT 3/2006

mainschedule1schedule2table1

COMPONENTS

Page 22: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

WORK

EXPRESSIONCOMPONENTS

MANIFESTATION

ITEM

ACT 3/2006

COMPONENTS

VERSION 2 of the ACT 3/2006

Metadata model

FILE XMLof the VERSION 2 of the ACT 3/2006

Specific FILE XML on the server of the VERSION 2 of the ACT 3/2006

mainschedule1schedule2table1

Metadata

XML elementi di base

Prof. Monica Palmirani – CIRSFIDUniversità di Bologna, Facoltà di Giurisprudenza

Corso di Elementi di [email protected]

Page 23: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Componenti essenziali dell’XML

ElementiAttributiEntitàNamespace

Gli elementiElementi = ossatura del file XML

Elementi = etichette per la qualificazione del testoEsiste sempre un elemento radice detto root

L’elemento viene definito tramite i due tag di apertura e chiusura

<tipoDoc>Decreto legislativo</tipoDoc> elemento tipoDoc<numDoc>171</numDoc> elemento numDoc

<titoloDoc>Disposizioni in materia di tutela della vita privata nel settore delle telecomunicazioni, in attuazione della direttiva 97/66/CE del Parlamento europeo e del Consiglio, ed in tema di attività giornalistica

</titoloDoc> elemento titoloDoc

<dataDoc norm="19980513">13 maggio 1998</dataDoc> elemento dataDoc

Page 24: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Elementi e sotto_elementi<intestazione>

<tipoDoc> Decreto legislativo</tipoDoc> <numDoc>171</numDoc> <titoloDoc >Disposizioni in materia di tutela della vita privata nel settore

delle telecomunicazioni, in attuazione della direttiva 97/66/CE del Parlamento europeo e del Consiglio, ed in tema di attività giornalistica</titoloDoc>

<titoloDoc tipo=“breve” nome=“Codice Privacy”/> <dataDoc norm=“19980513”>13 maggio 98</dataDoc>

</intestazione>

intestazione è formato dai sotto elementitipoDoc, numDoc, titoloDoc, dataDoc

La gerarchia è data dalla chiusura dei tag e dal meccanismo di inclusione degli stessi

Attributi

Gli attributi sono informazioni note del testo ma non presenti nel testo e quindi devono essere inseriti in appositi spazi mediante il meccanismo denominato “nome-valore”Il nome è fissoIl valore varia<pubblicazione tipo="Gazzetta Ufficiale" num="127" norm="19980603" /> Attributi dell’elemento pubblicazione:

TipoNumNorm (data pubblicazione normalizzata ossia annomesegiorno)

NOME VALORE

Page 25: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Documenti ben formati e validi

un documento XML è ben formato (well-formed) quando rispetta le regole di sintassi del linguaggio stesso

un documento XML è valido se è conforme ad un modello prestabilito che ne descrive gli elementi, la struttura, i vincoli fra gli elementi

tali vincoli vengono definite mediante una grammaticadefinire un modello consente di passare dallo strato di meta-linguaggio al linguaggio

vi sono due diverse tecnologie per definire modelli:

DTD – document type definition

XML - Schema

Differenze fra DTD e XML-schema

DTD sono nate primasono più leggibili all’uomosono più adatte a modellare testinon possono definire le tipologie di datinon possono definire classi ed ereditarietà fra classinon si possono imporre limitazioni ai tipiliste di attributi uguali non si possono definireusano un linguaggio di definizione non XML

Page 26: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Differenze fra DTD e XML-schema

XML-schema sono nate dopo per sanare le precedenti lacunesono meno leggibili all’uomo più leggibili alla macchinasono più adatte a modellare dati strutturatipossono definire tipologie di dati complessipossono definire classi ed ereditarietà fra classipossono imporre limitazioni ai tipisi possono definire liste di attributi ugualisono definite in XML

Esercitazione

<?xml version="1.0" encoding="ISO-8859-1"?>Elemento ROOTMarcare con gli elementi baseInserire gli attributiVerificare la well-formedInserire la DTDValidare al sitohttp://www.stg.brown.edu/service/xmlvalid/

Page 27: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Perché definire modelli

per creare standardizzazioneper incentivare l’interoperabilità sia fra gli uomini sia

fra gli applicativiper dare regole prescrittiveper formalizzare regole descrittiveper creare schemi di comportamento uniformi

(processi)per condividere metadati all’interno di una comunità

Sintassi delle DTDELEMENTIATTRIBUTIENTITA’NAMESPACE

Le DTD si possono definire sia dentro il documento XML direttamente<!DOCTYPE nome_elemento_root [ definizione della DTD ]>

Sia esternamente in un file separato. In questo caso occorre richiamarlo dal file XML con l’istruzione<!DOCTYPE nome_elemento_root SYSTEM|PUBLICURI>

Page 28: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Sintassi dell’elemento

<!ELEMENT nome_elemento tipo_elemento>

Il tipo_elemento può essere:#PCDATA - testoANYEMPTYelemento complesso composto da altri elementientitàContent model misto

L’elemento complesso è così definibile:<!ELEMENT nome_elemento (sub_e1, sub_e2, sub_en)>Dove l’ordine di posizionamento dei sub elementi nel testo è vincolante<!ELEMENT nome_elemento (sub_e1| sub_e2| sub_en)>Dove i sub_elementi sono fra loro in alternativa

Content model misto

La sintassi DTD permette il content model misto ma occorre arrivare a compromessiI sub-elementi devono essere dichiarati in alternativa rinunciando così alla caratteristica prescrittiva dell’ordineEsempio

Page 29: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Sintassi dell’elemento

<!ELEMENT nome_elemento tipo_elemento>

L’elemento può essere Facoltativo ? Multiplo obbligatorio + (da 1 a molti)Multiplo facoltativo * (da 0 a molti)

<!ELEMENT nome_elemento ((sub_e1)?, (sub_e2)*, (sub_en)+>

Sintassi degli attributi

<!ATTLIST nome_elementonomeattributo tipo_attributo valori_default>

<!ELEMENT rango EMPTY><!ATTLIST rango

tipo %tiporango; #REQUIRED>

Page 30: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Tipi degli attributi

CDATA - testoENTITY – una qualsiasi entità definitaIDIDREFIDREFSLista di valori fra i quali se ne può scegliere uno

<!ATTLIST giurisprudenzaeffetto (normativo | interpretativo) #IMPLIED

Default degli attributi

#REQUIRED - obbligatorio#IMPLIED - facoltativo#FIXED – un valore fissato

Page 31: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Sintassi delle entità

Parti di testo richiamabili all’interno delle DTD in ogni posizionePermette di definire parti ricorrenti una sola volta e di richiamarleIn questo modo si armonizzano le definizioni, si minimizzano gli errori, si contiene il lavoro di modificazione-aggiornamento della DTD

Entità generali Entità parametricheEntità esterne

Entità generali

Entità generali <!ENTITY CIRSFID “Centro Interdipartimentale di

Filosofia del Diritto e di Informatica Giuridica”>

Uso nel documento XML<testo>Il &CIRSFID si occupa di…</testo>

Risultato espansoIl Centro Interdipartimentale di Filosofia del Diritto …

Page 32: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Entità parametriche

Sono oggetti di specifica che si definiscono nel DTD e si usano al suo interno

<!ENTITY % docarticolato "(meta, intestazione, formulainiziale, articolato, formulafinale, conclusione, annessi?)">

<!ELEMENT Legge (%docarticolato;)>

Entità esterne

Sono richiami a pezzi di DTD che sono esterni

<!ENTITY % nrmDTD SYSTEM "./norme.dtd">

Page 33: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Dichiarazione del DTD

Due modi di dichiarare l’uso di un DTD dentro al file XML

Richiamare un DTD esterno<!DOCTYPE nome_radice SYSTEM "..\..\DTD\nirloose.dtd">

Inserire il DTD internamente<!DOCTYPE nome_radice [<!ELEMENT…>

]>Misto

Inserire il DTD internamente<!DOCTYPE nome_radice SYSTEM "..\..\DTD\nirloose.dtd“ [

<!ELEMENT]>

Namspace

Elementi diversi possono avere nomi uguali allora come fare?Per risolvere il potenziale conflitto di nomi sui TAG definiti da più comunità si usano dei prefissi prima del nome del tag

prefisso:nometag

Math:title diverso da Phisic:title

Page 34: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Parser

Parser non validantiParser validanti

DomCarica tutto l’albero in memoria e lo esamina in modo atomico

SaxCarica solo la parte di albero sollecitata da un evento e quindi ha in memoria solo un frammento del documento

altri

XSLT

XSLT è un linguaggio della famiglia XML per la trasformazione di un file XML in altri file o XML o HTML o altri formatiXSLT trasforma mediante un processo il file originale XMLXSLT viene utilizzato per diversi scopi:

per trasformare un XML in un altro XML - per esempio quando si cambia versione della DTD occorre trasformare il file precedente in un nuovo file XML valido per la nuova DTD per inserire delle istruzioni di processo – per esempio per poi dare il risultato ad DBMSper visualizzare graficamente il file XML e renderlo quindi fruibile tramite i browser

Page 35: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Meccanismo XSLT

XML XSLTHTML

XML

PDF

Alcuni browser supportano l’engine XSLT standard e quindi fornendo le specifiche di layout si può direttamente dal browser visualizzare il documento nel formato di presentazione desideratoAltri browser non supportano l’engine e quindi occorre trasformare l’XML in HTML

Riferimenti

E. Rusty Harold, W. Scott Means, XML Guida di riferimento, Apogeo, O’Reilly

Cap. 1, 2, 3, 6

Page 36: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Metodologia di marcatura di un documento giuridico

Prof. Monica Palmirani – CIRSFIDUniversità di Bologna, Facoltà di Giurisprudenza

Corso di Elementi di [email protected]

Goal

Come marcare un documento giuridico

Di cosa abbiamo bisogno?

Analizzare il documento dal punto di vista giuridico prima di tuttoConoscere lo standard di marcaturaConoscere lo standard di naming delle risorseinformatiche

Page 37: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Senario

Abbiamo 3 scenari possibili:marcare un documenro giuridico già redatto (marcare in XML)

usare un tool che converte in modo semi-automaticomediante parser un documento esistenteusare un XMLeditor e maracare manualmente

costruire un documento e nel mentre “salvarlo” in XML (legal drafting)consolidare un documento (consolidamento)

Scenarios

Editor

repository

Local Naming

UniqueNamingURI

Page 38: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Analisi giuridica

Methodology

1. Separare il contenuto dal layer di presentazione

2. Analizzare la struttura3. Analizzare i metadati4. Analizzare i riferimenti5. Analizzare le azioni di modifica o di

contenuto nel testo giuridico

Page 39: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

1. Separare il contenuto dal layer di presentazione

Contenuto: tutto il testo approvato

dall’assemblea o dall’organi preposto

(avente i poteri)

Metadata: ogni dato aggiuntivo di arricchimento

del contenuto

Presentation: stile di pubblicazione o

presentazione (e.g. Official Gazette)

Metadata –number and source of publication

Presentation-orientedtextPresentation-orientedtext

Metadata- date of publicationMetadata- date of publication

Presentation-orientedtextPresentation-orientedtext

Page 40: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Presentation-orientedtextPresentation-orientedtext

ContentContent

Metadata- date of publicationMetadata- date of publication

Presentation-orientedtextPresentation-orientedtext

Side notesSide notes

Page 41: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Analisi della struttura e dei metadati documentali

Scelta del tipo di documento e URI

Ogni documento ha una sua struttura astrattaPer prima cosa occorre scegliere il tipo di documento all’interno dello standard che meglio accoglie e rappresenta la struttura giuridica e formale del documento da marcareSecondariamente dare un nome al documento – URI – mediante i metadati persistenti che rappresentano il documento

Page 42: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

I metadati

Ogni standard ha una metodologia per marcare i metadati. Principalmente abbiamo quattro modalità per farlo:

come elementi raggruppati in una parte dedicata a isolare tutti i meta dal contenuto mediante un contenitore metainline ossia isolando una parte di testo e assegnandogli un significato speciale (es. virgolette o rif in NIR, quotedText e ref in Akoma Ntoso)marker ossia inserendo degli elementi vuoti all’interno del testo con attributi idonei. I marker sono collocate on-the-place ossia nel punto esatto in cui servono nel testo (es. ndr in NIR per segnare nel testo la presenza di una nota)mediante attributi di elementi (sconsigliato perché non consente di isolare facilmente il contenuto dal metadato, se vi sono molti attributi non è in forma serializzabile RDF e quindi di difficile gestione, si possono creare anomalie e inconsistenze)

Metadati oggettivi vs. metadati soggettivi

Esistono metadati documentali e oggettivie metadati soggettivi legati più all’interpretazione del contenuto normativo e giuridico del testoPer i primi l’analisi spesso è effettuata insieme all’analisi della struttura perché è difficile distinguere con certezza ciò che è contenuto e metadatoLa data di pubblicazione in gazzetta infatti può essere un metadato della legge, ma è sicuramente contenuto per la copia digitale della gazzetta ufficiale intesa come fonte biblioteconomica di pubblicazioneQueste incertezze ci saranno sempre perché l’oggetto di analisi cambia a seconda della fase del procedimento nella quale si introduce la marcatura

Page 43: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Struttura della intestazione o prefaceType of doc - ActTypeProponentTitle - ActTitleNumber - ActNumberDate of assent - ActDateDate of commencement (metadata) - metaDate of publication (metadata) - metaNumber of Gazette (metadata) - metaTable of content (TOC)

Struttura di un atto normativoParte iniziale suddivisa in:

Intestazione – prefacePreambolo – preamble (non sempre c’è es. nella legge non c’è)

Solitamente il premabolo è non normativo (in Italia per esempio) e i link sono tutti da considerarsi statici ossia navigabili e riferibili al documento Il preambolo motiva l’atto normativo o fornisce la storia giuridica che ha condotto all’atto normativo

Parte normativa che può avere diverse forme:articolato (leggi)punti gerarchici (alcuni atti secondari o allegati)blocchi destrutturati (provvedimenti del Garante Privacy)

Parte conclusivafirmetimbriregistrazioni presso la Corte dei Conti

Allegati

Page 44: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Metadata –number and source of publication

prefacepreface

preamblepreamble

bodybody

Preambolo in ambitointernazionale

CitationsList of other legislation resources that empower the current document

Recitalsjustifications and motivations

Page 45: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Conclusioni

Data della firmaLuogo della firma FirmeTimbto

Annessi o allegati

Tre tipi di allegatiA) Schedules that integrate the main act: they are not independent. E.g.: Tables, annexes, pictures, etc.

B) Schedules that are annexed acts: they are independent. E.g.: International Treaties

C) Informative schedules: they are not normative.

Page 46: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Schedule type A)Schedule type A)

imageimage

Example of schedule

Example of main

XML giuridico

Prof. Monica Palmirani – CIRSFIDUniversità di Bologna, Facoltà di Giurisprudenza

Corso di Elementi di [email protected]

Page 47: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Molti standard giuridiciFORMEX data model di EUR-LEXMetaLex and SDU BWB LexDania in Denmark, eLaw in AustriaCHLexML in Svizzara,the Crown XML Schema for Legislation in United Kingdom NormeinRete in Italia,AKOMA NTOSO - United Nations Department of Economic and Social Affairs (UNDESA) Pan-African Parliaments OrganizationEnAct - Tasmania, Australia, New Zealand e CanadaLexMLBrazil - Senate of the Brazil Republic United States House of Representatives

Iniziative ibride invece sono:Legifrance in FranceeBundesanzeiger in GermanyFinlex in Finland

Metalex/CEN

MetaLex/CEN – Open XML interchange format for legal and legislative resourcesnato nel 2005standard di interscambio fra standard XML giuridici ossia orientati alle fonti cognitive del dirittoPromosso dal CEN organo di standardizzazione europeo

Page 48: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Modellazione dell’atto normativoStrutturale

Struttura principale dell’atto e degli allegatiRiferimenti normativi

Semantico (Metadati)Metadati oggettivi dell’atto (data di pubblicazione, workflow, etc.)Classificazione del documento (thesaurus, etc.)Ciclo di vita dell’attoQualificazione dei riferimenti normativiQualificazione delle disposizioni

Logico-GiuridicoInterpretazione delle disposizioni

Carattaristiche della modellazione XML di documenti giuridici

Document oriented vs. Data orientedDescrittivo e prescrittivo (regole di buona formazione degli atti giuridici)Preservare l’inalterabilità del testo giuridicoSeparare i metadati di processo, di catalogazione, di annotazione, etc. dal contenutoDistinguere le parti presentazionali con contenuto semantico-giuridico dalle specifiche di layoutPattern oriented

Page 49: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Carattaristiche della modellazione XML di documenti giuridici

Document oriented vs. Data orientedlo standard che modella i documenti giuridici in XML deve essere rispettoso del documento nella sua interezza in modo che possa “viaggiare” in Internet indipendentemente dagli applicativi, dalle strutture logiche dei database, dalle piattaforme hardwareOrientato al documento e non ai dati, spesso infatti nelle prime implementazioni l’XML era usato come un formato dato di interoperabilità e interscambio fra database o legacy systemQuesto creava necessariamente una frammentazione del testo dentro una logica di database rigido e quindi la ricomposizione poi del testo giuridico risultava mutilata di molti aspetti prettamente legai alla valenza giuridica

Carattaristiche della modellazione XML di documenti giuridici

Descrittivo e prescrittivoTutti gli standard XML giuridici si ispirano a un manuale di buona normazione nazionale o sovra-nazionale e quindi sono perneatida una forte caratteristica di prescrittività (regole del manuale riportate all’interno della DTD o dell’XML-schema)Questo approccio però preclude la marcatura di tutti i testi chenon osservano le regole di buona normazione (regole di legaldrafting – vedi lezione n. 2)Per questo attualmente negli schemi più moderni si contempera sempre una buona dose di flessibilità ad una dose non eccessiva di prescrittività lasciando quest’ultima allo strato applicativoLa descrittività invece viene ampiamente tutelata in modo che il marcatore trovi semplice ed intuitivo marcare utilizzando un certo tag vicino alla propria cultura giuridica (es. section per gli anglofoni è il corrispondente del nostro articolo)

Page 50: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Carattaristiche della modellazione XML di documenti giuridici

Preservare l’inalterabilità del testo giuridicoL’inalterabilità del testo giuridico nel tempo è una prerogativa essenziale per la conservazione nel tempo non solo del contenuto informativo ma anche della valenza legale del testo

Carattaristiche della modellazione XML di documenti giuridici

Separare i metadati di processo, di catalogazione, di annotazione, etc. dal contenuto

Separare quindi tutto ciò che è contenuto da quanto invece apposto in un secondo tempo da altri attori (documentalisti, database, applicazioni, protocolli, processi di pubblicazione, etc.) è un elemento essenziale di preservazione della fonte cognitiva del diritto

Page 51: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Carattaristiche della modellazione XML di documenti giuridici

Distinguere le parti presentazionali con contenuto semantico-giuridico dalle specifiche di layout

Separare chiaramente la parte presentazionale(layout desiderato a stampa, in gazzetta, sul web, via telefono, etc.) dal contenuto è indice di pulizia, trasparenza e perdurabilità nel tempo del documento giuridico

Esempio dei tre livelli in Akoma Ntoso: contenuto, metadato, ontologia

CONTENT

METADATA

Link to the ONTOLOGY

Page 52: Linguaggi di marcatura in ambito giuridico · 2009-02-24 · Breve storia del markup z1991: HTML zTim Berners Lee (CERN - Ginevra) inventa il “World Wide Web” zHTML è “ispirato”

Carattaristiche della modellazione XML di documenti giuridici

Pattern oriented [articoloVitali]Il design dello schema o della DTD deve modellare gli elementi tenendo conto di classi proptotipali che definiscono il comportamento dell’elemento attraverso alcune proprietàQuesto facilita gli applicativi, la presentazione, l’interoperabilità

Tipi di pattern in XMLContainer: insieme di blocchiBlocchi: insieme di paragrafi di testoInline: parte di testo, anche paragrafi interi, con valore semantico (rif, mmod, quotedText)Marker: elemento empty che serve per posizionare in un certo punto del testo un metadato (es. nota al testo)MetaContainer: insieme di metadati

ReferencesBing, J. 2003. The Policies of Legal Information Services: A Perspective of Three Decades. In Yulex2003. Ed. L. A. Bygrave, 37–55. Oslo: Norwegian Research Centre for Computers and Law

Arnold-Moore, T. 1997. Automatic generation of amendment legislation. In Proceedings of the ICAIL1997

Africa i-Parliament, and UNDESA. AKOMA NTOSO, 2007

Commission of the European Communities. 2002. BetterLawmaking 2002. A shared Responsibility, CommissionReport to the European Council, COM(1998) 715 final.

Commission of the European Communities. 2006. A strategic review of Better Regulation in the European