Diapositiva 1

Transcript Diapositiva 1

Sistemi per il recupero delle informazioni
XML
HTML
Il linguaggio HTML



HTML = Hypertext Markup Language
Linguaggio per la costruzione delle pagine web
 definisce come devono essere visualizzate le pagine
 permette di realizzare legami ipertestuali tra pagine diverse
Linguaggio di markup
 indica come disporre gli elementi all’interno di una pagina mediante
delle istruzioni dette “tag”
 i browser leggono il file html, interpretano i tag e visualizzano la pagina
con le giuste formattazioni
Nota: una pagina HTML altro non è che un normalissimo file di testo, che
fa riferimento ad altri elementi separati, come immagini, filmati, file
multimediali.
I tag




Le istruzioni HTML sono formate da parole chiave racchiuse tra i
simboli “<” e “>”
Si introducono dei tag che hanno il formato
 <comando> </comando>
Tutto quello racchiuso tra le coppie di tag deve essere interpretato
secondo quanto specificato dal comando
Esistono tag che non vogliono la chiusura
 <br>
 <hr>
Struttura di una pagina HTML

Template di una pagina web
<html>
<head>
<title> titolo </title>
</head>
<body>
contenuto del documento
</body>
</html>
Struttura di una pagina HTML

<html> </html>: contenitore del documento

è chiuso a fine documento
 contiene due sezioni



<head> </head>
<body> </body>
<head> </head>: contiene informazioni quali

titolo del documento
 fogli di stile
 scripting
 <body> </body>: racchiude il contenuto
Il tag head


Il tag <head> contiene informazioni non visualizzate nel corpo della
pagina
 i motori di ricerca classificano i siti
 queste informazioni servono ai motori di ricerca
Il tag <title> racchiude il titolo della pagina

visibile nella barra del titolo
 il testo contenuto può comparire anche in seguito alla ricerca in un
motore, come titolo del link. Sarà dunque importante impostarlo in modo
pertinente; es:
<head>
<title> Il sito di Anna <title>
</head>
Il tag meta

Il tag <meta> contiene informazioni non visualizzate nel corpo della
pagina
 si tratta di una serie di parole chiave e descrizioni, che aiutano i motori
di ricerca a classificare il sito; la sintassi è
<meta name=“…” content =“…”>

Ad es. il meta-tag "description" permette di impostare una descrizione
sintetica del sito stesso

anche in questo caso, la descrizione compare talvolta nei risultati della
ricerca
<meta name = "description"
Annalisa Pascarella">

content
=
“home
page
di
il meta-tag "keywords" permette di indicare alcuni contenuti relativi al
sito stesso
Il Doc type


DTD = document type definition
 prima di <html>, fornisce le specifiche del documento. Non è
obbligatorio
 di solito generato automaticamente dall'editor. In mancanza, il
documento è identificato come HTML 2.0
es: <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01
Transitional//EN“
http://www.w3.org/TR/html4/loose.dtd >






HTML: il tipo di linguaggio utilizzato è l'HTML
PUBLIC: il documento è pubblico
W3C: il documento fa riferimento alle specifiche del W3C,
- : le specifiche non sono registrate all'ISO. Se lo fossero, sarebbe "+",
DTD HTML 4.01 Transitional: il documento fa riferimento a una DTD, a
seguire c’è l’indirizzo del DTD;
EN: la lingua con cui è scritta la DTD è l'inglese
Un pò di utili tag

<br>

per andare a capo
 non vuole il tag di chiusura!

<hr>


<b> </b> (<i> </i>)


per tracciare una linea orizzontale
per visualizzare in grassetto (in corsivo)
 e possono trovarsi in
qualsiasi punto del documento.
 <!– bla bla bla -->
DOCUMENTI BEN FORMATI – entità

Potrebbe essere necessario inserire in un documento XML dei
caratteri particolari che potrebbero renderlo non ben formato.
 ad esempio, se dobbiamo inserire del testo che contiene il simbolo <,
corriamo il rischio che possa venire interpretato come l'inizio di un
nuovo tag, come nel seguente esempio:
<testo>
il simbolo < indica minore di
</testo>

Per evitare situazioni di questo tipo, XML prevede degli oggetti
speciali detti entità che consentono di sostituire altri caratteri.
DOCUMENTI BEN FORMATI – entità

Cinque entità sono predefinite e consentono l'uso di altrettanti
caratteri riservati all'interno di un documento:
 & definisce il carattere &
 < definisce il carattere <
 > definisce il carattere >
 " definisce il carattere “
 ' definisce il carattere ‘

Sfruttando le entità, l'esempio precedente diventa:
<testo>
il simbolo < indica minore di
</testo>
DOCUMENTI BEN FORMATI – CDATA

In determinate situazioni gli elementi da sostituire con le entità
possono essere molti, il che rischia di rendere illeggibile il testo ad
essere umano.
 si consideri il caso in cui un blocco di testo illustri proprio del codice
XML:
<codice>
<libro>
<capitolo>
</capitolo>
</libro>
</codice>


In questo caso, al posto di sostituire tutte le occorrenze dei simboli
speciali con le corrispondenti entità è possibile utilizzare una sezione
CDATA.
Una sezione CDATA (Character DATA) è un blocco di testo che viene
considerato sempre come testo, anche se contiene codice XML o altri
caratteri speciali.
DOCUMENTI BEN FORMATI – CDATA
Per indicare una sezione CDATA è sufficiente racchiuderla tra le sequenze di
caratteri <![CDATA[ e ]]>.
Il nostro esempio diventerà come segue:
<codice>
<![CDATA[
<libro>
<capitolo>
</capitolo>
</libro>
]]>
</codice>
In certe situazioni non si conosce a priori il contenuto che può essere inserito
in un blocco di testo e pertanto l'utilizzo delle sezioni CDATA risulta
obbligatorio.
DOCUMENTI VALIDI – grammatica





XML offre la libertà di definire i tag a seconda delle necessità, ma per
evitare confusione è necessario un meccanismo che ne vincoli
l'utilizzo all'interno dei documenti. Abbiamo bisogno di definire una
grammatica per il linguaggio di markup che abbiamo ideato.
Una grammatica è un insieme di regole che indica quali vocaboli
(elementi) possono essere utilizzati e con che struttura è possibile
comporre frasi (documenti).
 una grammatica definisce uno specifico linguaggio di markup.
Se un documento XML rispetta le regole definite da una grammatica è
detto valido per un particolare linguaggio.
La caratteristica di documento valido si affianca a quella di documento
ben formato per costruire documenti XML adatti ad essere elaborati
automaticamente.
Un documento ben formato può non essere valido rispetto ad una
grammatica ma non rispetto a un’altra, mentre un documento valido è
necessariamente ben formato.
DOCUMENTI VALIDI – grammatica

Ma come si definisce una grammatica per descrivere un linguaggio di
markup?

Attualmente due sono gli approcci più diffusi alla creazione di
grammatiche per documenti XML:
 Dtd – Document Type Definition
 XML Schema

Questi argomenti saranno affrontati in seguito.
DOCUMENTI VALIDI – tipi di elaborazione

Un documento XML può essere all'origine di diversi tipi di
elaborazione : generazione di altri documenti, eventualmente in
formati diversi, controllo delle impostazioni di programmi,
rappresentazione di immagini, ecc.

Tutti i possibili impieghi di XML, però, si fondano su due tipi di
elaborazione preliminare: la verifica che un documento sia ben
formato e la sua validità rispetto ad una grammatica.

I software che si occupano di queste elaborazioni sono detti parser e
sono degli strumenti standard disponibili sulle diverse piattaforme.
 Il cuore di un applicazione XML è il parser, ovvero quel modulo che
legge il documento XML e ne crea una rappresentazione interna utile
per successive elaborazioni (come la visualizzazione).
DOCUMENTI VALIDI – parser

Possiamo suddividere i parser in due categorie (talvolta può essere lo
stesso parser che assume due ruoli):
 parser non validante è un parser che verifica soltanto se un
documento è ben formato




anche in presenza di un DTD è solo in grado di verificare la buona forma del
documento.
In alcune applicazioni, però, non è necessario validare i documenti, solo
verificare la loro buona forma.
parser validante è un parser che, oltre a verificare che un documento è
ben formato, verifica se è corretto rispetto ad una data grammatica
La maggior parte degli editor XML più recenti hanno un parser
integrato o si appoggiano su parser esterni per effettuare la convalida
dei documenti.
Parte IV
Definizione e applicazione di grammatiche
DTD: Document Type Definition



Una caratteristica fondamentale dell'XML è l'estensibilità. L'autore di
un documento XML può creare nuovi tag per descrivere i contenuti
semantici dei propri dati, semplificando il loro scambio fra i gruppi di
persone interessate allo stesso settore.
 Ciò ha portato alla necessità di definire delle regole grammaticali, o
vincoli, alle quali gli elementi devono attenersi.
Queste regole grammaticali sono definite nelle specifiche XML e sono
codificate nel Document Type Definition (DTD).
 da un punto di vista cronologico il DTD rappresenta il primo approccio
per la definizione di grammatiche per documenti XML
Un Dtd è un documento che descrive i tag utilizzabili in un documento
XML, la loro reciproca relazione nei confronti della struttura del
documento e altre informazioni sugli attributi di ciascun tag.
DTD: Document Type Definition




Le regole grammaticali o vincoli specificano:
 qual è l'insieme degli elementi e degli attributi che si possono usare nel
documento XML
 quali sono le relazioni gerarchiche fra gli elementi
 qual è l'ordine in cui gli elementi appariranno nel documento XML
 quali elementi ed attributi sono opzionali
Il DTD definisce quindi gli elementi legali di un documento XML,
stabilisce le regole degli elementi del documento, cioè determina il
suo modello
Quando un documento XML è ben formato e rispetta le regole del DTD
a cui si riferisce si dice che è un documento XML valido.
La sintassi di un DTD si basa principalmente sulla presenza di due
dichiarazioni: <!ELEMENT> e <!ATTLIST>.
 La prima definisce gli elementi utilizzabili nel documento e la struttura
del documento stesso, la seconda definisce la lista di attributi per
ciascun elemento.
DTD - dichiarazione

Un documento XML che usa un DTD deve dichiararlo con una
Document Type Declaration:
<!DOCTYPE nomeElementoRoot
[ eventuale descrizione
della struttura ]>

segue la descrizione degli elementi, racchiusi fra le parentesi quadre
Definito un DTD abbiamo definito la grammatica per un linguaggio di
markup. A questo punto dobbiamo mettere in relazione un documento
XML con il suo DTD , in modo che un parser XML possa verificare non
soltanto la struttura ben formata del documento, ma anche la sua
validità rispetto alla grammatica specificata.
 Esistono due modi per indicare il Dtd cui un documento XML fa
riferimento. Il DTD può essere


in un file esterno al documento XML
incluso nello stesso documento XML
Entità, documenti e considerazioni su
XML
Il primo modo prevede la presenza del Dtd all'interno del documento XML,
come nel seguente esempio:
<?xml version="1.0">
<!DOCTYPE articolo[
...Definizioni del Dtd...
]>
<articolo>
...Contenuto del documento XML...
</articolo>
La dichiarazione <!DOCTYPE> indica che il documento individuato
dall'elemento root <articolo> segue le regole definite tra le parentesi quadre.
sintassi:
<!DOCTYPE elemento-radice
[
dichiarazione-elementi
]>
Entità, documenti e considerazioni su
XML
Il secondo modo prevede che il Dtd sia definito in un file esterno ed il
documento XML abbia un riferimento a tale file, come nel seguente esempio:
<?xml version="1.0">
<!DOCTYPE articolo SYSTEM "articolo.dtd">
In questo caso si fa riferimento al Dtd definito nel file articolo.dtd.
L'indicazione del file contenente il Dtd può essere espressa come URL
assoluto o relativo.
Ad esempio, se il Dtd viene pubblicato su un sito web è possibile specificare il
riferimento al Dtd come nel seguente esempio:
<!DOCTYPE articolo SYSTEM "http://www.myXML.it/articolo.dtd">
sintassi:
<!DOCTYPE elemento-radice SYSTEM "nome-file">
dove nome-file è un file esterno che contiene il DTD per il documento XML
DTD – <!ELEMENT>

<!ELEMENT> definisce gli elementi utilizzabili nel documento e la
struttura del documento stesso
 posso specificare quali sono gli elementi leciti all’interno di un elemento,
in quale numero e quale posizione rispetto agli altri.

Ad esempio, la dichiarazione
 <!ELEMENT articolo(paragrafo+)>
indica che l'elemento <articolo> ha come sottoelemento uno o più
elementi <paragrafo>.

Il carattere '+', dopo il nome del sottoelemento, indica il relativo
numero di occorrenze.
DTD – <!ELEMENT>

Una dichiarazione di elemento può assumere tre forme.

Prima forma: <!ELEMENT NomeElemento (#PCDATA)>

questa è la forma più semplice in cui si dichiara che un elemento può
contenere come valore una qualsiasi stringa di testo; ad esempio:

<!ELEMENT Rubrica (#PCDATA)>

In questo caso il documento XML che fa riferimento al DTD contenente tale
dichiarazione potrà contenere un elemento del tipo:
...
<Rubrica>DISPOSIZIONI GENERALI</Rubrica>
...
DTD – <!ELEMENT>

Seconda forma: <!ELEMENT NomeElemento EMPTY>

questa è la forma con la quale si dichiara che un elemento è privo di
valore. In questo caso all'elemento sono sempre associati uno o più
attributi:
<!ELEMENT Numero EMPTY>
<!ATTLIST Numero
Valore CDATA #REQUIRED>

e quindi il documento XML che fa riferimento al DTD contenente tale
dichiarazione potrà contenere un elemento del tipo:
...
<Numero Valore="1"/ >
...
DTD – <!ELEMENT>

Terza forma: <!ELEMENT
ElementoFiglio2, ...)>

NomeElemento
(ElementoFiglio1,
questa è la forma a contenitore in cui si dichiara che un elemento è
composto da sottoelementi (figli) con i quali s'instaura una stretta
gerarchia del tipo padre-figlio.
<!ELEMENT Legge (TitoloLegge, Articolato)>
<!ELEMENT TitoloLegge (#PCDATA)>
<!ELEMENT Articolato (...)>

In questo caso il documento XML che fa riferimento al DTD contenente
tale dichiarazione potrà contenere un elemento del tipo:
<Legge>
<TitoloLegge>Disciplina delle associazioni di promozione
sociale</TitoloLegge>
<Articolato>
...
</Articolato>
</Legge>
DTD – <!ELEMENT>

Quando si usa la terza forma per dichiarare gli elementi, i sottoelementi
possono essere specificati in maniera più articolata utilizzando un insieme di
caratteri speciali che ha lo scopo di indicare il numero di occorrenze di un
elemento. In particolare:
 + (indica che l'elemento è presente una o più volte)
 * (indica che l'elemento è presente zero o più volte)
 ? (indica che l'elemento è presente zero o una sola volta, opzionale)
 se non si specifica niente l’elemento deve comparire solo una volta

Per esempio, la definizione
 <!ELEMENT paragrafo(immagine*, testo+)>
indica che
 l'elemento <paragrafo> contiene la sequenza di elementi <immagine> e
<testo>.
 L'elemento <immagine> può essere presente zero o più volte, mentre <testo>
deve essere presente almeno una volta.
Separatori

Separano specifiche determinando l’ordine o l’obbligatorietà:
 ‘,’ (virgola): richiede la presenza di entrambe le specifiche nell’ordine
precisato.


Es.: (a , b): ci devono essere sia a che b, e prima ci deve essere a e poi b.
‘|’ (barra verticale): ammette la presenza di una sola delle due
specifiche.

Es.: (a | b): ci può essere o a, oppure b, ma solo uno di essi.
Esempio
DTD – <!ELEMENT>
Esiste la possibilità di definire elementi il cui contenuto non è definito
a priori, possono cioè essere vuoti o contenere altri elementi senza
vincoli particolari. Per definire questo tipo di elementi si utilizza la
seguente dichiarazione:
 <!ELEMENT elemento ANY>
Ricapitolando…

<!ELEMENT X ANY>

l’elemento X può contenere qualunque altro elemento specificato nel
DTD, o anche testo
<!ELEMENT X EMPTY>

l’elemento X non può contenere niente. Debbo scrivere il tag con la
sintassi tipica degli elementi vuoti: <X/>
<!ELEMENT X #PCDATA>

l’elemento X può solo contenere testo. E’ proibito mettere altri elementi
al suo interno
<!ELEMENT X (Y, (W | Z)+ , K*)>

l’elemento X può contenere solo elementi secondo la specifica data,
usando i separatori e gli operatori di ripetizione specificati.
<!ELEMENT X (#PCDATA | Y | W | Z)*>





L’elemento X può contenere sia testo sia altri elementi in maniera ed
ordine specificati.
Un esempio
Un
libro, fatto di capitoli e a loro volta di paragrafi.
<!DOCTYPE ROMANZO SYSTEM “romanzo.dtd”>
<ROMANZO>
<TITOLO>Tre Uomini in Barca</TITOLO>
<AUTORE>Jerome K. Jerome</AUTORE>
<ANNO>1889</ANNO>
<CAPITOLO>
<TITOLO>Capitolo primo</TITOLO>
<INDICE>
<EL>Tre invalidi</EL><EL>Le sofferenze di George e Harris
</EL><EL>La vittima di centosette malattie inguaribili</EL>
</INDICE>
<PARA>Eravamo in quattro: George, William Samuel Harris,
io, e Montmorency. Standocene seduti in camera mia, fumavamo e
parlavamo di quanto fossimo malridotti… <INCISO>malridotti,
dal punto di vista della salute, <INCISO>intendo,</INCISO>
naturalmente</INCISO>. </PARA>
<PARA>Ci sentivamo tutti piuttosto giù di corda,</PARA>
</CAPITOLO>…
</ROMANZO>
Il file “romanzo.dtd”
<!ELEMENT
<!ELEMENT
<!ELEMENT
<!ELEMENT
<!ELEMENT
<!ELEMENT
<!ELEMENT
<!ELEMENT
<!ELEMENT
ROMANZO
CAPITOLO
TITOLO
AUTORE
ANNO
INDICE
EL
PARA
INCISO
(TITOLO, AUTORE, ANNO, CAPITOLO+)>
(TITOLO, INDICE, PARA+)>
(#PCDATA) >
(#PCDATA) >
(#PCDATA) >
(EL+) >
(#PCDATA) >
(#PCDATA | INCISO) * >
(#PCDATA | INCISO)* >
DTD – <!ATTLIST>

La dichiarazione di attributi all'interno di un DTD identifica:
 quali elementi hanno attributi
 il tipo di attributi
 l'eventuale valore assunto nel caso in cui non venga esplicitamente
assegnato un valore (valore di default)

Una dichiarazione di attributo viene espressa secondo la seguente
sintassi:
<!ATTLIST NomeElemento
NomeAttributo1 TipoAttributo1 ValoreAttributo1
NomeAttributo2 TipoAttributo2 ValoreAttributo2
...
NomeAttributoN TipoAttributoN ValoreAttributoN >
DTD – <!ATTLIST>

ad esempio, la dichiarazione:
 <!ATTLIST articolo titolo CDATA #REQUIRED>
indica che l'elemento <articolo> prevede un attributo titolo che può
averecome valore una qualsiasi combinazione di caratteri (CDATA).


l'indicazione #REQUIRED indica che la presenza dell'attributo è obbligatoria.
I valori di default importanti in XML sono di quattro tipi:
 Valore esplicito: un stringa tra virgolette
 Valore necessario: la keyword #REQUIRED.
 Valore opzionale: la keyword #IMPLIED.
 Valore esplicito e non modificabile: la keyword #FIXED e una stringa
tra virgolette.
DTD – <!ATTLIST>

Se un attributo prevede valori alternativi predefiniti è necessario
specificarli al posto di CDATA, come accade per l'attributo tipo del tag
<paragrafo>
<!ATTLIST paragrafo
titolo CDATA #REQUIRED
tipo (abstract|bibliografia|note) #IMPLIED
>

In questo caso vengono definiti due attributi per l'elemento
<paragrafo> facendo seguire alla definizione del primo attributo
(titolo) quella del secondo (tipo). L'attributo tipo, opzionale, può
assumere uno tra i valori abstract, bibliografia o note.
DTD – <!ATTLIST>
<!ATTLIST
X att CDATA “uno”>
 Il tag iniziale di X può contenere un attributo chiamato “att”. Qualunque
stringa è lecita. Se non viene specificata una stringa, il valore definito per
default è “uno”
<!ATTLIST X att (uno|due|tre)
“due”>
 Il tag iniziale di X può contenere un attributo chiamato “att”. Sono leciti solo i
valori descritti. Se non viene specificata una stringa, il valore definito per
default è “due”
<!ATTLIST X att ID #IMPLIED>
 Il tag iniziale di X può contenere un attributo chiamato “att”. Sono leciti solo
valori unici su tutto il documento. L’elemento X assume identificabilità
assoluta all’interno del documento: è un “luogo notevole”. Poiché il valore
deve essere sempre diverso, non è possibile specificare un valore di default.
<!ATTLIST X att IDREF #IMPLIED>
 Il tag iniziale di X può contenere un attributo chiamato “att”. I valori di “att”
debbono essere uguali ad un valore di un attributo di tipo ID esistente da
qualche parte nel documento.
Esempio, più: attributi ID e IDREF
L’elemento
dell’indice punta al paragrafo che vi si riferisce:
<!DOCTYPE ROMANZO SYSTEM “romanzo.dtd”>
<ROMANZO>
<TITOLO>Tre Uomini in Barca</TITOLO>
<AUTORE>Jerome K. Jerome</AUTORE> <ANNO>1889</ANNO>
<CAPITOLO>
<TITOLO>Capitolo primo</TITOLO>
<INDICE>
<EL p=“uno”>Tre invalidi</EL><EL p=“due”>Le sofferenze di
George e Harris</EL><EL p=“tre”>La vittima di centosette
malattie inguaribili</EL>
</INDICE>
<PARA n=“uno”>Eravamo in quattro: George, William Samuel
Harris, io, e Montmorency. Standocene seduti in camera mia,
fumavamo e parlavamo di quanto fossimo malridotti… <INCISO>
malridotti, dal punto di vista della salute, <INCISO>intendo,
</INCISO> naturalmente</INCISO>. </PARA>
<PARA>Ci sentivamo tutti piuttosto giù di corda,</PARA>
</CAPITOLO>…
</ROMANZO>
Il file “romanzo.dtd”
<!ELEMENT
<!ELEMENT
<!ELEMENT
<!ELEMENT
<!ELEMENT
<!ELEMENT
<!ELEMENT
<!ATTLIST
<!ELEMENT
<!ATTLIST
<!ELEMENT
ROMANZO
(TITOLO, AUTORE, ANNO, CAPITOLO+)>
CAPITOLO (TITOLO, INDICE, PARA+)>
TITOLO
(#PCDATA) >
AUTORE
(#PCDATA) >
ANNO
(#PCDATA) >
INDICE
(EL+) >
EL
(#PCDATA) >
EL p IDREF#REQUIRED >
PARA (#PCDATA | INCISO)* >
PARA n ID #IMPLIED >
INCISO
(#PCDATA | INCISO)* >
DTD - Elemento vs Attributo

Un DTD può essere costruito utilizzando soltanto gli elementi oppure
anche gli attributi. Non esiste una regola generale per scegliere l'una o
l'altra soluzione: la scelta dipende dal contesto che si sta
formalizzando.

L'uso degli attributi può comportare alcuni problemi:
 gli attributi non possono contenere valori multipli
 gli attributi non possono descrivere le strutture
 gli attributi sono più difficili da manipolare dagli applicativi
 gli attributi non possono essere vincolati da legami gerarchici fra di loro
Entità




Abbiamo visto come XML preveda degli elementi, detti entità, che
consentono di sostituire caratteri speciali.
Più in generale, una entità consente di sostituire sequenze di caratteri
con nomi speciali della forma & nome;.
È possibile definire entità personalizzate all'interno di un Dtd in modo
da sostituire qualsiasi sequenza di caratteri.
Per definire un'entità personalizzata si utilizza la dichiarazione
<!ENTITY>.

il seguente esempio mostra la definizione di un'entità & html; che
rappresenta un'abbreviazione per la stringa HyperText Markup
Language:
<!ENTITY html "HyperText Markup Language">

grazie a questa dichiarazione possiamo utilizzare l'entità & html; al
posto dell'intera stringa all'interno del documento XML che fa riferimento
a questa grammatica.
Considerazioni



Utilizzando i DTD abbiamo un maggior controllo sulla struttura e
sull'uso dei tag in un documento XML, evitando che la libertà nella
definizione dei tag possa far perdere il controllo sui contenuti.
Tuttavia l'uso dei DTD per definire la grammatica di un linguaggio di
markup non sempre è del tutto soddisfacente.
Il principale problema: il DTD descrive la struttura di un documento e
non il suo contenuto

A parte il fatto che la sintassi utilizzata per definire un DTD non segue
le regole stesse di XML, i DTD non consentono di specificare un tipo
di dato per il valore degli attributi, né di specificare il numero minimo o
massimo di occorrenze di un tag in un documento o altre
caratteristiche che in determinati contesti consentirebbero di ottenere
un controllo ancora più accurato sulla validità di un documento XML.

Queste limitazioni hanno spinto alla definizione di approcci alternativi
per definire grammatiche per documenti XML. Tra questi approcci il
più noto è XML Schema.
XML Schema

Analogamente ad un Dtd, un XML Schema è una descrizione formale
di una grammatica per un linguaggio di markup basato su XML.

XML Schema è stato pensato per fornire quel supporto di validazione
che i DTD permettono solo parzialmente, in particolare sul contenuto
degli elementi e degli attributi del documenti XML.

I DTD non distinguono tra nome del tag e tipo del tag, ed hanno solo
due tipi: complesso (cioè strutturato) e semplice (cioè CDATA o
#PCDATA). XML Schema, invece, fornisce un set complesso di tipi, a
cui i tag e il loro contenuto debbono aderire.

A differenza di un DTD, che utilizza una propria sintassi specifica, un
XML Schema utilizza la stessa sintassi XML per definire la grammatica
di un linguaggio di markup permettendo l’uso di applicazioni XML per
la verifica della validità dei dati espressi.
XML Schema: elementi e struttura

Quindi uno XML Schema è un documento XML che descrive la
grammatica di un linguaggio XML utilizzando un linguaggio di markup
specifico. In quanto documento XML, uno XML Schema ha un root
element che contiene tutte le regole di definizione della grammatica.

La struttura generale di uno schema XML è la seguente:
<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
... Definizione della grammatica ...
</xs:schema>

L'elemento root del documento è rappresentato dal tag <xs:schema>.
 esso indica al parser che in questo documento saranno utilizzati dei tag
definiti dal namespace standard del W3C.


i namespaces rappresentano un meccanismo per
appartenenti ad una specifica grammatica
questi tag speciali sono caratterizzati dal prefisso xs:
identificare
tag
XML Schema: elementi e struttura

XML schema prevede il tag <xs:element> per la definizione degli
elementi utilizzabili in un documento XML, specificando nell’attributo
name il nome del relativo tag.

All’interno di ciascun tag <xs:element> possiamo indicare il tipo di
dato dell’elemento e possiamo definire gli eventuali attributi

Ad esempio la seguente definizione specifica l’elemento testo che può
contenere solo stringhe
 <xs:element name=“testo” type=“xs:string” />


questa dichiarazione corrisponde alla seguente dichiarazione Dtd
<!ELEMENT testo(#PCDATA)>
TIPO DI DATO

Per comprendere meglio ed apprezzare la potenza degli XML Schema
occorre analizzare il concetto di tipo di dato.

Esistono due categorie di tipi di dato: semplici e complessi.
TIPO DI DATO SEMPLICI



XML Schema introduce il concetto di tipo di dato semplice per definire
gli elementi che non possono contenere altri elementi e non
prevedono attributi.
Si possono usare tipi di dato semplici predefiniti oppure è possibile
personalizzarli.
Sono previsti numerosi tipi di dato predefiniti, alcuni dei quali sono
riportati nella seguente tabella:
TIPO DI DATO SEMPLICI
Ad esempio, la seguente dichiarazione:
<xs:element name="quantita" type="xs:integer" />
permette l'utilizzo dell'elemento quantità in un documento XML consentendo soltanto
un contenuto di tipo intero.
In altre parole, sarà considerato valido l'elemento
<quantita>123</quantita>
Mentre non lo sarà l'elemento
<quantita>uno</quantita>.
TIPO DI DATO SEMPLICI

XML Schema prevede anche la possibilità di definire tipi di dato
semplici personalizzati come derivazione di quelli predefiniti.
 se, ad esempio, abbiamo bisogno di limitare il valore che può essere
assegnato all'elemento <quantita> possiamo definirlo nel seguente
modo:
<xs:element name="quantita" >
<xs:simpleType>
<xs:restriction base="xs:integer">
<xs:minInclusive value="1" />
<xs:maxInclusive value="100" />
</xs:restriction>
</xs:simpleType>
</xs:element>

In altre parole, la dichiarazione indica che l'elemento <quantita> è di
tipo semplice e prevede una restrizione sul tipo di dato intero predefinito
accettando valori compresi tra 1 e 100.
TIPO DI DATO COMPLESSI



I tipi di dato complessi si riferiscono ad elementi che possono
contenere altri elementi e possono avere attributi.
Definire un elemento di tipo complesso corrisponde a definire la
relativa struttura.
Lo schema generale per la definizione di un elemento di tipo
complesso è il seguente:
<xs:element name="NOME_ELEMENTO">
<xs:complexType>
... Definizione del tipo complesso ...
... Definizione degli attributi ...
</xs:complexType>
</xs:element>
TIPO DI DATO COMPLESSI

Se l'elemento può contenere altri elementi possiamo definire la
sequenza di elementi che possono stare al suo interno utilizzando uno
dei costruttori di tipi complessi previsti:
 <xs:sequence>


<xs:choice>


consente di definire un elenco di sottoelementi alternativi
<xs:all>


consente di definire una sequenza ordinata di sottoelementi
consente di definire una sequenza non ordinata di sottoelementi
Per ciascuno di questi costruttori e per ciascun elemento è possibile
definire il numero di occorrenze previste utilizzando gli attributi
minOccurs e maxOccurs.
TIPO DI DATO COMPLESSI

Ad esempio, se l'elemento testo può essere presente una o infinite
volte all'interno di un paragrafo possiamo esprimere questa
condizione nel seguente modo:
<xs:element name="paragrafo">
<xs:complexType>
<xs:element name="testo" minOccurs="1"
maxOccurs="unbounded"/>
</xs:complexType>
</xs:element>

In questo caso il valore unbounded indica che non è stabilito un
massimo numero di elementi testo che possono stare all'interno di un
paragrafo.
TIPO DI DATO COMPLESSI

Per gli elementi vuoti è prevista una definizione basata sul seguente
schema:
<xs:element name="NOME_ELEMENTO">
<xs:complexType>
<xs:complexContent>
<xs:extension base="xs:anyType" />
... Definizione degli attributi ...
</xs:complexContent>
</xs:complexType>
</xs:element>

In altri termini, un elemento vuoto è considerato un elemento di tipo
complesso il cui contenuto non si basa su nessun tipo predefinito.
TIPO DI DATO COMPLESSI

La definizione degli attributi è basata sull'uso
<xs:attribute>, come nel seguente esempio:
<xs:attribute name="titolo" type="xs:string“
use="required" />
del
tag

L'attributo use consente di specificare alcune caratteristiche come la
presenza obbligatoria (required) o un valore predefinito (default) in
combinazione con l'attributo value.
 ad esempio, la seguente definizione indica un attributo il cui valore di
predefinito è test:
<xs:attribute
name="titolo"
type="xs:string"
use="default" value="test" />

Bisogna tener presente che se non si specifica esplicitamente
l'obbligatorietà dell'attributo, esso è considerato opzionale.
TIPO DI DATO – esempio
Il seguente codice presenta uno XML Schema relativo al linguaggio di descrizione
di articoli tecnici mostrato nei vari esempi.
<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="articolo">
<xs:complexType>
<xs:sequence>
<xs:element name="paragrafo" maxOccurs="unbounded">
<xs:complexType>
<xs:all maxOccurs="unbounded">
<xs:element name="immagine" minOccurs="0">
<xs:complexType>
<xs:attribute name="file“ use="required">
<xs:simpleType>
<xs:restriction base="xs:string"/>
</xs:simpleType>
</xs:attribute>
</xs:complexType>
</xs:element>
<xs:element name="testo"/>
<xs:element name="codice" minOccurs="0"/>
</xs:all>
<xs:attribute name="titolo" type="xs:string"use="optional"/>
TIPO DI DATO – esempio
<xs:attribute name="tipo" use="optional">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:enumeration value="abstract"/>
<xs:enumeration value="bibliografia"/>
<xs:enumeration value="note"/>
</xs:restriction>
</xs:simpleType>
</xs:attribute>
</xs:complexType>
</xs:element>
</xs:sequence>
<xs:attribute name="titolo" type="xs:string“ use="required"/>
</xs:complexType>
</xs:element>
</xs:schema>
Questo XML Schema è equivalente al Dtd che abbiamo visto precedentemente
Integrazioni di grammatiche e
namespaces

A partire da una grammatica definita tramite uno XML Schema, è
possibile sfruttare un parser XML validante per verificare la validità di
un documento XML.

Il parser avrà bisogno:
 del documento XML da validare
 dello schema XML rispetto a cui effettuare la validazione
Integrazioni di grammatiche e
namespaces

Ci sono diversi modi per fornire al parser informazioni sullo schema
da utilizzare per la validazione: si può nell'inserire nel documento XML
un riferimento allo schema da usare.
 Ad esempio:
<articolo
xmlns:xsi="http://www.w3.org/2001/XMLSchemainstance"
xsi:noNamespaceSchemaLocation="articolo.xsd"
titolo="Guida ad XML"
>

Oltre all’attributo titolo sono stati aggiunti due attributi predefiniti.
 l'attributo xmlns:xsi indica un URL che specifica la modalità con cui si
indicherà il riferimento allo schema XML.
 l'attributo xsi:noNamespaceSchemaLocation indica il nome e
percorso del file contenente lo schema XML di riferimento.
Integrazioni di grammatiche e
namespaces



Una delle caratteristiche auspicabili nella creazione di un nuovo
linguaggio è la possibilità di integrare elementi derivanti da
grammatiche diverse.
Questa caratteristica consente di riutilizzare parti di grammatiche già
definite evitando di dover rifare parte di lavoro già fatto in altri ambiti.
 In questo modo, ad esempio, sarebbe possibile integrare un linguaggio
per la descrizione di articoli tecnici con un linguaggio pre-esistente per
la descrizione di bibliografie, ottenendo un nuovo linguaggio composto.
La composizione di linguaggi pone almeno due tipi di problemi:
 un documento che utilizza due grammatiche presenta il problema della
validazione: a quale schema si deve fare riferimento per validare un
documento XML "ibrido"?
 due linguaggi potrebbero avere tag ed attributi con lo stesso nome,
anche se utilizzabili in contesti diversi: come fare a risolvere questo tipo
di ambiguità?
Integrazioni di grammatiche e
namespaces



La soluzione a questi problemi deriva dai namespace.
Un namespace è un insieme di nomi di elementi e nomi di attributi
identificati univocamente da un identificatore.
L'identificatore univoco individua l'insieme dei nomi distinguendoli da
eventuali omonimie in altri namespace.
 esempio: se nell'ambito di una grammatica per descrivere dei dati
anagrafici è stato definito un elemento indirizzo, questo nome potrebbe
essere confuso con l'elemento indirizzo definito nell'ambito di una
grammatica che descrive messaggi di posta elettronica.
 l'identificatore del relativo namespace consente di distinguere i due
elementi omonimi.
Integrazioni di grammatiche e
namespaces

Concetto non nuovo nell'informatica:
 quando definiamo i nomi dei campi in una tabella di un database
abbiamo definito un namespace.
 non possiamo avere campi con lo stesso nome all'interno di una tabella,
ma possiamo avere gli stessi nomi in tabelle diverse.
 possiamo risolvere l'ambiguità tra due campi omonimi facendoli
precedere dal nome della tabella (il namespace).

Un XML schema definisce implicitamente un namespace degli
elementi e degli attributi che possono essere usati in un documento
XML
Se in un documento XML si utilizzano elementi definiti in schemi
diversi abbiamo bisogno di un meccanismo che permetta di
identificare ciascun namespace e il relativo XML Schema che lo
definisce.

Sintassi dei namespace

In un documento XML si fa riferimento ad un namespace utilizzando
un attributo speciale (xmlns) associato al root element, come nel
seguente esempio:
 <articolo xmlns="http://www.dominio.it/xml/articolo">
 questo indica che l'elemento articolo ed i suoi sottoelementi utilizzano i
nomi
definiti
nel
namespace
identificato
dall'identificatore
http://www.dominio.it/xml/articolo.

L'identificatore di un namespace può essere rappresentato da una
qualsiasi stringa, purché sia univoca. Proprio per garantirne
l'univocità, è prassi ormai consolidata utilizzare un URI (Uniform
Resource Identifier) come identificatore.
 non è necessario che l'indirizzo specificato come identificatore di
namespace corrisponda ad un file pubblicato sul Web.
Sintassi dei namespace

Per mettere in relazione un namespace con il relativo XML Schema occorre
dichiararlo nel root element come nel seguente esempio:
<articolo
xmlns:xsi="http://www.w3.org/2001/XMLSchema- instance"
xmlns="http://www.dominio.it/xml/articolo"
xmlns="http://www.dominio.it/xml/bibliografia"
xsi:schemaLocation="http://www.dominio.it/xml/articolo
articolo.xsd"
xsi:schemaLocation="http://www.dominio.it/xml/bibliografia
bibliografia.xsd"
>
 l'attributo xmlns:xsi specifica la modalità con cui viene indicato il riferimento
allo schema.
 l'attributo xsi:schemaLocation indica il namespace ed il file in cui è definito il
relativo XML Schema separati da uno spazio.
Sintassi dei namespace

È possibile combinare più namespace facendo in modo che ciascun
elemento utilizzato faccia riferimento al proprio namespace.

Occorre tener presente che quando si fa riferimento ad un namespace,
questo riferimento vale per l'elemento corrente e per tutti gli elementi
contenuti, a meno che non venga specificato un diverso namespace.
Sintassi dei namespace
Il seguente utilizza elementi di due diversi namespace: uno relativo alla grammatica
della struttura di un articolo e l'altro relativo alla grammatica di bibliografie:
<articolo xmlns="http://www.dominio.it/xml/articolo" titolo="Guida ad XML">
<paragrafo titolo="Introduzione">
<testo>
bla bla bla
</testo>
</paragrafo>
<paragrafo titolo="Bibliografia">
<bibliografia
xmlns="http://www.dominio.it/xml/bibliografia">
<autore>
Tizio
</autore>
<titolo>
Opera citata
</titolo>
<anno>
1999
</anno>
</bibliografia>
</paragrafo>
</articolo>
Sintassi dei namespace



Riportare il riferimento ad un namespace per ogni elemento è di solito
scomodo e rende di difficile lettura il documento XML.
È possibile creare delle abbreviazioni per fare riferimento ai
namespace.
Queste abbreviazioni sono costituite da caratteri alfanumerici seguiti
da due punti (:) dichiarati nel root element ed utilizzati come prefissi
dei nomi degli elementi.
Sintassi dei namespace
Il seguente esempio riporta il codice XML precedente facendo uso di questi prefissi:
<art:articolo titolo="Guida ad XML"
xmlns:art="http://www.dominio.it/xml/articolo"
xmlns:bibl="http://www.dominio.it/xml/bibliografia" >
<art:paragrafo titolo="Introduzione">
<art:testo>
bla bla bla
</art:testo>
</art:paragrafo>
<art:paragrafo titolo="Bibliografia">
Le dichiarazioni
<bibl:bibliografia>
xmlns:art
<bibl:autore>
Tizio
xmlns:bibl
</bibl:autore>
assegnano i prefissi
<bibl:titolo>
art:
Opera citata
bibl:
</bibl:titolo>
<bibl:anno>
ai relativi namespace e questi
1999
prefissi vengono utilizzati per
</bibl:anno>
ciascun elemento del documento
</bibl:bibliografia>
</art:paragrafo>
XML.
</art:articolo>
Parte V
Modelli di presentazione dei documenti XML
Presentazione di XML con CSS

A differenza di HTML, che è un linguaggio specifico di strutturazione e
presentazione di documenti, XML è più generale e non ha una
semantica di presentazione .

Non è previsto alcun meccanismo predefinito per visualizzare i vari
elementi di un documento.
 ad esempio, un documento XML visualizzato in un browser appare
generalmente così com'è, al massimo con una indentazione e una
colorazione dei tag impostata dal browser.
Fogli di stile


Un foglio di stile è un documento separato che contiene regole di
formattazione e visualizzazione per un documento XML o HTML.
Quale è il vantaggio di separare lo stile dai contenuti?
 Un foglio di stile può essere utilizzato per controllare molti documenti
contemporaneamente e quindi permette di applicare modifiche di
formattazione in modo veloce ed accurato intervenendo soltanto nel
documento che contiene le regole di visualizzazione.
 In un foglio di stile sono specificate tutte le regole di formattazione che
verranno applicate ai documenti di un intero sito Web.
 Nella gestione di un sito Web complesso, ad esempio, è possibile
personalizzare i punti degli elenchi, o impostare diverse dimensioni di
carattere semplicemente modificando il foglio di stile invece che tutte le
pagine del sito.
Fogli di stile

Esistono due tipi di fogli di stile:
 i fogli di stile CSS (Cascading Style Sheets);
 i fogli di stile XSL (eXtensible Stylesheet Language)

I fogli di stile CSS applicano le regole di formattazione direttamente al
contenuto del documento per creare i risultati desiderati e possono
essere utilizzati sia con i documenti HTML sia con i documenti XML.
I fogli di stile XSL eseguono invece una trasformazione del contenuto
del documento e possono essere usati solo con documenti XML.


Un'altra differenza significativa consiste nel fatto che i CSS
contengono solo regole di formattazione, mentre i fogli XSL
contengono anche regole di trasformazione.
Presentazione di XML con CSS

Importante differenza tra l'utilizzo dei CSS per formattare documenti
HTML e il loro uso per i documenti XML.

In HTML la maggior parte dei tag ha una formattazione predefinita e
pertanto un foglio di stile CSS consente di ridefinire tali impostazioni.

In XML i tag non hanno alcun significato di formattazione, pertanto è
necessario specificare tutto.
Presentazione di XML con CSS

E’ possibile utilizzare i CSS in modo analogo a come si utilizzano con
HTML.

Nel documento XML bisogna indicare (catalog_with_css.xml):
<?xml version="1.0"?>
<?xml-stylesheet type="text/css” href="catalog.css"?>

Per ciascun elemento del documento XML che vogliamo formattare
occorre definire una regola secondo lo schema:
selettore { proprietà: valore; proprietà: valore; ... }

il selettore specifica a quale elemento la regola deve essere applicata,
mentre la parte racchiusa tra parentesi graffe elenca le caratteristiche
da impostare e il relativo valore.
Presentazione di XML con CSS

Per strutturare visivamente il documento dobbiamo indicare la modalità di
visualizzazione di ciascun elemento tramite la proprietà display di CSS.
 ad esempio, per formattare l'elemento paragrafo di un articolo possiamo definire
una regola come la seguente:
 paragrafo {display: block; font-size: 12pt; text-align:
left}

Generalmente un foglio di stile CSS da applicare ad un documento XML viene
salvato in un file di testo con estensione .css (l'estensione usata è irrilevante).
 nel documento XML possiamo quindi inserire un riferimento ad esso mediante
un’apposita direttiva di elaborazione, come nel seguente esempio:
 <?xml- stylesheet type="text/css" href="stile.css" ?>

questa dichiarazione fa in modo che un browser abilitato applichi le impostazioni del
foglio di stile CSS specificato al documento XML.
Presentazione di XML con CSS


Raggruppamento
 I selettori possono essere raggruppati fra di loro, separandoli con una
virgola. Ad esempio, sempre per un documento HTML, possiamo scrivere:
 h1, h2, h3, h4, h5, h6 {color: green}
 per avere dello stesso colore i tag di struttura da h1 a h6.
L'attributo classe (class)
 Per mezzo dell'attributo class si possono definire diversi stili per lo stesso
elemento. Supponiamo di volere, per un documento HTML, due tipi diversi di
paragrafo: uno con allineamento a destra e l'altro con allineamento centrato. Qui
di seguito sono indicate le linee per la definizione del foglio di stile:
 p.right {text-align: right}
 p.center {text-align: center}
 mentre qui sotto viene ilustrato come usare l'attributo class nel documento:
 <p class="right">Questo è un paragrafo. Il testo in questo paragrafo sarà
allineato a destra.</p>
 <p class="center">Questo è un paragrafo. Il testo in questo paragrafo sarà
centrato.</p>
Presentazione di XML con CSS

L'attributo id
 Con l'attributo id si può definire uno stile unico da usare con più
elementi.
 Di seguito viene indicata la riga per la definizione del foglio di stile:


Qui sotto si mostra come si deve usare l'attributo id nel documento:



#right {text-align: right}
<p id="right">Questo è un paragrafo. Il testo in questo paragrafo sarà
allineato a destra.</p>
<h3 id="right">Questo è un titolo; anche questo titolo sarà allineato a
destra.</h3>
L'attributo id deve avere un unico valore nel documento.
Presentazione di XML con CSS

I fogli di stile CSS sono pensati principalmente per il Web e mancano
pertanto di alcune caratteristiche che possono risultare utili in ambiti
diversi.
 ad esempio, per la presentazione su supporti cartacei occorrerebbero
maggiori funzionalità per l'impaginazione.

Tra le principali limitazioni, non è prevista la possibilità di estrarre il
valore degli attributi degli elementi in modo da poterli visualizzare.

Per risolvere questi problemi il W3C ha definito un insieme di
specifiche volte a gestire in maniera altamente flessibile la
presentazione e la trasformazio ne di documenti XML: l'eXtensible
Stylesheet Language (XSL).
XSL: eXtensible Stylesheet Language



L'eXtensible Stylesheet Language (XSL) è un insieme di tre linguaggi
che forniscono gli strumenti per l'elaborazione e la presentazione di
documenti XML in maniera molto flessibile.
La definizione di questa tecnologia si basa sull'osservazione del
processo di presentazione di dati di qualsiasi natura.
Possiamo individuare i seguenti meccanismi di base:
 un meccanismo per l'individuazione dei dati da presentare
 un meccanismo per il controllo dell'elaborazione dei dati e di come la
presentazione deve essere effettuata
 un meccanismo per la definizione della formattazione da applicare ai
dati per la presentazione vera e propria
XSL: eXtensible Stylesheet Language

A ciascuno di questi tre meccanismi, XSL associa uno specifico
linguaggio:
 XPath consente di individuare gli elementi e gli attributi di un
documento XML sui quali verranno applicate le operazioni necessarie
per la presentazione dei dati
 XSLT (XSL transformation) consente di controllare le operazioni che
rendono i dati presentabili; linguaggio per descrivere come trasformare
e impaginare i documenti XML in altri documenti XML, HTML o TXT
 XSL-FO (XSL Formatting Objects) definisce un insieme di tag di
formattazione; linguaggio per trasformare e impaginare i documenti
XML in PDF, PostScript, SVG

Es. Se i dati di fatturazione sono in XML, posso ottenere la fattura in PDF
con una trasformazione XSL-FO
XSL: eXtensible Stylesheet Language

Questa suddivisione dei compiti nel processo di presentazione è il
punto di forza di XSL e ne garantisce la flessibilità.
 questi tre linguaggi non sono strettamente dipendenti l'uno dall'altro.

Se, ad esempio, in una particolare applicazione ci rendiamo conto che
XPath non soddisfa le nostre esigenze di ricerca di elementi in un
documento XML, potremmo utilizzare linguaggio analogo (XQL, per
citarne uno) ma senza modificare la presentazione dei caratteri.

Oppure potremmo decidere di non utilizzare affatto XSL-FO per
formattare i dati di un documento XML e produrre direttamente codice
HTML, o meglio XHTML, cioè la versione di HTML basata su XML.
XSL: eXtensible Stylesheet Language

Poiché un foglio di stile XSL è a sua volta un documento XML, deve
iniziare con la dichiarazione <?xml version="1.0"?>.

Inoltre conterrà in sequenza le seguenti due righe:
<xsl:stylesheet
xmlns:xsl="http://www.w3.org/TR/WDxsl">
<xsl:template match="/">

La prima definisce l'inizio del foglio di stile, mentre la seconda definisce
l'inizio di un modello (template), che individua la parte di documento
XML a cui applicare le regole di trasformazione. Tutti i tag che fanno
parte di un documento XSL iniziano con il suffisso "xsl:" e sono detti
direttive.
XSL: eXtensible Stylesheet Language

La presentazione dei dati racchiusi in un documento XML è basata su
due elementi:
 un documento che descrive come i dati devono essere elaborati per la
presentazione, chiamato foglio di stile XSLT
 un componente software, chiamato processore XSLT, in grado di
prendere in input un documento XML e un foglio di stile XSLT e di
produrre in output i dati secondo il formato di presentazione prescelto
(XSL-FO, XHTML, testo, ecc.)


XSLT usa le espressioni di Xpath per localizzare i nodi del documento XML
che devono subire il trattamento
La definizione di un foglio di stile XSLT è quindi il punto cruciale della
presentazione dei dati XML.
 le regole di trasformazione presenti in un foglio XSLT consentono di
selezionare gli elementi di un documento XML e di gestirne la modalità
di presentazione.
XPath: espressioni e funzioni

Individuare gli elementi di un documento XML rappresenta il primo
passo di un'elaborazione per la presentazione dei dati.

Nei CSS questo ruolo è svolto dal selettore, cioè l'elemento sintattico
di una regola CSS che individua gli elementi da formattare.
In XSL questo passo viene descritto tramite il linguaggio XPath.
 a differenza dei selettori CSS, XPath è molto più potente e flessibile.


Questo linguaggio consente di creare espressioni dichiarative,
chiamate espressioni XPath o pattern, che individuano i vari nodi
dell'albero di rappresentazione di un documento XML.
XPath: espressioni e funzioni
<?xml version="1.0" ?>
<articolo titolo="">
<paragrafo titolo="Titolo del primo paragrafo">
<testo>
Blocco di testo del primo paragrafo
</testo>
<immagine file="immagine1.jpg">
</immagine>
</paragrafo>
<paragrafo titolo="Titolo del secondo paragrafo">
<testo>
Blocco di testo del secondo paragrafo
</testo>
<codice>
Esempio di codice
</codice>
<testo>
Altro blocco di testo
</testo>
</paragrafo>
</articolo>
XPath: espressioni e funzioni




Per individuare l'elemento <testo> all'interno del nostro esempio di documento
XML dobbiamo specificare un percorso di questo tipo:
 /articolo/paragrafo/testo
Se siamo interessati all'attributo titolo dell'elemento <paragrafo> possiamo
specificarlo nel modo seguente:
 /articolo/paragrafo/@titolo
Queste espressioni, però, individuano il primo elemento che corrisponde al
percorso.
Per selezionare uno specifico elemento, ad esempio il paragrafo con titolo
Titolo del secondo paragrafo, possiamo farlo con l'espressione seguente:
 /articolo/paragrafo/[@titolo=“Titolo del secondo paragrafo”]

In pratica, all'interno delle parentesi quadre specifichiamo la condizione che deve
essere soddisfatta dall'elemento.
XPath: espressioni e funzioni

Per selezionare un elemento specifico è possibile utilizzare anche
alcune funzioni predefinite, come position(), che specifica la posizione
di un elemento, e last(), che specifica l'ultima posizione di una
sequenza di elementi.
 ad esempio, le due espressioni seguenti specificano rispettivamente il
secondo paragrafo e l'ultimo paragrafo dell'articolo:


/articolo/paragrafo[position()=2]
/articolo/paragrafo[position()=last()]
Fogli di stile XSLT

Nell'ambito dello standard XSL il compito di trasformare un
documento XML in un altro documento è affidato al linguaggio XSLT.

Nella terminologia di XSLT, il documento da trasformare è chiamato
documento origine (source document), mentre il documento generato
dal processo di trasformazione è chiamato documento risultante
(result document).
 il documento risultante di una trasformazione XSLT può essere un
documento XML o un documento di altro tipo.

ad esempio, a partire da un documento XML possiamo generare un
documento XHTML oppure un documento WML o anche RTF o altri formati
testuali.
Fogli di stile XSLT

La trasformazione avviene in base alle informazioni contenute in un
particolare tipo di documento e interpretate da un processore XSLT.
Questo documento di trasformazione, chiamato foglio di stile XSLT,
non è altro che un documento XML che fa uso di tag appartenenti alla
grammatica di XSLT in grado di controllare il processo di
trasformazione.
 In generale, un foglio di stile XSLT ha la seguente struttura :
<?xml version="1.0"?>
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/transorm">
... template di trasformazione ...
</xsl:stylesheet>

Fogli di stile XSLT

All'interno del root element <xsl:stylesheet> vengono definite le istruzioni
di trasformazione da applicare al documento XML origine.

XSLT consente di trasformare ciascun elemento del documento XML di origine
in un altro elemento del formato del documento risultante.

È possibile anche aggiungere al documento risultante elementi completamente
nuovi o non prendere in considerazione determinati elementi del documento
origine, riordinare gli elementi, fare elaborazioni in base al risultato di
determinate condizioni, ecc.

Il processo di trasformazione controllato da XSLT si basa sull'uso del
linguaggio XPath per individuare gli elementi del documento origine, sui quali
viene applicato un template (o modello) di trasformazione.
Fogli di stile XSLT



Da un punto di vista sintattico, un template è un elemento del
linguaggio XSLT che ha la seguente forma di base:
<xsl:template match="espressione XPath">
... Definizione dell’output...
</xsl:template>
Un template XSLT individua un elemento o un insieme di elementi di
un documento XML sfruttando un’espressione XPath e vi applica una
serie di elaborazioni per ottenere un output.
 normalmente le stringhe prodotte dal XSL sono istruzioni di HTML in
modo da costituire un documento HTML interpretabile da un browser
Un foglio di stile XSLT non è altro che un insieme di template da
applicare ai vari elementi di un documento XML.
 comprendere come avviene l'applicazione dei template di un foglio di
stile XSLT da parte del relativo processore è un elemento essenziale
per realizzare fogli di stile corretti.
Esempio
Il template trasforma dinamicamente il documento XML in un documento
HTML
<?xml version="1.0"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/TR/WD-xsl">
<xsl:template match="/">
<HTML>
<HEAD>
<TITLE> ... </TITLE>
</HEAD>
<BODY>
...
</xsl:template>
</xsl:stylesheet>
Fogli di stile XSLT



Il processore XSLT va alla ricerca dei template da applicare partendo dal root
element e seguendo l'albero di rappresentazione logica del documento stesso.
In linea di principio, con l'applicazione del relativo template al root element
termina il compito del processore XSLT.
Se il foglio di stile contiene diversi template che devono essere applicati ai vari
elementi del documento XML di partenza è necessario specificarlo
esplicitamente.
 questo può essere fatto specificando all'interno del template corrente l'elemento
<xsl:applytemplates/>.

questo tag indica al parser di continuare a scandire il documento XSL
alla ricerca di altri modelli da applicare i da applicare ai nodi sottostanti,
o
Fogli di stile XSLT

Non è importante l'ordine con cui sono stati specificati i template
all'interno del foglio di stile; sarà il processore ad individuarli in base
all'espressione XPath associata.
 ad esempio, un possibile template del root element che avvia la
trasformazione di un articolo può essere analogo al seguente:
<xsl:template match="/">
<xsl:value-of select="articolo/@titolo"/>
<xsl:apply-templates/>
</xsl:template>

Questo template estrae il titolo dell'articolo ed indica al processore
XSLT di cercare altri template da applicare al documento XML.
Fogli di stile XSLT

<xsl:value-of>

direttiva XSL più importante per l'estrazione dei dati da un file XML
 una volta che tale direttiva è applicata ad un certo nodo, se questo
contiene altri nodi, il parser li esplicita comunque restituendone il
contenuto, separandolo con spazi. Questa sintassi viene usata per
selezionare gli elementi del documento XML da sottoporre alla
trasformazione XSL.
 Ad esempio:
<?xml version="1.0"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/TR/WD-xsl">
<xsl:template match="/">
<HTML>
<HEAD>
<TITLE><xsl:value-of select="Legge/TitoloLegge"/></TITLE>
</HEAD>
<BODY>
...
</xsl:template>
</xsl:stylesheet>
Fogli di stile XSLT

<xsl:for-each select="condizione">

Questa direttiva viene usata per selezionare ogni elemento del
documento XML che verifica la condizione specificata dalla select.
<?xml version="1.0"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/TR/WD-xsl">
<xsl:template match="/">
<HTML>
<HEAD>
<TITLE><xsl:value-of select="Legge/TitoloLegge"/></TITLE>
</HEAD>
<BODY>
...
<xsl:for-each select="Legge/Articolato/Articolo">
<p
align="center"><B><font
color="#008080">Art.
select="Num"/><BR/>
<xsl:value-of select="Rubrica"/></font></B></p>
...
</xsl:for-each>
...
</xsl:template>
</xsl:stylesheet>
<xsl:value-of
Fogli di stile XSLT


Elaborazione degli attributi
I fogli di stile XSL permettono anche di gestire, in maniera potente e
flessibile, gli attributi degli elementi XML, facendo precedere il nome
dell'attributo dal simbolo "@".
<xsl:template match="/">

<HTML>
<HEAD>
<TITLE>Legge n.<xsl:value-ofselect="Legge/Intestazione/@NumeroLegge"/>
del <xsl:value-of select="Legge/Intestazione/Data"/></TITLE>
</HEAD>
<BODY>
Esempio


esempi\cdcatalog_xsl.xml
esempi\cdcatalog_xsl.xsl
<?xml version='1.0'?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/TR/WD-xsl">
<xsl:template match="/">
<html>
<body>
<xsl:value-of select="CATALOG/CD/TITLE"/>
*************
<xsl:value-of select="CATALOG/CD/ARTIST"/>
</body>
</html>
</xsl:template>
</xsl:stylesheet>
Esempio

Per stampare il contenuto di un nodo del documento XML, si usano
normalmente il tag <xsl:value-of, insieme all’attributo select.
 <xsl:value-of: produce il contenuto di un nodo, individuato
dall’attributo select
 select=“espressione”: identifica l’insieme di nodi del documento
XML sorgente il cui contenuto deve essere inserito in questa posizione.



Es.: <xsl:value-of select="CATALOG/CD/TITLE"/>
Se piu’ nodi soddisfano l’espressione, viene considerato solo il primo
nodo, a meno che non si usi <xsl:for-each
L’elemento <xsl:value-of e’ EMPTY, cioe’ non ha contenuto, quindi
si puo’ usare la chiusura abbreviata:
 <xsl:value-of select="TITLE"/>
Applicazioni

XML viene applicato in numerosi campi e per vari scopi: archiviazione
elettronica e gestione dei contenuti documentali, pubblicazione su
web, scambio di documenti elettronici, formati interni per strumenti
software, nel commercio elettronico, nell.apprendimento e in molti altri
campi.
 tra i settori meno ovvi ci sono quelli relativi alla chimica, alla biologia,
alla teologia, al turismo, alla giurisprudenza e alla salute pubblica.

XML è uno standard nato nel mondo Web ma che è utilizzato sia
dentro che fuori il Web stesso.
 è un modo di rappresentazione dei dati che devono circolare su Internet
ed è non legato necessariamente, quindi, al loro modo di presentazione
attraverso un browser.
XML e giornalismo

Il Giornalismo è un classico esempio di dominio applicativo in cui
l’XML sta producendo dei cambiamenti nel modo di lavorare.

Negli anni settanta i progressi nel campo dei computer e delle
telecomunicazioni per lo scambio e l’archiviazione dei documenti ha
portato all’automazione dei processi di lavoro in molti campi, incluso il
giornalismo. In quegli anni erano stati sviluppati dei formati di
descrizione degli articoli che permettevano lo scambio e
l’archiviazione elettronica dei documenti

Un articolo codificato in uno di questi formati contiene il testo
dell’articolo (sono supportati solo articoli in formato testo), i campi, le
categorie e gli indici aggiuntivi come per esempio l’identificativo
numerico, la data, la sezione, la priorità.
XML e giornalismo



L’evoluzione della tecnologia (Internet, multimedialità etc.) e
l’aumentata attività giornalistica sta rendendo questi formati sempre
più antiquati.
Di seguito un elenco delle carenze segnalate per questi formati:
 Non supportano la descrizione di contenuti multimediali
 Non hanno metadati per agevolare la classificazione e la ricerca degli
articoli ( ricerche per persone, luoghi etc)
 Le categorie di indici disponibili mancano di dettaglio
 Non supportano l’intero ciclo di vita di un articolo, per esempio non e’
possibile identificare l’autore di un articolo, includere quale versione e’
attualmente disponibile chi l’ha ricevuta.
 Non permettono collegamenti ad altri articoli correlati
 Non permettono la composizione degli articoli (per esempio associare
una fotografia al testo dell’articolo).
Per rispondere a queste necessità le organizzazioni per gli standard
giornalistici hanno deciso di sviluppare nuovi standard basati su
applicazioni XML.
Un esempio: XMLNews (1)

XMLNews definisce il contenuto testuale e le meta-informazioni di
notizie da agenzia stampa.
 E’ una parte dello standard denominato News Industry Text Format
(NITF), sviluppato dal International Press Telecommunications Council
(IPTC) e dalla Newspaper Association of America.


NITF è stato il primo standard XML sviluppato dall’IPTC negli anni novanta.
NITF è una applicazione XML per la descrizione di articoli in formato
testuale, sebbene possa contenere oggetti multimediali. Questo linguaggio
mira a superare alcune delle caremze che sono state identificate negli
standard definiti in precedenza in quanto incorpora molti elementi di
metadati
XMLNews è composto di due parti:
 XMLNews-Story è un DTD XML per descrivere in maniera variamente
arricchita il testo delle notizie
 XMLNews-Meta definisce il formato delle meta-informazioni per notizie
d’agenzia. E’ conforme al Resource Description Framework (RDF), e
non si riferisce solo alle notizie testuali, ma anche a immagini, videoclip, ecc.
Un esempio: XMLNews (2)

XMLNews-Story: il testo di una notizia di agenzia è diviso in tre parti: l’head contiene
informazioni di organizzazione, mentre il body è a sua volta diviso in intestazione e contenuto.
<?xml version="1.0"?>
<nitf>
<head> <title>Colombia Earthquake</title> </head>
<body>
<body.head>
<hedline><hl1>143 Dead in Earthquake</hl1></hedline>
<byline><bytag>By Jared Kotler, AP </bytag></byline>
<dateline>
<location>Bogota, Colombia</location>
<story.date>January 25 1999 7:28 ET</story.date>
</dateline>
</body.head>
<body.content> … </body.content>
</body>
</nitf>
Un esempio: XMLNews (3)

XMLNews-Story: Il body ha un markup minimale di struttura del testo:
<?xml version="1.0"?>
<nitf> <head> … </head> <body> <body.head> … </body.head>
<body.content>
<p>Un terremoto ha colpito la Colombia occidentale
lunedì, uccidendo almeno 143 persone e ferendone
più di 900 mentre scoperchiava edifici nella zona
delle coltivazioni di caffè più ricca e fertile
della nazione. Gli addetti alla difesa civile sono
immediatamente intervenuti.</p>
<p>Il terremoto è avvenuto nel primo pomeriggio, con
una magnitudine del 6 grado, secondo il Geological
Survey Americano, in Golden, Colorado. L’epicentro
è stato identificato nella valle dello stato del
Cauca, a 210 chilometri a ovest della capitale,
Bogotà.</p>
</body.content> </body>
</nitf>
Un esempio: XMLNews (4)



XMLNews-Story: Però è possibile in qualunque momento aggiungere
informazioni inline:
<p>Un <event>terremoto</event> ha colpito la <location>
<country>Colombia</country> occidentale</location>
<chron norm=“19990125”>Lunedì</chron>, uccidendo
almeno 143 persone e ferendone più di 900 mentre
scoperchiava edifici nella zona delle coltivazioni
di caffè più ricca e fertile della nazione. Gli
<function>addetti alla difesa civile</function>
sono immediatamente intervenuti.</p>
Questo permette di arricchire la storia con altre informazioni in maniera semiautomatica:
 nella ricerca: è possibile cercare tutto quello che è successo in Colombia, o cosa
è successo in una certa data.
 nella presentazione: un provider potrebbe fornire semi-automaticamente dei link
o delle cartine della Colombia.
 nell’organizzazione delle news: è possibile cercare tutti i terremoti effettivi, e non
le notizie che ne usano la parola, magari figurativamente.
Un esempio: XMLNews (5)


XMLNews-Meta: Assieme ad ogni notizia, vengono scritte delle
informazioni sulla notizia, che possono avere una distribuzione
separata.
XMLNews-Meta permette di gestire insieme informazioni come:
 Informazioni sul contenuto della notizia (titolo, lingua, formato, ecc.)
 Informazioni sulle date della notizia: creazione, pubblicazione,
scadenza, ecc.
 Informazioni sulla provenienza ed attendibilità della notizia
 Informazioni sui possessori dei diritti di distribuzione e copyright
 Informazioni di classificazione ed organizzazione
 Link a documenti connessi: versioni precedenti, seguenti, ed altre
notizie connesse.
Modello di attività giornalistica basato su
XML.


Le attività giornalistiche possono essere così suddivise
 Creazione di un articolo fatta da un cronista (nella maggior parte dei
casi per conto di una agenzia di informazione).
 Selezione degli articoli da pubblicare (effettuata di solito, da una
redazione).
 Impaginatura degli articoli diversa per un giornale cartaceo o per uno
elettronico.
Attualmente i contenuti delle notizie prodotte in una agenzia sono
principalmente in formato testuale, di solito disponibile ai media
attraverso dei database.
 Gli articoli sono creati usando un formato di descrizione delle notizie
(per esempio ANPA 1312) che, tra le altre limitazioni, non ammette i
contenuti multimediali.
Modello di attività giornalistica basato su
XML.




Una redazione, dopo aver selezionato quali articoli pubblicare tra
quelli resi disponibili dalle agenzie e dalle altre risorse, stabilisce
l’impaginazione del giornale sia per la versione cartacea che per
quella elettronica.
L’agenzia di informazioni diverrà una agenzia di informazioni
multimediali in grado di produrre notizie con contenuti in tutti i formati
digitali (testo, immagine, audio, video, grafica e animazione
computerizzata).
Il contenuto giornalistico sarà contrassegnato usando l’applicazione
standard dell’XML e archiviato in un database XML che conterrà i
contenuti di notizie passate e presenti.
I News Media saranno in grado di fare ricerche simultanee sulle basi
dati di differenti agenzie, sfruttando il fato che tutti saranno in grado di
usare lo stesso formato per le notizie. Il supporto di metadati
permetterà ricerche molto più intelligenti ed efficienti.
Modello di attività giornalistica basato su
XML.




Il giornale sarà creato usando le notizie in formato XML delle altre
agenzie o preparate dalla redazione stessa.
Usando differenti fogli di stile sarà possibile creare in modo
automatico diverse versioni del giornale per le distinte piattaforme:
cartacea per la distribuzione tradizionale, HTML per chi accede dal
Web, WML per i telefoni cellulari e la televisione digitale.
Il giornale potrebbe offrire all’utente finale un database di notizie
giornaliere che potrebbero avere una copertura molto più ampia di
quella tradizionale.
L’utente finale potrebbe registrare le sue preferenze sul server del
giornale e accedendo al database delle notizie il server potrebbe
scegliere quelle che più si avvicinano alle preferenze dell’utente finale.
Influenza di XML sul WWW



XHTML sta sostituendo HTML
I blog si basano su feed RSS (o ATOM), che sono documenti XML
I siti di informazione diffondono le notizie con XML e RSS: Corriere
della Sera, Repubblica, CNN
XHTML: NextGen HTML
<?xml version="1.0" encoding="iso-8859-1"?>
<html xmlns="http://www.w3.org/TR/xhtml1" >
<head>
<title> Title of text XHTML Document </title>
</head>
<body>
<div class="myDiv">
<h1> Heading of Page </h1>
<p> here is a paragraph of text. I will include inside this
paragraph
a bunch of wonky text so that it looks fancy. </p>
<p>Here is another paragraph with <em>inline
emphasized</em>
text, and <b> absolutely no</b> sense of humor. </p>
<p>And another paragraph, this one with an <img
src="image.gif"
alt="waste of time" />
image, and a <br /> line
break. </p>
</div>
</body></html>
XHTML and other Data
<?xml version="1.0" encoding="iso-8859-1"?>
<html xmlns="http://www.w3.org/TR/xhtml1" >
<head>
<title> Title of XHTML Document </title>
</head><body>
<div class="myDiv">
<h1> Heading of Page </h1>
<mathml xmlns=“http://www.w3.org/TR/mathml”>
… MathML markup …
</mathml>
<p> more html stuff goes here </p>
<smil xmlns=“http://www.w3.org/TR/smil1”>
… SMIL markup …
</smil>
</div>
</body></html>
RSS

RSS (acronimo di RDF Site Summary ed anche di Really Simple
Syndication) è uno dei più popolari formati per la
distribuzione di contenuti Web

Linguaggio basato su XML, nato tra il 1997 e il 1999
 da XML ha ereditato la semplicità, l‘ estensibilità e la flessibilità.

Permette la visualizzazione su portali e siti web di headline e link
relativi a notizie pubblicate su altri siti
I progenitori erano le newsletter

Come funzionano?

Un documento XML è pubblicato e aggiornato continuamente

Ci si “iscrive” al feed mediante un reader indicando l’URL del
documento XML
 http://www.google.com/reader/view
I reader sono in grado di cercare e segnalare automaticamente nuovi
aggiornamenti quando disponibili per i feed sottoscritti
 programmi client
 via browser

Syndication



I siti possono utilizzare il documento XML per aggiornare
dinamicamente le proprie pagine (syndication)
Syndication indica la distribuzione di contenuti internet attraverso
appositi canali, di norma rappresentati da feed
Il verbo che ne deriva, to Syndicate, indica l'azione di un sito di
mettere a disposizione sezioni o interi contenuti attraverso feed
Vantaggi



Evitano di dover aprire i diversi siti solo testo
Nuova modalità di consumo delle news online, come una prima pagina
costruita dall’utente
La diffusione dipenderà dall’evoluzione delle interfacce di facilitazione
alla navigazione on line
RSS e giornalismo
Gli
RSS sono utilizzati
anche dai
giornali on
line, The New York
Times, ABSCnews, La
Repubblica, Corriere
Podcast e podcasting



Un podcast è una registrazione digitale audio o video, scaricabile
automaticamente da un apposito programma (un client) messa a
disposizione su Internet per chiunque si abboni ad una trasmissione
periodica
Il Podcasting è un neologismo basato sulla fusione di due parole: iPod
e broadcasting
Il termine nacque quando l'uso dei feed RSS divenne popolare per lo
scambio di registrazioni audio su computer, palmari, lettori di musica
digitale e anche telefoni cellulari.
Come funziona?



Per ricevere un podcast sono necessari:
 un qualsiasi supporto connesso ad internet (un PC, ad esempio)
 un programma client apposito (spesso gratuiti)
 un abbonamento presso un fornitore di podcast (spesso gratuiti)
Un podcast funziona come un abbonamento ad una pubblicazione
periodica: il supporto connesso ad internet è la cassetta postale, il
client è il postino, e il fornitore di podcast è la casa editrice
 l'abbonato riceve regolarmente le pubblicazioni, e può ascoltarle o
vederle nella modalità e nei tempi che gli sono più congeniali.
http://www.audiocast.it/podlist/
Come funziona?


Il podcasting funziona grazie ad un semplice software (generalmente
gratuito), che ad intervalli regolari si collega a internet e controlla quali
audio o video sono stati pubblicati dai siti ai quali si è abbonati: se ne
trova di nuovi li scarica
 la notifica della pubblicazione di nuove edizioni avviene tramite un feed
RSS scambiato tra il sito del produttore e il programma dell’utente
I podcast possono essere ascoltati in ogni momento poiché la copia
del file, una volta scaricata automaticamente, rimane sul computer
dell’abbonato.
 a differenza delle radio Web in streaming, i podcast non richiedono
necessariamente un collegamento ad internet durante l’ascolto ma solo
nella fase di download (i.e., i podcast si possono ascoltare anche offline magari su un supporto mobile non connesso ad internte)
Streaming vs Podcast


Nonostante i programmi in streaming (come le radio tradizionali)
possono essere registrati dal ricevente, la loro natura transitoria li
distingue nettamente dai programmi podcast che invece arrivano già
in formato compresso sul computer
 questa differenza è importante anche dal punto di vista legale
Anche il mondo del giornalismo, della politica e della comunicazione
sono interessati ai podcast.
 in italia Radio Rai offre le proprie trasmissioni come podcast, La
Repubblica distribuisce via podcasting le trasmissioni di Repubblica
Radio, altre radio tipo RadioDJ, Radio105, RDS etc. solo alcune
trasmissioni
Dizionario

Broadcast: indica una trasmissione radio tradizionale, ascoltabile ad
una determinata ora decisa dall’emittente

Streaming: indica una risorsa ascoltabile in qualsiasi momento tramite
un collegamento internet al sito dell’emittente
 non occorre averla scaricata tutta prima di poter ascoltarla ma si può
ascoltare mano a mano che viene scaricata

Podcasting: indica una risorsa ascoltabile in qualsiasi momento
scaricata automaticamente in formato mp3 o altro dal sito
dell’emittente
 a volte occorre averla scaricata tutta prima di poterla ascoltare
XQuery



Nel Web Consortium esiste un gruppo di lavoro (XML Query Working
Group) preposto alla definizione di un linguaggio di interrogazione
specifico per i documenti XML.
L'obiettivo del gruppo è quello di fornire un linguaggio potente e
flessibile per estrarre dati dai documenti XML con prestazioni
paragonabili a quelle fornite dai linguaggi progettati per i database . In
questo modo le collezioni di file XML saranno accessibili nello stesso
modo in cui lo sono attualmente i database.
Ad oggi non esiste una raccomandazione del W3C per un linguaggio
d'interrogazione, ma esistono diverse proposte, fra le quali si può
citare XML Query Language (XQL), estensione di XSL Patterns, lo
schema per la costruzione di espressioni atte ad indicare gli elementi
di un documento XML.
 Linguaggio di query concepito per essere applicabile a qualsiasi
documento XML

simile al linguaggio SQL nei database
XQuery



Le espressioni XQL assomigliano ai percorsi per individuare file e
directory nel disco di un computer. Infatti XQL sfrutta la natura
gerarchica della struttura di un documento XML. Per esempio,
l'espressione
 /Legge//Comma
 indica l'insieme degli elementi Comma discendenti dell'elemento Legge,
che si trovano nel documento, mentre
l'espressione:
 /Legge//Capo[@Num = "I"]/Articolo
 seleziona tutti gli articoli del capo I.
Il risultato di una query XQL è un estratto del documento XML
contenente le parti selezionate, ossia un documento XML che ha come
radice l'elemento <xql:result>.
XQuery




Nella progettazione di XQL si sono perseguiti 3 obiettivi fondamentali:
 la compattezza: XQL utilizza brevi sequenze di caratteri
 la semplicità: XQL utilizza pochi elementi sintattici
 la natura dichiarativa: le espressioni esprimono cosa si vuole ottenere e
non "come" ottenerle (concetto analogo a quello espresso per il
linguaggio eXtensible Stylesheet Style)
Questi presupposti sono positivi, ma comportano anche degli
svantaggi: per esempio, la compattezza porta, nel caso di espressioni
complesse, a compromettere la facilità dell'interpretazione.
Esistono poi due limitazioni non indifferenti:
 non sono previsti meccanismi di unione fra più query (join), nè di
ordinamento o di aggregazione
 non è prevista l'interrogazione su più documenti contemporaneamente
Nonostante ciò, non mancano le implementazioni: XQL è supportato,
per esempio dagli XML database server eXcelon di ObjectStore e
Tamino di Software AG.
XQuery

<?xml version="1.0" ?>
<magazzino>
<articolo codice="A1">
<descrizione>Righello 25 cm</descrizione>
<quantita>50</quantita>
</articolo>
<articolo codice="A2">
<descrizione>Calcolatrice</descrizione>
<quantita>60</quantita>
</articolo>
<articolo codice="A3">
<descrizione>Quaderno a quadri</descrizione>
<quantita>120</quantita>
</articolo>
</magazzino>

XQuery: /magazzino/articolo[quantita > 100]

Tutti gli articoli con quantità > 100
Conclusioni: perché utilizzare XML








XML permette di strutturare i documenti e di associare una sintassi.
XML supporta UNICODE, un grande numero di set di caratteri può
essere utilizzato.
XML può essere usato come formato di scambio per documenti
elettronici ed applicazioni.
Indipendente da hardware e software
Consente di manipolare i dati in modo più semplice ed efficiente.
Quando registriamo informazioni vogliamo essere sicuri di poterle
riutilizzare in futuro.
 es. word 1, word 2, word per mac, word per pc, incompatibilità, perdita
di informazioni
Un documento XML è in formato leggibile dall’uomo.
·Documento strutturati e metainformazioni consentono motori di
ricerca più acurati
Conclusioni: perché utilizzare XML







Sistemi standard di metadati: Resource Description Framework.
XML è estensibile, non ha tag predefiniti.
·Consente di creare linguaggi standard ed estendibili, per campi di
applicazione (medicina, elettronica, matematica, musica, ...)
I collegamenti offrono nuove possibilità. (punti precisi, più
destinazioni, database centralizzato -> maggiore maneggevolezza, più
semplice controllare corrispondenza collegamenti).
Offre una ottima capacità di rappresentare dati complessi (notazioni
matematiche, interfacce grafiche)
Visualizzare documento su media differenti in modi diversi senza
doverlo riscrivere ogni volta.
XSL offre meccanismi per rappresentare e manipolare il documento,
buona capacità di rappresentare dati complessi (notazioni
matematiche, interfacce grafiche); sequenze, cicli e condizioni
Approfondimenti

XML – esempi e dettagli sul formato
http://it.wikipedia.org/wiki/XML

“L'azienda è più flessibile con i documenti digitali”
http://www.weekit.it/index.php?option=com_content&task=view&id=37
710&Itemid=190
Glossario










Applicazione XML: un linguaggio XML definito tramite un DTD o uno XML Schema ed usato
in un particolare ambiente.
CSS: Cascading Style Sheets. Fogli di stile che consentono di definire come presentare
documenti HTML e XML.
DOM: Document Object Model. Questa è un.interfaccia indipendente tra la piattaforma di
sviluppo e il linguaggio di programmazione usato e permette di accedere e modificare il
contenuto o la struttura di documenti HTML e XML.
DTD: Document Type Definition. Questo è un formato usato per definire la struttura e gli
elementi di una particolare applicazione XML.
HTML: HyperText Markup Language. E. il linguaggio di marcatura usato per creare
documenti da pubblicare sul Web. E. stato standardizzato dal W3C.
Markup language: Un linguaggio che consente l.aggiunta di marcatori ad un documento di
testo, al fine di fornire un significato semantico o descrivere come presentare il contenuto
del documento stesso.
Metadato: Un dato usato per descrivere o aggiungere informazione agli altri dati.
Metalinguaggio: Nel mondo IT è un linguaggio utilizzato per definire altri linguaggi.
Namespace: Consente di individuare una parte che definisce un insieme di elementi e
attributi utilizzati in un documento XML.
Glossario













SGML: Standard Generalized Markup Language. Metalinguaggio per definire linguaggi di
marcatura; il precursore dell.XML.
WML: Wireless Markup Language. Un linguaggio che è usato correntemente per presentare
contenuti ipertestuali su telefonia mobile e dispositivi palmari PDA.
W3C: World Wide Web Consortium. E. l.organizzazione responsabile dello sviluppo degli
standards legati al Web.
XLink: XML Linking Language. Linguaggio per definire links tra documenti XML.
XML: Extensible Markup Language . E. un metalinguaggio per definire linguaggi di
marcatura, standardizzato dal W3C.
XML Schema: Come i DTD, esso consente di definire come è un documento XML, ma con
un po. piu. di dettaglio.
XPath: XML Path Language. Parte dell.XSL che permette di identificare porzioni di un
documento XML (elementi, attributi).
XPointer: Un linguaggio che permette di identificare un punto qualsiasi del documento
XML.E. un.estensione di XPath ed è usato in combinazione con XLink.
XQuery: E. un linguaggio di interrogazione per l.XML, utilizzabile sia per documenti XML
singoli sia su database di documenti XML.
XSL: eXtensible Stylesheet Language. Linguaggio di fogli di stile per l.XML standardizzato
dal W3C. Comprende 3 componenti: XPath, XSLT e XSL-FO.
XSLT: XSL Transformations. Parte dell.XSL che permette di definire come trasformare un
documento XML in un altro documento XML, HTML, o testo.
XSL-FO: XSL Formatting Objects. Parte dell.XSL che consente di presentare un documento
XML.
Parte V
Strumenti per XML
Editor
Browser
XML Conversion Tools
Document Storage Systems
Xmetal
http://www.softquad.com/products/xmetal/
XMLNotepad


http://msdn.microsoft.com/xml/notepad/intro.asp
Freeware
Xeena


http://alphaworks.ibm.com/tech/xeena
Freeware e portabile
Browsers

Questa categoria comprende gli strumenti per la visualizzazione e la
navigazione di documenti XML

Internet Explorer - Microsoft (Win32, Mac)
 Mozilla (Win32, Mac, Linux)
 Xplorer - IBM Alphaworks (IBM)
Xplorer


http://alphaworks.ibm.com/tech/xplorer
Freeware e portabile. E' solo un visualizzatore
Document Storage Systems

Strumenti per la gestione dei documenti XML, in grado di gestirne la
memorizzazione e di semplificare le operazioni di ricerca.

Database con supporto per XML
 XML Data Store
Oracle 8i

http://www.oracle.com

Database con supporto per XML
 inserimento di documenti XML come dati primitivi (ricerche testuali)
 importazione dati da XML
 esportazione dati in XML
eXcelon (1)

http://www.exceloncorp.com

XML Data Store
 gestione nativa dei dati XML
 interrogazione mediante XML query languages (XQL)
 accesso ai dati attraverso interfacce DOM
eXcelon (2)
Siti Web interessanti

The XML Cover Pages
http://www.oasis-open.org/cover/

The Whirlwind Guide to XML Tools and Vendors
http://www.infotek.no/sgmltool/guide.htm

Free XML tools and software
http://www/xmlsoftware.org/
http://www.garshol.priv.no/download/xmltools/

W3C XML page
http://www.w3.org/XML/

http://www.extrowebsite.com/corso_xml.asp
http://www.kosmous.com/risorse/articolo.php?id=13


Diapositiva 1

Transcript Diapositiva 1

Directory