Metadati: parola chiave per l'accesso alla biblioteca ibrida

Download Report

Transcript Metadati: parola chiave per l'accesso alla biblioteca ibrida

La biblioteca ibrida:
verso un servizio informativo integrato
Milano, Palazzo delle Stelline, 14 -15 marzo 2002
SBA Università di Padova
1. Come si esprimono i metadati?
2. Perché usare sistemi di metadati?
3. Cosa si dice sui metadati?
4. Quando sono nati i metadati?
5. Che cosa significa metadato?
6. Dove sono collocati i metadati?
7. Quanti sono i formati di metadati?
8. Come sono strutturati i metadati?
9. Qual è la funzione dei metadati?
10. Quali sono i domini di appartenenza dei metadati?
11. Chi produce i metadati?
12. I metadati sono sempre ad accesso libero?
13. Qual è la relazione tra metadati e interoperabilità?
14. Quali prospettive per i metadati?
15. Quando un modello per la rappresentazione dei metadati?
16. Metadati perché?
1. La biblioteca ibrida presenta le sue risorse
2. Biblioteca ibrida: servizio di accesso all'informazione
3. Metadati e confusione semantica
4. Origini e nascita dei metadati
5. Definizione di metadato
6. Metadati interni e metadati esterni
7. Popolazioni di metadati e infodiversità
8. Suddivisione dei metadati per tipologia strutturale
9. Suddivisione dei metadati per tipologia funzionale
10. Suddivisione dei metadati per domini di appartenenza
11. Metadati nelle comunità di utenti
12. Formati proprietari e formati standard
13. Interoperabilità tra formati di metadati
14. XML il linguaggio flessibile
15. RDF la terra di mezzo
16. Metadati chiave di accesso alla biblioteca ibrida
1. Come si esprimono i metadati?
1. La biblioteca ibrida presenta le sue risorse
• Documenti e collezioni di documenti, nella
biblioteca tradizionale e in quella digitale, hanno
in associazione ai loro contenuti qualcosa che è
noto come metadato
• La rappresentazione di forme e contenuti
avviene attraverso i metadati
• Un'efficace gestione dell'informazione digitale
deve necessariamente includere la
presentazione delle risorse
2. Perché usare sistemi di metadati?
2. Biblioteca ibrida: servizio di accesso all'informazione
• Il sistema di metadati è la componente logica di
qualsiasi biblioteca, digitale o tradizionale
• l’organizzazione informativa è fondamentale
• I metadati possono essere usati per molti scopi
non solo catalografici:
–
–
–
–
–
diritti di proprietà intellettuale,
firma digitale,
e-commerce
tariffazione servizi,
PICS
livelli di riservatezza di un documento,
metadescrizioni di oggetti non testuali MMIR
A cosa servono i metadati?
In relazione al contesto
•
•
•
•
Documentare
Contestualizzare
Conservare
Gestire
– date, persone,
strutture …
• Gestire
profili e accessi
In relazione alle risorse
• Presentazione
• Localizzazione
• Selezione
– adeguata all’uso
• Acquisizione
– termini
• Manipolazione
• Utilizzazione
Numerosi sono i progetti o
le biblioteche ibride
che utilizzano metadati
3. Cosa si dice sui metadati?
You call it corn as we call it maize
"Poi
c'è il problema
della
catalogazione
dei metadati.
"I metadati
sono nulla
di più
che dati suie dati:
Su
questidei
il mio
punto sono
di vista
è che siano
i record
cataloghi
metadati:
un
una
sorta
di terza
via tra
cosìtentativo
come unsconsiderato
header TEI,diotrovare
qualsiasi
altra
forma
di descrizione.
il
deserto dei
motori dicatalogazione,
ricerca e della ricerca a testo libero
Potremmo
chiamarla
ema
la per
grande
architettura
delporta
controllo
alcuni
tale termine
in sébibliografico
un bagaglio eccessivo,
che
i bibliotecari
hanno sviluppato
negli
ultimi
centocinquant'anni.
come
le Anglo-American
Cataloging
Rules
e USMARC.
Penso
che i lo
metadati
siano
prodotto
di quelli
Così alcuni
estendono
adiluna
situazione
del che,
tipo
senza
alcuna conoscenza
della
"Voi chiamatelo
granturco,
noicatalogazione,
lo chiamiamo mais",
né
essa,
bibliografi
mariguardo
i metadatiper
sono
uncome
buonalchimisti
termine neutrale
cercano
la pietra
per coprire
tutte lefilosofale
basi” che ci offrirà una catalogazione
efficace senza
spese
e accesso efficace senza vocabolari controllati.
[Priscilla
Caplan,
1995]
Non esiste nessuna cosa del genere e prima si abbandona meglio è".
[Michael Gorman, Roma novembre 2001]
La nuova terminologia ci aiuta
Martin Dillon differenzia i metadati per:
• Presentazione delle risorse
(resource discovery)
• Descrizione delle risorse
(resource description).
• Nella lingua inglese il termine
"discovery" ha un significato duplice, di
scoperta, ma anche di "presentazione".
Immagine tratta dal poster di P. Doherty e R.
Zinkernagel. Premio Nobel 1996 Nobel in Fisiologia.
Poster pubblicato dall’Australian Academy of Science
Presentazione
della risorsa
La "presentazione" dei
metadati di una risorsa
avviene, più o meno, nello
stesso modo in cui, in
medicina, avviene la
presentazione di uno o più
antigeni da parte di una
cellula.
In entrambi i casi si
presentano informazioni
Descrizione
della risorsa
identificatori
• Tradizionali: ISBN; ISSN, SICI, BICI
– ampliamento e revisione delle strutture per
ospitare le RER
• Emergenti: International Standard Work Codes ISWC
1. riferiscono
International Standard
Textualintese
Work Code
(ISTC)
– si
alle "opere"
come
FRBR
2. International
Standard
Audiovisual
Number
– riuniscono,
sotto
un unico
identificatore,
le (ISAN)
differenti
manifestazioni
cui un'opera
manifestarsi.
3. International in
Standard
Musicalpuò
Work
Code (ISWC)
La gestione di questi identificatori è demandata
ai "resolvers" o "risolutori"
4. Quando sono nati i metadati?
4. Origini e nascita dei metadati
• origine e primi usi del termine trovano radici
nell'ambiente basi di dati.
• Metadata Workshop 1995 Stu Weibel OCLC:
nascita del Dublin Core nella comunità dei
bibliotecari
• mancanza del termine nei testi sulle biblioteche
digitali fino a dopo il 1997
• il termine "metadata" è un marchio registrato
dal 1986 di proprietà di The Metadata Company
La legge del metadato
• iogni
cataloghi
di biblioteca,
i servizi
di utente
Ad
formato
di metadato
il suo
indicizzazione,
gli archivi
e la i propri
A ciascuna
comunità
di utenti
documentazione dei musei possono
metadati
essere tutti interpretati come contenitori
;-) di metadati
• Non esiste solo il Dublin Core
• Anche il MARC è un metadato
5. Che cosa significa metadato?
5. Definizione di metadato
• letteralmente definito come "dato sul dato”
• inteso nel significato di "dato strutturato sulle
risorse
• Tim Berners-Lee lo definisce "informazione
comprensibile alla macchina su risorse Web o
altri oggetti".
– l'assioma è questo: il metadato è un dato
– un metadato può descrivere un metadato
6. Dove sono collocati i metadati?
6. Dove sono collocati i metadati?
Dentro
al
documento
Interni alla risorsa:
utili ai motori di ricerca
metadato
risorsa
Fuori dal documento
Esterni alla risorsa:
•entro collezioni di
metadati
metadato
•esposizione di metadati
risorsacon
•in basidati integrate
altri contenitori
•collezioni a modello
distribuito (OA)
•servizi di accesso ai
contenuti
7. Quanti sono i formati di metadati?
7. Popolazioni di metadati e infodiversità.
• L’indagine DESIRE del 1996 identificava e
descriveva oltre 20 "popolazioni" diverse
• I metadati sono numerosi e diversi per
– natura tipologica,
– implementazione,
– ambiti di provenienza
– descrivono oggetti di natura/specie diverse
– scopo
– tipologia
– funzione
Popolazioni di metadati e infodiversità
come in biologia ...
Il termine "metadiversità”coniato da Clifford Lynch
con significato di
"metadato in un contesto di biodiversità
che può relazionarsi con un'ampia gamma
di tipi di informazione che includono dati bibliografici,
dati su modellizzazioni di oggetti di musei,
tassonomie sviluppate da biologi, prodotti della ricerca
e indagini geospaziali
[Michael Day] •la diversità intraspecifica genetica,
•la diversità a livello di specie
•la diversità a livello di comunità.
8. Come sono strutturati i metadati?
In analogia al concetto di biodiversità
anche per i metadati si riscontrano
tre livelli di distinzione:
1. tipologico strutturale, o intraspecifico al
record
2. funzionale, correlato alla funzione stessa
del metadato in relazione all'ambiente
3. di comunità, in una suddivisione in domini
sulla base delle specifiche attività di
comunità di utenti.
1. Suddivisione dei metadati per tipologia strutturale
9. Qual è la funzione dei metadati?
2. Suddivisione dei metadati per tipologia funzionale
Amministrativi
 utilizzati nella gestione e amministrazione delle risorse informative
Descrittivi
 utilizzati per descrivere o identificare risorse informative
Di conservazione
 riferiti alla gestione della conservazione delle risorse informative
Tecnici
 riferiti al funzionamento di un sistema e al comportamento dei
metadati
Di utilizzo
 riferiti al livello e al tipo di utilizzo delle risorse informative
Amministrativi: metadati utilizzati nella gestione
e nell'amministrazione delle risorse informative
 Informazioni sull'acquisizione
 Tracciato storico dei diritti di proprietà intellettuale,
cessione e passaggi ai fini della riproduzione
 Documentazione dei requisiti di accesso legale
 Informazioni sulla reperibilità
 Criteri di selezione per la digitalizzazione [= formato,
set di caratteri]
 Controllo della versione e distinguibilità fra oggetti
informativi simili
 Tracce di controllo create da sistemi di gestione di
metadati [recordkeeping]
Descrittivi: metadati utilizzati per descrivere o
identificare risorse informative
Registrazioni catalografiche
Indicazioni di aiuto per il reperimento
Indicizzazione su database specialistici
Connessioni fra risorse tramite link Web
Annotazioni di utenti
Metadati per sistemi di gestione
[recordkeeping] generati dai programmi
di creazione delle registrazioni
Conservazione: metadati riferiti alla gestione
della conservazione delle risorse informative
Documentazione della condizione fisica
delle risorse
Documentazione delle azioni intraprese
per conservare le versioni fisiche e
digitali delle risorse, per esempio
ripristino [refreshing] e migrazione dei
dati
Tecnici: metadati riferiti al funzionamento di un
sistema e al comportamento dei metadati
Documentazione sull'hardware e il software
Informazioni sulla digitalizzazione, per esempio
formati, rapporti di compressione, procedure di
graduazione [scaling routines]
Tracciato storico dei tempi di risposta di
sistema
Dati di autenticazione e sicurezza, per esempio
chiavi crittografiche, password
Di utilizzo: metadati riferiti al livello e al tipo di
utilizzo delle risorse informative
Registrazioni di visualizzazione [exhibit
records]
Tracciato storico dell'uso e gestione dei
profili utenti
Informazioni sulla riutilizzazione del
contenuto e sull'esistenza di una pluralità
di versioni [multi-versioning information
10. Quali sono i domini di appartenenza dei metadati?
3. Suddivisione dei metadati per domini di appartenenza
Categoria di
dominio
Industria
Editoria
Audio-video
Beni culturali























Attività di dominio
Categoria di
dominio
Manufatti
Venditori di software
Venditori di hardware
Telecomunicazioni
Internet Service Providers
Servizi dei motori di ricerca
Banche e assicurazioni
Pubblicità
Dettaglio
Distribuzioni
Musica/video/multimedia distr
Industria registrazioni musica
Riviste scientifiche
Agenzie stampa
Quotidiani
Gestione dei diritti
Industria filmografica
Produzioni broadcast e
archiviazione delle produzioni
multimediali
Biblioteche
Servizi bibliotecari
Musei
Portali di musei
Archivi
Accademico
Attività di dominio



Educazione e
insegnamento
Ricerca








Progetti universitari e
accademici
Subject Gateways
Iniziative W3C
Corsi interattivi
Educazione permanente e
continua durante l'arco della
vita
Insegnamento a distanza
Scuola
Curricula
Laboratori di ricerca
Compagnie di ricerca
Società professionali
Informazioni
geografiche

Fornitori di informazioni
geospaziali
Altri domini


Trasporti
Servizi di spedizione posta
elettronica
Sanità
Servizi governativi
Ambiente



Possono essere creati
•manualmente
•automaticamente
11. Chi produce i metadati?
Publisher side
autori
webmaster
istituzioni
Agenzie catalografiche nazionali
Repository/site manager
Archivi
Autori,
creatori risorse.
Biblioteche
metadati
Musei.
Editori.
Terze parti: servizi di risoluzione URN
agenzie identificatori: ISBN, ISSN, BICI, SICI, ...
Service side
servizi di ricerca
creatori: terze parti
Comunità di metadati ...
• I metadati riflettono le esigenze delle comunità dai
quali provengono
• Differenti comunità producono documenti
intellettuali peculiari all’utenza specifica che vi
afferisce (matematici, fisici, chimici, …)
• Comunità diverse parlano e necessitano di
linguaggi specifici con i quali formulano la propria
produzione intellettuale
• I metadati prodotti da queste comunità riflettono
necessariamente la struttura e la forma dei
documenti da esse prodotti
conseguenza dell’ampia gamma di comunità con
interesse nei metadati è lo sconcertante numero di
standard e formati esistenti o sotto sviluppo
12. I metadati sono sempre ad accesso libero?
7. Formati proprietari e formati standard
• molte comunità di soggetti, in numerosi settori di
mercato, sono fortemente attaccati ai loro formati
– sui formati proprietari vi sono stati investimenti: in
termini di documentazione, conoscenza e
apprendimento,
– sono stati sviluppati entro i sistemi creati per
manipolare i dati e offrire servizi ad utenze
specifiche.
• Esiste tensione tra questo continuo progredire di
formati specialisti e qualsiasi requisito per un
livello di interoperabilità
13. Qual è la relazione tra metadati e interoperabilità?
Il problema della diversità
• L'interoperabilità è l'abilità dei sistemi di
fornire/accettare servizi in termini di
comunicazione comprensione reciproca attuata
attraverso un colloquio reso possibile nonostante
le differenze.
• ai fini dell’interoperabilità è necessario
– individuare uno schema di riferimento semplice
– utilizzare terminologia controllata per una corretta
corrispondenza semantica tra elementi
– implementare servizi cross-domain per l’accesso a
risorse provenienti da domini differenti
La mappatura: i crosswalk
• da un confronto tra popolazioni diverse emergono
basse aree di sovrapposizione
• una risposta al problema della diversità è la
produzione di crosswalk o mapping di metadati tra
uno o più formati
– ai fini della comparazione tra formati
– al fine di stabilire il loro potenziale di interoperabilità
– come base per la produzione di uno specifico programma di
conversione di formati
– per la produzione di sistemi di ricerca, i quali dovrebbero
permettere l'interrogazione di formati di metadati eterogenei.
• centralità del Dublin Core
– formato strutturato semplice
– facilità di creazione direttamente dai creatori di risorse
14. Quali prospettive per i metadati?
14. XML ...il linguaggio flessibile
•
•
•
•
•
XML = eXtensible Markup Language
XML può essere definito in molti modi diversi
XML è una sintassi per marcare i documenti
XML è una famiglia di tecnologie correlate
XML consente di
– aggiungere metadati (semantica) ai propri dati
– separare il contenuto dalla presentazione
– definire in maniera rigorosa il linguaggio di markup
utilizzato
– utilizzare un formato neutrale e testuale
<?xlm version=1.0”?>
<libro>
<autore>Antonella De Robbio</autore>
<titolo>Diritto d’autore</titolo>
</libro>
<XML permetterà non solo di
scambiare informazioni
<?xlm version=1.0”?>
tra differenti sistemi operativi,
<libro>
ma anche si superare confini
<titolo>Antonella De Robbio</titolo>
nazionali e culturali./>
<autore>Diritto d’autore</autore>
</libro>
<XML e XSL permetteranno
agli editori di scrivere
<?xlm version=1.0”?>
una sola volta
<libro autore=“Antonella De Robbio”>
e pubblicare ovunque,
<titolo>Diritto d’autore</titolo>
su carta
</libro>
o in forma elettronica./>
… ma da solo XML non è
sufficiente ...
• XML è troppo flessibile mentre è
necessario un modello estremamente
semplice per esprimere delle
conoscenze elaborabili
automaticamente
• HTML è estremamente semplice ma non
flessibile e perciò può solo
rappresentare informazioni senza tener
conto della semantica
Lo stack XML/RDF/DC
• Il modello attuale prevede l’utilizzo di
tre standard come strati diversi (layers
comunicativi)
– XML stabilisce la sintassi di base (struttura
fisica)
– RDF definisce la struttura delle relazioni
(struttura logica)
– DC definisce i contenuti (struttura per i
contenuti)
15. Quando un modello per la rappresentazione dei
metadati? Resource Description Framework (RDF)
15. RDF la terra di mezzo
• “RDF,
RDF èthe
un middle
modellolayer,
di metadati
will only be visible
• toRDF
una piattaforma
il trattamento
dei
the èwizards
who inventper
new
ways of
metadati describing and organizing
cataloging,
• information
RDF costituisce
una ipotesi
- the librarian
of di
thesoluzione
future.”
individuata dal W3C al problema della
rappresentazione
deiXML
metadati
Goldfarb,
Prescod - The
Handbook (p. 53)
• RDF è complementare a XML
16. Metadati perché?
16. Metadati chiave di accesso alla biblioteca ibrida
• i metadati rappresentano la chiave d'accesso a
differenti sistemi comunicativi, i quali utilizzano
linguaggi diversi.
• i metadati sono l'anello che congiunge i due
mondi, quello della biblioteca tradizionale e le
Biblioteca
fisicanascenti di biblioteca
Biblioteca
digitale
nuove
forme
digitale.
mondo degli oggetti reali
mondo degli oggetti trasposti
• l'integrazione tra i due mondi, attuatadal
dallo
reale
scambio comunicativo tra metadati,o nati
dà vita
e
digitali
origine ad un ambiente che prende il nome di
"biblioteca ibrida".
"…Ma anche questo è solo un passo intermedio.
Già da molto tempo i bibliotecari hanno capito che
il modo migliore per accedere
con facilità alle informazioni
non consiste nel cercarle direttamente,
ma nel restringere la ricerca
a insiemi mirati e ristretti di dati:
da qui nascono gli schedari delle biblioteche.
Queste informazioni
che riguardano altre informazioni
sono chiamate metadati"
[John Bosak e Tim Bray "XML e la Rete di seconda
generazione". Le Scienze 373/sett.1999]