Biblioteca digitale: elementi di progettazione

Download Report

Transcript Biblioteca digitale: elementi di progettazione

Introduzione ai metadati
amministrativo-gestionali
Scuola vaticana di
biblioteconomia
anno accademico 2007-2008
Paul Gabriele Weston
[email protected]
Conservazione digitale




comprende un’ampia serie di attività volte ad estendere la durata
degli archivi digitali e di salvaguardarli dal danneggiamento del
supporto, dalla perdita di dati e dall’obsolescenza
si è soliti ripartire le attività tra
 quelle intese a favorire la conservazione della codifica binaria dei
dati: l’informazione deve essere intatta e leggibile nel supporto di
archiviazione
 quelle che garantiscono l’accesso nel tempo ai contenuti:
l’informazione deve essere visibile e trattabile da utenti e
apparecchiature e comprensibile per gli utenti
non è perciò sufficiente limitare la conservazione alla codifica
binaria dei dati, ma occorre che dei documenti siano preservati il
contenuto, la forma, lo stile, l’aspetto e la funzionalità
la conservazione digitale richiede pertanto
 l’uso delle tecnologie migliori e più adeguate
 la messa in atto di strategie e procedure accuratamente
pianificate
Risoluzione del Consiglio
d’Europa (25 giugno 2002)

[...] PRENDENDO ATTO dei grandi cambiamenti metodologici che
investono la creazione, la memorizzazione e la conservazione delle
registrazioni, dei documenti e degli archivi, specialmente in formato
digitale, e SOTTOLINEANDO l'esigenza di continuare a definire
metodi e linee guida per la conservazione a lungo termine di quelle
registrazioni, documenti, collezioni e archivi che sono indispensabili
per la salvaguardia del patrimonio europeo; [...]
Risoluzione del Consiglio
d’Europa (25 giugno 2002)
PROPONE di analizzare ulteriormente i seguenti obiettivi e misure:

stimolare la messa a punto di politiche di conservazione della cultura e del
patrimonio digitali nonché la loro accessibilità







mediante la creazione di quadri e meccanismi di cooperazione tra gli Stati membri finalizzati
allo scambio di esperienze su politiche, programmi e questioni regolamentari connesse,
nonché allo sviluppo di una metodologia condivisa,
sostenendo, a livello collettivo ed individuale, le pertinenti organizzazioni preposte alla
conservazione (ad esempio archivi, biblioteche e musei) nella responsabilità che incombe
loro di raccogliere e di mantenere disponibili nel tempo i contenuti digitali,
esaminando quali infrastrutture organizzative e norme tecniche siano necessarie per
sostenere reti stabili e compatibili di raccolte protette,
rafforzare il consenso e la sensibilizzazione tramite reti che appoggino la
condivisione delle esperienze e dei progressi compiuti, l'adozione di norme
appropriate come pure la valutazione e la divulgazione delle buone pratiche,
valutare le possibilità di opportuni investimenti, nonché analizzare i costi e l'impatto
sui finanziamenti attuali efuturi, come pure le potenziali sinergie tra finanziamenti
pubblici e privati,
migliorare la base di competenza, creando dei meccanismi per lo scambio di
conoscenze e competenze, nonché per la continua identificazione dei nuovi requisiti
in termini di competenze e dei nuovi requisiti in fatto di formazione,
stimolare la ricerca sui problemi e le relative soluzioni, mediante lo sviluppo di
programmi di ricerca, sperimentazioni tecnologiche ed applicazioni sperimentali su
larga scala
Gruppo di lavoro per la
conservazione delle memorie digitali
Conferenza internazionale di Firenze (16-17 ottobre 2003) sotto il
coordinamento della Presidenza italiana dell’Unione Europea
A livello europeo, ha fatto proprio l’obiettivo di procedere a una ricognizione
dello stato dell’arte in materia di conservazione digitale e allo sviluppo di
un piano d’intervento necessario a diffondere e dar seguito ai principi
contenuti nella risoluzione.
Il gruppo di lavoro ha avuto come referenti principali i progetti ERPANET e
MINERVA, sotto la guida della Commissione Europea e della Presidenza
italiana.
La Risoluzione del Consiglio sollecita la Commissione Europea e gli stati
membri a fare il punto e promuovere un’indagine conoscitiva sulla
situazione corrente, sulle emergenze e sui rischi, sulle criticità che
ostacolano la conservazione del patrimonio culturale digitale, a
intraprendere le attività e un piano d’azione adeguati.
Fanno parte del gruppo di lavoro alcuni esperti già coinvolti nell’elaborazione
della Risoluzione, altri esperti nominati dalle autorità nazionali attraverso
il NRG (National Representatives Group), altri ancora riconosciuti per il
loro impegno in iniziative rilevanti a livello internazionale.
Attività del Gruppo di lavoro
Il gruppo di lavoro punta a realizzare tre obiettivi principali:
 delineare il quadro delle iniziative attualmente in corso e favorire lo
scambio di “buone pratiche”
 definire una agenda di priorità come punto di partenza per un piano
d’azione condiviso dagli Stati-membri
 definire le basi per la formazione di una rete europea e per lo sviluppo
di iniziative nazionali.
La prima attività del gruppo è consistita nel favorire un processo di
cooperazione, nel definire priorità e meccanismi capaci di incrementare
il coordinamento e l’efficacia delle iniziative di carattere nazionale o di
settore sulla conservazione digitale in Europa.
Questa prima fase di lavoro è confluita nell’Agenda di Firenze, presentata
alla Conferenza internazionale di Firenze. Nel corso della Conferenza
sono stati anche presentati due rapporti: l’uno documenta alcuni casi di
emergenza e di rischio; l’altro pubblica un’indagine conoscitiva sullo
stato delle normative, procedure e linee guida per la conservazione,
attualmente vigenti in alcuni paesi in Europa e nel mondo.
Dopo Firenze
L’ICCU ha profuso un impegno scientifico e organizzativo di primo piano
sia nell’ideazione della Conferenza internazionale di Firenze sia nel
garantire al progetto e al gruppo di lavoro sviluppo, continuità,
possibilità di radicamento e di coordinamento in Italia.
L’agenda di Firenze è stata sottoscritta da 27 paesi (stati-membri, nuovi
stati aderenti, Russia, Israele) nel corso del V° Convegno del Gruppo
dei Rappresentanti Nazionali (NRG) a Parma il 19 novembre 2003. Il
NRG ha riconosciuto l’attività del gruppo di lavoro sulla conservazione
come complementare all’impegno per la digitalizzazione del patrimonio
culturale e ha offerto il suo sostegno sia partecipando al gruppo di
esperti, sia offrendo l’infrastruttura di rete.
Dopo la Conferenza di Firenze il gruppo di lavoro ha continuato e continua
a svolgere la sua attività con l’obiettivo di favorire la cooperazione a
livello europeo e di rafforzare la crescita di consapevolezza
e consenso sui temi della conservazione digitale.
Metadati per la conservazione
Saving Digital Heritage



Considering that the disappearance of
heritage in whatever form constitutes
an impoverishment of the heritage of
all nations …
Recognising that … resources of
information and creative expression
are increasingly produced, distributed,
accessed and maintained in digital
form, creating a new legacy—the
digital heritage …
Understanding that this digital heritage
is at risk of being lost and that its
preservation for the benefit of present
and future generations is an urgent
issue of worldwide concern …
Le azioni dell’UNESCO (1/3)

Draft Charter on the Preservation of the Digital Heritage



vengono analizzate le barriere alla continuità digitale per prevenire
l’insorgere di un ulteriore fenomeno di “digital divide”: gli strumenti per la
conservazione digitale vengono applicati al patrimonio di pochi Paesi
maggiormente dotati di risorse
come gli altri documenti dell’UNESCO non è vincolante, ma si limita ad
esprimere auspici e a formulare priorità
patrimonio digitale: “consists of unique resources of human knowledge
and expression, whether cultural, educational, scientific or
administrative, while embracing technical, legal, medical and other kinds
of information that more and more are being created digitally, or
converted into digital form from existing analogue resources.… Many of
these resources have lasting value and significance, and therefore
constitute a heritage that should be protected and preserved for current
and future generations. This heritage may exist in any language, in any
part of the world, and in any area of human knowledge or expression”
Le azioni dell’UNESCO (2/3)



viene espresso l’auspicio che si trovi un compromesso tra i
legittimi diritti dei creatori e degli altri aventi diritto e l’interesse
del pubblico all’accesso al patrimonio documentale, nel rispetto
degli accordi internazionali
tra le minacce al patrimonio digitale, vengono citate
 la rapida obsolescenza delle tecnologie per l’accesso
 l’assenza di una legislazione che persegua la conservazione
 le incertezze internazionali riguardanti risorse, responsabilità
e metodologie
tra le priorità, si collocano
 campagne di sensibilizzazione alle tematiche della
conservazione
 formazione di specialisti in tecnologie della conservazione
 progetti internazionali di cooperazione finalizzati alla
conservazione del patrimonio digitale
Le azioni dell’UNESCO (3/3)


Guidelines for the Preservation of Digital Heritage
si rivolgono a più tipologie di destinatari





amministratori con responsabilità di tipo politico che necessitino di
informazioni sulle quali basare la strategia della digitalizzazione
amministratori di alto livello che abbiano necessità di conoscere le
questioni gestionali relative alla conservazione nell’ambito del proprio
ruolo di coordinamento
gestori che abbiano bisogno di comprendere in dettaglio le questioni
pratiche per assumere consapevolmente le decisioni quotidiane
operatori con responsabilità di implementare programmi che
necessitino di una prospettiva generale su come le diverse questioni
pratiche e i processi operativi si combinino fra loro
due approcci


concetti base della conservazione digitale (definizioni di patrimonio
digitale, conservazione digitale, programmi di conservazione,
responsabilità, gestione e cooperazione)
descrizione delle procedure e delle decisioni relative alle diverse fasi
del ciclo di vita dell’oggetto digitale (cosa conservare, operare con i
produttori, organizzare e documentare gli oggetti digitali, gestire i diritti,
proteggere i dati, garantire l’accessibilità)
Alcuni principi (1/3)
1. Non tutti i materiali digitali debbono essere conservati; soltanto quelli dei
quali è accertato un valore permanente costituiscono il patrimonio digitale
3. Non si possono ritenere conservati quei materiali digitali a cui non è più
possibile accedere. Lo scopo della conservazione è mantenere la capacità
di presentare gli elementi essenziali di materiali digitali autentici
4. La conservazione digitale deve contrastare ogni minaccia nei confronti di
tutti i livelli dell’oggetto digitale: fisico, logico, concettuale e sostanziale
5. La conservazione digitale ha successo soltanto se le istituzioni e gli individui
se ne assumono la responsabilità. Punto di inizio dell’azione è la decisione
riguardante le responsabilità
6. Nessuno deve fare tutto. Niente deve essere fatto in una sola volta
7. Programmi di conservazione affidabili ed esaustivi sono fortemente
auspicabili, ma non sempre possono essere realizzati quando vi sia una
situazione critica. E’ opportuno pertanto procedere gradualmente, in modo
limitato, piuttosto che non procedere affatto
Alcuni principi (2/3)
8. Nell’agire gli amministratori debbono essere consapevoli della complessità
delle questioni. Poiché è fondamentale non provocare danni, essi
dovrebbero adoperarsi a comprendere l’intero processo e i suoi obiettivi,
evitando le decisioni che potrebbero compromettere futuri interventi per la
conservazione
15. I programmi di conservazione debbono esplicitare il diritto di raccogliere,
copiare, denominare, modificare, archiviare e fornire l’accesso ai materiali
digitali dei quali si assumono la responsabilità
24. L’autenticità è protetta meglio da misure che assicurino che l’integrità dei
dati non sia compromessa e da documentazione che dimostri chiaramente
l’identità del materiale
26. L’obiettivo di garantire l’accessibilità consiste nel trovare modalità
economiche di fornire l’accesso in qualunque momento sia necessario, sia
nel breve, che nel lungo termine
27. Gli standard sono un fondamento della conservazione digitale, ma
occorre trovare il modo di conservare anche materiali poco aderenti agli
standard, in un ambiente di standard in costante cambiamento
28. La conservazione non deve essere procrastinata in attesa dello “standard
della conservazione digitale”
Alcuni principi (3/3)
29. I dati digitali dipendono sempre da una combinazione di hardware e
software. Dalla proporzione tra le due componenti dipendono le strategie
fra le quali scegliere ai fini della conservazione
30. E’ buona norma che si diversifichino le strategie per la conservazione,
specialmente nel caso di collezioni eterogenee
32. I programmi di conservazione debbono talvolta definire un livello
accettabile di perdita in termini di oggetti, elementi e bisogni degli utenti
33. Attendere la disponibilità di soluzioni affidabili e omnicomprensive prima
di intraprendere qualunque tipo di intervento probabilmente comporta che
del materiale vada perso
34. I programmi di conservazione richiedono buone capacità gestionali, le
quali implicano una conoscenza delle questioni connesse al trattamento
del materiale digitale adeguata alle decisioni da prendere al momento
giusto
35. La conservazione digitale implica l’individuazione e la gestione dei rischi
39. Sebbene i service provider spesso prevedano una limitata funzione di
conservazione, la responsabilità principale ricade sui programmi di
conservazione specificamente realizzati e su coloro che li sovrintendono e
li supportano
Archivi / depositi digitali


i due termini (archive e repository) vengono utilizzati
indifferentemente per indicare un sistema
organizzativo finalizzato a preservare l’informazione
per l’accesso e l’uso da parte di una specifica
comunità di utenti
altro è invece la biblioteca digitale (digital library)
con la quale si intende un sistema organizzativo
finalizzato a rendere possibile la ricerca e l’accesso
a documenti ed informazioni digitali da parte di
comunità di utenti, senza che ciò implichi
necessariamente la messa in atto di strategie di
conservazione nel tempo dei dati
Open Archival Information System

è una tipologia di archivio che
consiste nell’insieme organizzato di
soggetti e di sistemi che perseguono
l’obiettivo di preservare l’informazione
per una o più di una determinata
comunità di utenti


http://www.ccsds.org/docu/dscgi/ds.py/Get/File143/650x0b1.pdf
Il modello OAIS / Gloria Cirocchi
http://www.iccu.sbn.it/PDF/Cirocchi.pdf
Origine di OAIS



il modello svolge nel contesto dei metadati gestionaliamministrativi e strutturali una funzione per qualche
verso analoga alla funzione svolta da FRBR per i
metadati relativi alla ricerca e al recupero delle risorse
informative
è stato sviluppato dal Consultative Committee for
Space Data Systems della NASA come standard per
la conservazione a lungo termine dei dati derivati
dall'osservazione dello spazio e del pianeta
nonostante la sua origine, il modello OAIS è adeguato
alle finalità della conservazione a lungo termine anche
per altre comunità utenziali e tipologie di documenti
Diffusione di OAIS (1/2)

pur essendo fortemente orientato al trattamento dei
documenti elettronici, infatti,




è applicabile a qualsiasi tipo di archivio (digitale o analogico)
non specifica nessun tipo di implementazione
può essere applicato indifferentemente a oggetti digitali nativi, a
prodotti di attività di digitalizzazione (quali file di immagini), e
persino a oggetti fisici
si sta affermando come lo standard per la conservazione
delle risorse digitali in quanto affronta la tematica della
responsabilità della conservazione a lungo termine
dell'informazione digitale
Diffusione di OAIS (2/2)

è stato adottato come modello di riferimento da alcune importanti
esperienze del mondo di biblioteche ed archivi





NEDLIB (Networked European Deposit Library) che ha formulato un
modello di deposito delle pubblicazioni elettroniche
http://www.kb.nl/coop/nedlib
CEDARS (CURL Exemplars in Digital Archives), promosso dalle
Università di Cambridge, Oxford e Leeds, che ha sviluppato uno schema
di metadati per la conservazione basato sul modello OAIS
http://www.leeds.ac.uk/cedars/index.html
PANDORA (Preserving and Accessing Networked Documentary
Resources of Australia) della National Library of Australia, che mira alla
conservazione di siti Web selezionati
http://pandora.nla.gov.au/index.html
NDIIPP (National Digital Information Infrastructure and Preservation
Program) http://www.digitalpreservation.gov/
ARSBNI (Arricchimento dei Servizi della Bibliografia Nazionale Italiana
http://www.bncf.firenze.sbn.it/progetti/arsbni/
Il modello OAIS
L’ambiente OAIS

è formato dall'interazione di quattro entità, definite
come:




i produttori: sulla base di accordi formalizzati per
l'immissione dei dati nell'archivio forniscono i dati in base
alle componenti logiche e al modello di rappresentazione
OAIS
i consumatori: i soggetti, o sistemi clienti, che
interagiscono con i servizi OAIS per reperire e acquisire
l'informazione conservata di proprio interesse
il management: esterno all'archivio, si occupa delle
politiche dell'archivio: cosa archiviare, come trovare i fondi
ecc.
l'archivio stesso: inteso come sistema organizzato che si
propone di conservare l'informazione per consentirne
l'accesso e l'uso ad una determinata comunità utenziale
Le componenti funzionali di OAIS

sono definite come:
 Immissione (Ingest): riceve l'informazione dai produttori e la
prepara per l'archiviazione
 Archiviazione dei dati (Archival Storage): tratta l'archiviazione,
la manutenzione e la gestione della informazione archiviata
 Gestione dei dati (Data Management): coordina i metadati
descrittivi relativi sia all'informazione archiviata sia ai dati
amministrativi interni all’archivio
 Accesso (Access): è la funzione che aiuta i consumatori a
identificare e ottenere informazione dall'archivio
 Amministrazione dell'archivio (Administration): ha in carico le
procedure quotidiane di gestione dell'archivio
 Pianificazione della conservazione (Preservation Planning):
specifica e rende visibili le attività di conservazione effettuate, a
prescindere dalla strategia adottata
La strutturazione dei dati



oltre alle componenti funzionali, OAIS fornisce anche un modello di
strutturazione dei dati adeguato a rappresentare l'informazione
digitale da un punto di vista orientato alla conservazione
centrale è la definizione di Oggetto Informativo (Information
Object), di qualsiasi tipo esso sia, come composto da due
elementi:
 Dati
 Informazione sulla rappresentazione (Representation
information), necessaria per conferire significato ed interpretabilità
ai dati
la conservazione nel tempo dei due elementi è un requisito
fondamentale nel funzionamento del modello
Informazione sulla rappresentazione



nell’ambiente digitale, occorre che i Dati (una sequenza di bit)
siano collegati ad una R.I. (Representation Information) perché è
questa componente che contiene le informazioni che rendono
comprensibili quei bit
 dal punto di vista strutturale (specificazione del formato,
descrizione del s/w di accesso, etc.)
 e semantico (p. es. in quale lingua è un testo in caratteri ASCII).
il medesimo modello si applica anche al documento analogico
 l'informazione contenuta in un libro espressa da caratteri a
stampa (i dati), in combinazione con una conoscenza della lingua
del testo (la Conoscenza di Base), si converte in informazione
 poiché la lingua non rientra tra le conoscenze del ricevente, il
testo (i dati) dovrà essere accompagnato da un dizionario e da
informazioni grammaticali espresse in una forma compresa nella
Conoscenza di Base di chi riceve l'informazione: questi due
elementi costituiscono l'Informazione sulla Rappresentazione
in generale, perciò si può dire "i Dati, in unione alla loro
Informazione sulla Rappresentazione, veicolano significato".
Rete di informazioni sulla rappresentazione



l’Informazione sulla Rappresentazione, in ambiente
digitale, è dotata di una natura ricorrente
per essere interpretata, una I.R. avrà bisogno di
un'altra I.R., e così via, creando una Rete di
Informazioni sulla Rappresentazione,
(Representation Network), fino ad incontrare la
Conoscenza di Base della Comunità per cui
l'informazione viene conservata
Il modello OAIS raccomanda che la Rete termini con
un documento in formato analogico che dia avvio
all'intera sequenza di interpretazione
Pacchetti di informazione


ogni scambio di informazione, da e per l'archivio, e all'interno di
OAIS, avviene attraverso l'utilizzazione di Pacchetti di
Informazione (I.P.-Information Packages), che sono dei
contenitori concettuali di dati
gli Oggetti Informativi possono comporre 3 tipi di I.P., utilizzati a
seconda che il flusso di informazioni avvenga dal Produttore
all'OAIS, al suo interno, o dall'archivio stesso verso l’utente (il
Consumatore):
 SIP - (Submission Information Package - Pacchetto di
Informazioni per l'Immissione): utilizzato nella fase di
immissione/acquisizione dei dati, inviato dal produttore in base al
Submission Agreement stipulato con l'OAIS
 AIP - (Archival Information Package - Pacchetto di Informazioni
per l'Archiviazione): destinato alla conservazione a lungo
termine
 DIP - (Dissemination Information Package - Pacchetto di
Informazioni per la Distribuzione): trasferito dall'OAIS all'utente
in base ad una richiesta di accesso
L’Oggetto Informativo (1/2)

un I.P. è costituito dall'aggregazione di quattro classi
di Oggetto Informativo:


Informazione sul Contenuto (Content Information):
l'oggetto primario destinato ad essere conservato
dall'archivio (p.es. un documento in formato PDF (i dati),
più la documentazione del formato PDF (la R.I.)
Informazione Descrittiva per la Conservazione /
(Preservation Description Information): è il set di
informazioni necessarie a conservare adeguatamente, per
un periodo di tempo indefinito, il Contenuto cui sono
associate:
 si focalizza sulla descrizione degli stati passati e presenti
del Contenuto
 assicura che sia identificato univocamente,
 che non sia alterato senza che ciò venga registrato.
L’Oggetto Informativo (2/2)


Il Contenuto e l’Informazione Descrittiva per la Conservazione
sono viste come incapsulate e identificabili per mezzo della:
 Informazione di Impacchettamento (Packaging Information):
come reperire 1) e 2), ovvero come sono collegati i componenti
di un Pacchetto di Informazioni in un'entità identificabile su uno
specifico supporto (p. es. in che disco, in che directory, ecc.)
Il “pacchetto di informazione” che ne risulta è ricercabile
attraverso la
 Informazione Descrittiva (Descriptive Information): finalizzata
alla ricerca e al recupero dell'informazione, p. es.: Manzoni,
Alessandro - Autore principale - RICA. Essa può basarsi su
informazioni contenute nell’Informazione sul Contenuto e
nell’Informazione Descrittiva per la Conservazione, ma ne è
distinta sul piano logico
Informazione Descrittiva per la
Conservazione

vengono individuate quattro categorie di informazioni:
 Identificazione (Reference Information): enumera e descrive gli
identificatori assegnati al Contenuto (p. es. l'URN di 1.
Informazione sul Contenuto e il riferimento alla normativa sull'URN)
 Contesto (Context Information): documenta le relazioni del
Contenuto con il suo ambiente (perché è stato creato, in che
relazione è con altri Contenuti) (p.es. altri O.I. nella stessa
collezione, manifestazioni precedenti dello stesso Oggetto)
 Provenienza (Provenance Information): documenta la storia del
Contenuto e i cambiamenti da esso subiti, oltre che la catena di
custodia (p. es. il formato originale dei dati, quale specifico
processo ha permesso la creazione / trasformazione di un
determinato oggetto informativo, chi è stato responsabile di quel
processo)
 Autenticazione (Fixity Information): documenta i meccanismi di
autenticazione destinati ad assicurare l'integrità del Contenuto (p.
es. l'impronta digitale calcolata con l'algoritmo MD5)
Trattamento dell’oggetto digitale




un oggetto digitale entra nel sistema sotto forma di Submission
Information Package (SIP), comprendente l’oggetto e il set di metadati
richiesto. La sua trasmissione in tale forma è responsabilità del
Produttore
il SIP passa attraverso le procedure di Immissione (Ingest) nel quale
viene trattato e reso conforme ai criteri e alle norme applicate nel sistema
diventando un Archival Information Package (AIP). L’AIP comprende il
contenuto di SIP più i metadati previsti dal sistema ai fini della
conservazione. Ad ogni successivo trattamento di AIP corrisponde
l’aggiunta di metadati.
oltre che delle procedure di Immissione, il Gestore è responsabile delle
procedure di aggiornamento costante dell’AIP, nonché della consegna
degli AIP agli utenti sotto forma di Dissemination Information Packages
(DIP)
la distribuzione dei DIP presuppone l’esecuzione di diverse funzioni:
Amministrazione, Gestione dei dati e Servizi comuni. Un sistema OAIS vi
aggiunge due funzioni basilari: Archiviazione e Conservazione. Queste
applicano le strategie necessarie a protrarre nel tempo la fruizione degli
AIP sotto forma di consultazione, utilizzazione e comprensione
Metadata Encoding and
Transmission Standard (METS)




sviluppato dalla comunità bibliotecaria, fornisce una struttura ai
dati per consentire lo scambio, la visualizzazione e l’archiviazione
di oggetti digitali
nel quadro di OAIS rappresenta un dispositivo utile al trasferimento
di dati internamente ed esternamente all’archivio OAIS
qualunque comunità desideri implementare OAIS deve identificare
o creare un formato di scambio che funga da information package.
METS appare una soluzione ideale per la comunità delle risorse
culturali. Esso incorpora i surrogati digitali – file immagini, audio,
video – insieme ai metadati amministrativi e descrittivi in un unico
documento XML.
il cuore di un oggetto METS è la mappa strutturale (structural
map), che funge da indice dei contenuti per l’accesso da parte
degli utenti. La gerarchia della mappa strutturale consente la
navigazione tra i file incorporati o citati dall’oggetto METS.
Consente di scorrere le pagine di un diario o puntare a specifici
segmenti di un programma a tempo, come un frammento di
videoclip
METS come formato di scambio


poiché METS raggruppa i dati sull’oggetto e le
informazioni sul surrogato digitale e codifica tutte
queste informazioni in XML, viene sempre più di
frequente utilizzato per trasferire dati dai sistemi
locali agli archivi centrali collettivi
nell’ambito della rete RLG una istituzione
partecipante può conferire una collezione sotto
forma di singoli oggetti METS e il programma di
caricamento immette i dati in un database DB2,
utilizzando le funzioni di METS come Pacchetto di
informazioni per l’immissione (SIP)
METS come formato di
gestione e di conservazione


le specifiche METS comprendo una sezione di
metadati amministrativi che consentono all’oggetto
digitale di portare con sé informazioni sul contesto
amministrativo (diritti sulla proprietà intellettuale) o
sull’ambiente tecnologico nel quale i surrogati digitali
sono stati creati (metadati tecnici)
grazie alla presenza di metadati amministrativi,
METS si presta a fungere da Paccheto di
informazioni per l’archiviazione (AIP) nel quadro di
OAIS
METS come formato di consegna

mediante il software di visualizzazione di METS il
file XML produce uno slide show o un media player
standard. Rendendo i file immagine, audio e video
navigabili, METS consente la ricomposizione di un
oggetto mutiparte in un insieme organizzato e
coerente. La mappa strutturale consente la
suddivisione di un file audio video in segmenti che
possono essere eseguiti singolarmente
eventualmente associati alle immagini. Secondo la
logica di OAIS, METS si può configurare come un
DIP (dissemination information package)
La struttura di METS (1/2)




un header descrive l’oggetto di METS stesso. Contiene informazioni
del tipo “chi ha creato questo oggetto, quando, ecc.” L’informazione
presente nell’header consente la corretta gestione del file METS
la sezione dei metadati descrittivi contiene informazioni che
descrivono la risorsa informativa rappresentata dall’oggetto digitale. I
metadati descrittivi consentono la ricerca della risorsa
la mappa strutturale rappresentata dai singoli fogli e dai dettagli
organizza i file digitali dell’oggetto in una gerarchia che consente lo
scorrimento
la sezione del file di contenuto rappresentato dalle immagini 1-5
dichiara quali file digitali costituiscono l’oggetto. I file possono essere
annidati nell’oggetto o citati
La struttura di METS (2/2)



la sezione dei metadati amministrativi contiene informazioni
sui file digitali dichiarati nella sezione dei file di contenuto. La
sezione si divide in
 metadati tecnici: specificano le caratteristiche tecniche di un file
 metadati della fonte: specificano la fonte della riproduzione
(scansione, ecc.)
 metadati della provenienza digitale: specificano i cambiamenti
intervenuti sul file dalla sua creazione
 metadati dei diritti: specifica le condizioni di accesso e fruizione
la sezione con i metadati tecnici, fonte e della provenienza
digitale contengono informazioni necessarie alla conservazione
digitale
la sezione informazioni di comportamento associano
all’oggetto METS programmi eseguibili (per esempio, filigrana
digitale)
Caratteristiche di METS

i creatori di METS hanno combinato le specifiche W3C di XML e i
Namespaces in XML per creare uno standard flessibile.
 lo schema XML consente di specificare le regole di un
documento XML valido. Lo schema può essere utilizzato per fare
il parsing di un documento XML (verificare che la marcatura XML
sia conforme allo standard formalizzato dallo schema)
 l’uso dei Namespaces mette in grado METS di delegare alcuni
compiti riguardanti i metadati ad altri schemi XML. Per esempio,
lo schema METS non prescrive il modo di descrivere la risorsa
rappresentata dall’oggetto digitale, non vi sono metadati
descrittivi. Tuttavia può puntare ad uno schema di metadati
esterno nel quale sia ospitata la descrizione
Vantaggi e opportunità (1/2)


ciascuna comunità utenziale può introdurre gli elementi descrittivi
ritenuti utili, purchè formalizzati in uno schema. Nel caso di
risorse audiovisive può essere utilizzato lo schema VRA Core.
Per le risorse bibliografiche le biblioteche possono preferire il
MARC o il Metadata Object Description Schema (MODS)
prodotto dalla Library of Congress. In altri casi può essere più
opportuno l’uso di Dublin Core (DC). La flessibilità e la ospitalità
di METS consente l’implementazione di un ampio numero di
standard, eventualmente anche contemporaneamente per
descrivere il medesimo oggetto a beneficio di più comunità di
utilizzatori
la medesima logica si applica a tutte le componenti dei metadati
amministrativi. Ogni comunità può decidere quali siano i dati
necessari per il trattamento dell’informazione, li formalizza in uno
schema XML e usa questo schema come una estensione di
METS
Vantaggi e opportunità (2/2)



l’alternativa consiste nel riferirsi a dati contenuti in
un database esterno al quale l’oggetto METS può
puntare
la possibilità di annidare i dati (embedding) o di fare
riferimento a dati esterni (referencing) si applica fino
al livello dei singoli file
vi è persino la possibilità di incorporare (wrapping)
all’interno del documento XML il file digitale in forma
di codifica binaria, ciò che potrebbe essere
particolarmente utile ai fini dell’archiviazione di lunga
durata
Esempio di header
<?xml version="1.0" ?>
<METS:mets xmlns:xsi="http://www.w3.org/2000/10/XMLSchema-instance"
xmlns:METS="http://www.loc.gov/METS/"
xmlns:fedoraAudit="http://fedora.comm.nsdlib.org/audit"
xmlns:uvadesc="http://dl.lib.virginia.edu/bin/dtd/descmeta/"
xmlns:uvadigiprov="http://dl.lib.virginia.edu/bin/admin/digiprov/"
xmlns:uvasource="http://dl.lib.virginia.edu/bin/admin/source/"
xmlns:uvarights="http://dl.lib.virginia.edu/bin/admin/rights/"
xmlns:uvatech="http://dl.lib.virginia.edu/bin/admin/tech/"
xmlns:xlink="http://www.w3.org/TR/xlink"
xsi:schemaLocation="http://www.loc.gov/standards/mets/
http://www.cs.cornell.edu/payette/mellon/fedora/mets-fedora.xsd"
OBJID="uva-lib:1225" TYPE="FedoraObject“
LABEL="Saskia/AICT Image Collection - Mycenae"
PROFILE="fedora:IMAGE-W">
Esempio di header
<METS:metsHdr ID="H1" CREATEDATE="2002-05-20T06:32:00"
LASTMODDATE="2002-05-22T12:25:00" RECORDSTATUS="A">
<METS:agent ID="A1" ROLE="CREATOR“ TYPE="INDIVIDUAL">
<METS:name>Sandy Payette </METS:name>
<METS:note>Digital Object based on Sakia image and created as the
official Fedora sample object</METS:note>
</METS:agent>
<METS:agent ID="A2" ROLE="CUSTODIAN“ TYPE="ORGANIZATION">
<METS:name>University of Virginia Library</METS:name>
<METS:note>Object owned by UVA</METS:note>
</METS:agent>
</METS:metsHdr>
Esempio di metadati descrittivi esterni
<dmdSec ID="dmd001">
<mdRef LOCTYPE="URN" MIMETYPE="application/xml"
MDTYPE="EAD"
LABEL="Berol Collection Finding Aid">urn:x-nyu:fales1735</mdRef>
</dmdSec>
Metadati descrittivi
Sezioni MD descrittivi
dmdSec
mdRef
mdWrap
dmdSec
mdWrap
dmdSec
mdRef
dmdSec
mdWrap
MD descrittivi
esterni
Esempio di metadati descrittivi interni
<dmdSec ID="dmd002">
<mdWrap MIMETYPE="text/xml" MDTYPE="DC" LABEL="Dublin
Core Metadata">
<dc:title>Alice's Adventures in Wonderland</dc:title>
<dc:creator>Lewis Carroll</dc:creator>
<dc:date>between 1872 and 1890</dc:date>
<dc:publisher>McCloughlin Brothers</dc:publisher>
<dc:type>text</dc:type>
</mdWrap>
</dmdSec>
Esempio di metadati descrittivi interni
(dati binari)
<dmdSec ID="dmd003">
<mdWrap MIMETYPE="application/marc" MDTYPE="MARC"
LABEL="OPAC Record">
<binData>MDI0ODdjam0gIDIyMDA1ODkgYSA0NU0wMDAxMDA...
(etc.)
</binData>
</mdWrap>
</dmdSec>
Metadati amministrativi
amdSec
techMD
mdRef
mdWrap
sourceMD
digiprovMD
rightsMD
Md Amministrativi
MD ammin
esterni
Esempio di metadati amministrativi
<amdSec ID="AMD001">
<mdWrap MIMETYPE="text/xml" MDTYPE="NISOIMG"
LABEL="NISO Img. Data">
<niso:MIMEtype>image/tiff</niso:MIMEtype>
<niso:Compression>LZW</niso:Compression>
<niso:PhotometricInterpretation>8</niso:PhotometricInterpretation>
<niso:Orientation>1</niso:Orientation>
<niso:ScanningAgency>NYU Press</niso:ScanningAgency>
</mdWrap>
</amdSec>
Sezione dei File
fileSec
fileGrp
file
Flocat
FContent
file
file
Contenuto
Esterno
<fileGrp>
<fileGrp ID="VERS1">
<file ID="FILE001" MIMETYPE="application/xml" SIZE="257537"
CREATED="2001-06-10">
<FLocat LOCTYPE="URL"> http://dlib.nyu.edu/tamwag/beame.xml </FLocat>
</file>
</fileGrp>
<fileGrp ID="VERS2">
<file ID="FILE002" MIMETYPE="audio/wav" SIZE="64232836"
CREATED="2001-05-17" GROUPID="AUDIO1">
<FLocat LOCTYPE="URL"> http://dlib.nyu.edu/tamwag/beame.wav </FLocat>
</file>
</fileGrp>
<fileGrp ID="VERS3" VERSDATE="2001-05-18">
<file ID="FILE003" MIMETYPE="audio/mpeg" SIZE="8238866"
CREATED="2001-05-18" GROUPID="AUDIO1">
<FLocat LOCTYPE="URL"> http://dlib.nyu.edu/tamwag/beame.mp3 </FLocat>
</file>
</fileGrp>
</fileGrp>
Collegamenti File-Metadati
Amministrativi
fileSec
amdSec
fileGrp
file
techMD
mdRef
mdWrap
sourceMD
Sezione file
digiprovMD
rightsMD
Md Amministrativi
Md ammin.
Esterni
<structMap TYPE="logical">
<div ID="div1" LABEL="Oral History: Mayor Abraham Beame" TYPE="oral history">
<div ID="div1.1" LABEL="Interviewer Introduction" ORDER="1">
<fptr FILEID="FILE001">
<area FILEID="FILE001" BEGIN="INTVWBG" END="INTVWND"
BETYPE="IDREF" />
</fptr>
<fptr FILEID="FILE002">
<area FILEID="FILE002" BEGIN="00:00:00" END="00:01:47"
BETYPE="TIME" />
</fptr>
<fptr FILEID="FILE003">
<area FILEID="FILE003" BEGIN="00:00:00" END="00:01:47"
BETYPE="TIME" />
</fptr>
</div>
<div ID="div1.2" LABEL="Family History" ORDER="2">
<fptr FILEID="FILE001">
<area FILEID="FILE001" BEGIN="FHBG" END="FHND" BETYPE="IDREF" />
</fptr>
<fptr FILEID="FILE002">
<area FILEID="FILE002" BEGIN="00:01:48" END="00:06:17" BETYPE="TIME" />
</fptr>
<fptr FILEID="FILE003">
<area FILEID="FILE003" BEGIN="00:01:48" END="00:06:17" BETYPE="TIME" />
</fptr>
</div>
<div ID="div1.3" LABEL="Introduction to Teachers' Union" ORDER="3">
<fptr FILEID="FILE001">
<area FILEID="FILE001" BEGIN="TUBG" END="TUND" BETYPE="IDREF" />
</fptr>
<fptr FILEID="FILE002">
<area FILEID="FILE002" BEGIN="00:06:18" END="00:10:03" BETYPE="TIME" />
</fptr>
<fptr FILEID="FILE003">
<area FILEID="FILE003" BEGIN="00:06:18" END="00:10:03" BETYPE="TIME" />
</fptr>
</div>
</div>
</structMap>
Collegamento Struttura-Contenuto
Mappa Strutturale
structMap
Sezione File
fileSec
div
fptr
area
seq
area
area
par
area
area
fileGrp
file
Flocat
FContent
file
file
file
mptr
Contenuto
Esterno
Collegamento Struttura-Metadati
descrittivi
Md Descrittivi
Mappa Strutturale
structMap
div
div
div
dmdSec
mdRef
dmdSec
mdWrap
dmdSec
mdRef
dmdSec
mdWrap
MD Descrittivi
Esterni
Struttura e contenuto collegati
a Metadati amministrativi
Sezione File
fileSec
amdSec
fileGrp
file
techMD
mdRef
mdWrap
sourceMD
structMap
digiprovMD
div
rightsMD
Mappa Strutturale
Md Amministrativi
MDAdmin
Esterni
Esempio
<METS:behaviorSec ID="DISS1.0" STRUCTID="S1“
BTYPE="uva-bdef-image-w:101" CREATED="2002-05-25T08:32:00"
LABEL="Watermark Behaviors" GROUPID="DISS1"
ADMID="AUDREC1" STATUS="A">
<METS:interfaceDef LABEL="Photo Watermark Behavior Definition"
LOCTYPE="URN" xlink:href="uva-bdef-image-w:101"/>
<METS:mechanism LABEL="Watermarking Behavior Mechanism for Images"
LOCTYPE="URN" xlink:href="uva-bmech-image-w:112"/>
</METS:behaviorSec>
Comitato Metadati Amministrativi
Gestionali (MAG)
Nell’ambito delle attività del Comitato Guida della Biblioteca Digitale Italiana, è
nata l’esigenza di avere un gruppo di riferimento di esperti per la definizione e
implementazione di schemi di metadati nei progetti di digitalizzazione avviati
nell’ambito delle biblioteche ed altre istituzioni culturali a livello nazionale.
Sulla base del lavoro svolto in questi anni dal Gruppo di studio sugli standard e le
applicazioni di metadati nei beni culturali e delle esperienze acquisite
nell’ambito dei programmi di digitalizzazione avviati dalla Direzione Generale
per i Beni Librarisi è ritenuto che tale Gruppo fosse il riferimento qualificato per
espletare l’attività di promozione e sviluppo di modelli e standard di metadati.
L’ICCU, quale responsabile della diffusione delle normative e degli standard
bibliografici, ha pertanto formalmente costituito nel mese di luglio 2003 un
Gruppo di lavoro permamente, il Comitato MAG, quale struttura di riferimento
per le attività connesse alla promozione, supporto, gestione ed evoluzione
dello standard di Metadati Amministrativi Gestionali, nonché all’assistenza e
consulenza alla comunità bibliotecaria, archivistica e museale per la gestione e
l’accesso alle informazioni sull’oggetto digitale. Tale Comitato pertanto
prosegue le attività del precedente Gruppo di studio sugli standard e le
applicazioni di metadati nei beni culturali, riprendendone i principali obiettivi
ma dando la priorità ad attività connesse alla diffusione ed evoluzione del set
di Metadati Amministrativi Gestionali
Membri del Comitato MAG












Matilde Amaturo, Marco Lattanzi (Istituto Centrale per il Catalogo e la
Documentazione)
Francesco Baldi (Discoteca di Stato)
Giovanni Bergamin, Maria Grazia Pepe (Biblioteca Nazionale Centrale
di Firenze)
Gianfranco Crupi (Università degli Studi La Sapienza di Roma)
Gloria Cirocchi, Simona Gatta (Biblioteca della Camera dei Deputati)
Claudio Leombroni (Rete Bibliotecaria di Romagna - Provincia di
Ravenna)
Cristina Magliano, Patrizia Martini (ICCU)
Maurizio Messina (Biblioteca Marciana di Venezia)
Antonella Mulè (Direzione Generale per gli archivi)
Antonio Scolari (Centro Servizio Bibliotecario della Facoltà di
Ingegneria - Università degli Studi di Genova)
Marco Veneziani (CNR Roma)
Paul Gabriele Weston (Università degli Studi di Pavia)
Obiettivi del Comitato MAG








Diffusione dello schema MAG
Completamento dello schema per le fasi AIP (Archival
information package) e DIP (Dissemination information package)
dello schema MAG
Mantenimento ed evoluzione dello schema
Produzione di manuali e linee guida
Assistenza agli implementatori
Formazione e promozione
Rapporti con altri progetti e agenzie (Progetti europei, Dublin
Core, etc.)
Sviluppo di schemi e profili di applicazione di metadati descrittivi
nei diversi settori della cultura
Attività avviate del Comitato
MAG



Elaborazione del Manuale per l’utilizzo dello
Schema MAG
Produzione di documentazione di supporto
sia a carattere generale che specifico per le
diverse tipologie di materiale sottoforma di
Raccomandazioni e Linee guida
Produzione di un registro di link a schemi,
modelli e reference tecnici di riferimento.
Schema MAG

Lo schema (vers. 2.0 – 10/02/2005) è stato
elaborato sulla base delle indicazioni
("Appunti per la definizione di un set di
metadati gestionali-amministrativi e strutturali
per le risorse digitali" del 30/01/2001 e vers.
1.0 - 03/05/2002) del Gruppo di studio sugli
standard e le applicazioni di metadati nei beni
culturali
Descrizione dello schema
Lo schema generale è composto dalle sezioni:
 <gen> informazioni generali sul progetto e sul tipo di
digitalizzazione
 <bib> metadati descrittivi sull'oggetto analogico
 <stru> metadati strutturali
 <img> metadati specifici relativi alle immagini fisse
 <ocr> metadati specifici relativi al riconoscimento ottico del testo
 <doc> sezione utilizzata per descrivere ad esempio un file in
formato pdf o rtf
 <audio> metadati specifici per file audio
 <video> metadati specifici per file video
 <dis> metadati specifici per la distribuzione di oggetti bibliografici
Metadati per la BDI
Metadati descrittivi
Si fa l'ipotesi che gli oggetti digitalizzati abbiano metadati descrittivi già presenti
in un archivio bibliografico standard. La presenza di tali metadati nello
schema è garanzia del corretto collegamento con tale archivio. La sintassi
definita fa riferimento alle specifiche del set di elementi Dublin Core.
Metadati strutturali
Il rapporto tra l'insieme dei file trasmessi ed il record bibliografico è descritto
dai tag <piece>, <completeness> e <sequence_number> associato ad ogni
immagine.
I casi presi in considerazione sono:



unità bibliografica e unità fisica coincidono (es monografia in un volume).
pezzo fisico di un set (es. fascicolo di un periodico)
parte componente che non coincide con una unità fisica (es. capitolo di un libro)
La sezione <stru> completa i metadati strutturali con un indice delle sezioni
dell'oggetto digitalizzato. A tali metadati è possibile associare informazioni di
rappresentazione.
Metadati amministrativi
Per la definizione dei metadati relativi alle immagini fisse è stato preso in
considerazione lo standard NISO.
Siti di riferimento
METS: http://www.loc.gov/standards/mets
OAIS: http://www.rlg.org/longterm/oais.html
MAG: http://www.bncf.firenze.sbn.it/progetti/mag/
Dublin Core: http://dublincore.org/