Μεταδεδομένα

Download Report

Transcript Μεταδεδομένα

Μεταδεδομένα στο ψηφιακό
περιβάλλον
Εισαγωγή
Κατερίνα Τοράκη – Χρήστος Παπαθεοδώρου
Ιόνιο Πανεπιστήμιο
Τμήμα Αρχειονομίας – Βιβλιοθηκονομίας
1
Πρόγραμμα μαθήματος
Μάθημα
Διδάσκων
Ημ/νία
Εισαγωγή, Ηλεκτρονικά Τεκμήρια,
Βιβλιογραφικά Μεταδεδομένα
Χ
10/3
XML, DTDs
Χ
17/3
Dublin Core
Κ
24/3
EAD
Χ
31/3
METS, MODS
Κ
7/4
TEI
Κ
14/4
Κυβερνητικά Μεταδεδομένα
Χ
5/5
Θεματικά Μεταδεδομένα
Χ
12/5
Πολιτιστικά μεταδεδομένα
Κ
19/5
Γεωγραφικά μεταδεδομένα, άλλα,
ανακεφαλαίωση
Κ
26/5
Διαλειτουργικότητα Μεταδεδομένων
Χ
2/6
Εργασίες
Κ, X
16/6
Εργασίες
Κ, X
23/6
2
Θέματα εργασίας
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Αρχεία δημόσιων κτιρίων (γεωγραφικό σύστημα πληροφοριών)
Αρχείο επιχείρησης/οργανισμού
Αρχείο προσωπικότητας
Ειδικές συλλογές (π.χ. αφίσες, γραμματόσημα, καρτ-ποστάλ,
φωτογραφίες, επιστολές κ.ά.)
Ηλεκτρονικά τεκμήρια (βιβλία – περιοδικά)
Ιστορικό αρχείο
Ιστοσελίδες
Λογοτεχνικά και άλλα κείμενα
Μουσειακή συλλογή
Πολεοδομικοί χάρτες
Σεισμολογικά δεδομένα
Στοιχεία αρχαιολογικών ανασκαφών
Συλλογή ταινιοθήκης
Τουριστικοί οδηγοί
Χάρτες (τουριστικοί, γεωγραφικοί)
……………………….
3
Θέματα εργασίας
•
•
•
•
•
Επιλέξτε το κατάλληλο πρότυπο μεταδεδομένων για
την περιγραφή και διαχείριση της συλλογής σας.
Αιτιολογήστε την επιλογή σας και αξιολογήστε την
περίπτωση επιλογής και εναλλακτικού(ών)
προτύπου(ων)
Δημιουργήστε περιγραφές σύμφωνα με το πρότυπο
που επιλέξατε
Συντάξτε τα αντίστοιχα XML αρχεία,
χρησιμοποιώντας ανάλογο λογισμικό
Παρουσιάστε την εφαρμογή
4
Ψηφιακά τεκμήρια
• Οτιδήποτε υπάρχει σε ψηφιακή μορφή
και προσπελαύνεται με τη βοήθεια
υπολογιστή
– κείμενα
– εικόνες, κινούμενες εικόνες
– ήχος, βίντεο
– ιστοσελίδες, προγράμματα
5
Τύποι δεδομένων Ηλεκτρονικών
τεκμηρίων (1)
Κείμενο
•
•
•
•
.DOC
.TXT
.RTF
.PDF
Κινούμενες εικόνες
•
•
•
•
.ANI
.FLI
.FLC
.GIF
Εικόνες
•
•
•
•
•
.BMP
.GIF
.JPEG
.TIFF
.EPS
Ηχος
•
•
•
•
.WAV
.MID
.SND
.AUD
6
Τύποι δεδομένων Ηλεκτρονικών
τεκμηρίων (2)
Βίντεο
• .AVI
• .MOV
• .MPG
• .QT
Προγράμματα
• .COM
• .EXE
Ιστοσελίδες
• .HTM
• .HTML
• .XML
7
Πώς εντοπίζουμε και
ανακτούμε τα ψηφιακά
τεκμήρια;
8
Μεταδεδομένα
• Τα μεταδεδομένα είναι δομημένη πληροφορία που
περιγράφει, εξηγεί, εντοπίζει ή διευκολύνει την
ανάκτηση, τη χρήση ή την διαχείριση ενός ψηφιακού
τεκμηρίου
• Συχνά καλούνται («δομημένα») «δεδομένα για άλλα
δεδομένα» ή «πληροφορία για άλλη πληροφορία»
• "Metadata is machine understandable information
about web resources or other things." (Tim BernersLee)
• Περιγραφή της δομής και του περιεχομένου
που αναφέρεται σε ένα ηλεκτρονικό
τεκμήριο/ψηφιακό αντικείμενο ή σε συλλογή
τεκμηρίων/αντικειμένων
9
Μεταδεδομένα
Στόχος είναι η διερεύνηση των τρόπων με τους
οποίους επιτυγχάνεται
• Αναζήτηση (find)
• Ανακάλυψη (discovery)
• Πλοήγηση (navigation)
• Συνεύρεση (collocation)
• Αναγνώριση (identify, DOI, URI)
• Επιλογή (select)
• Απόκτηση (obtain access)
• Οργάνωση (portals)
ψηφιακών πόρων που βρίσκονται στο διαδίκτυο
10
Που Βρίσκονται τα
Μεταδεδομένα
•
•
•
•
Στην ετικέτα ενός CD (ορατά)
Στη σελίδα τίλου ενός τεκμηρίου (ορατά)
Στην κορυφή μιας ιστοσελίδας (ορατά)
Σε διαφορετική εγγραφή, π.χ. στον κατάλογο
μιας βιβλιοθήκης (ορατά)
• Στην ηλεκτρονική μορφή μέσα στον πόρο
(ορατά)
• Ενσωματωμένα στο ηλεκτρονικό δημοσίευμα
(μέρος της κωδικοποίησης, μη ορατά)
11
Παράδειγμα: Ιστοσελίδα σε
HTML
<HTML>
<BODY>
<p> Fiction:</p>
<UL><LI>Author: Milan Kundera</LI>
<LI>Title: Identity</LI>
<LI>Published: 1998</LI>
</UL>
<p> Science: </p>
<UL><LI>Author: Richard Feynman</LI>
<LI>Title: The Character of Physical Law</LI>
<LI>Hardcover</LI>
</UL>
</BODY>
</HTML>
12
13
<HTML><HEAD><TITLE>Seated woman</TITLE>
<META NAME="description" CONTENT="Seated woman by Bock, Thomas, 1793-1855.">
<META NAME="keywords" CONTENT="Women -- Portraits. Men -- Portraits.">
<META NAME="DC.Creator" SCHEME="LCNA" CONTENT="Bock, Thomas, 1793-1855.">
<META NAME="DC.Title" CONTENT="Seated woman">
<META NAME="DC.Subject" SCHEME="LCSH" CONTENT="Women -- Portraits.">
<META NAME="DC.Subject" SCHEME="LCSH" CONTENT="Men -- Portraits.">
<META NAME="DC.Description" CONTENT="Image of item held in Allport Library and Museum of Fine Arts, State Library
of Tasmania. 1 drawing : pencil, pen and ink on paper ; 13 x 12 cm. (irregular).">
<META NAME="DC.Publisher" CONTENT="State Library of Tasmania">
<META NAME="DC.Type" CONTENT="text/image">
<META NAME="DC.Format" CONTENT="text/html">
<META NAME="DC.Format" CONTENT="image/jpeg">
<META NAME="DC.Date" SCHEME="ISO8601" CONTENT="2000-03-08">
<META NAME="DC.Identifier" SCHEME="URL" CONTENT="http://www.tased.edu.au/tasimg/allport/12406045.htm">
<META NAME="DC.Language" SCHEME="RFC 1766" CONTENT="en">
<META NAME="DC.Relation" CONTENT="IsFormatOf Item held in Allport Library and Museum of Fine Arts, State Library of
Tasmania">
<META NAME="DC.Coverage" CONTENT="Tasmania">
<META NAME="DC.Rights" CONTENT="http://www.tased.edu.au/tasimg/copyrt.htm">
<META NAME="DC.identifier.URL.thumbnail" CONTENT="http://www.tased.edu.au/tasimg/allport/tn150/12406045.jpg">
14
Πώς θα κάνουμε «ορατά» τα
μεταδεδομένα από τους
υπολογιστές (μηχαναγνώσιμη
πληροφορία);
15
XML: κωδικοποίηση
μεταδεδομένων
• Η HTML ελέγχει τον τρόπο εμφάνισης των
ηλεκτρονικών τεκμηρίων, δεν ασχολείται με
τη φύση τους, την περιγραφή τους, τη
σημασία τους
• eXtensible Markup Language (XML) αποτελεί
μια εξαιρετικά απλή διάλεκτο της γλώσσας
Standard Generalized Markup Language
(SGML), η οποία αναπτύχθηκε με στόχο να
διευκολύνει το χειρισμό, επεξεργασία,
διακίνηση και αποθήκευση τεκμηρίων στον
Παγκόσμιο Ιστό (web)
16
Αναγκαιότητα Προτύπων
Μεταδεδομένων
• Χρειάζονται για να έχουμε κοινή αντίληψη
των δεδομένων που περιγράφονται με αυτά
• Μας προσφέρουν μεγαλύτερη δομή
– Μας περιορίζουν στην ευελιξία
– Επεξεργάζονται ευκολότερα μηχανικά
• Είναι αναγκαιότερα σε ψηφιακά αντικείμενα
– Αφού στα συμβατικά έχουμε αισθητήρια αντίληψη
για αναγνώριση, θέση, θέματος, …
17
Πόσα Πρότυπα
Μεταδεδομένων
• Δεν υπάρχει ένα μοναδικό διεθνές πρότυπο
για μεταδεδομένα, γιατί:
– Χρειαζόμαστε διαφορετικά επίπεδα
πολυπλοκότητας, από πλούσιες μέχρι απλές
περιγραφές
– Υπάρχουν κάμποσα σχήματα μεταδεδομένων,
για διαφορετικά επίπεδα και απαιτήσεις
– Επεκτείνουμε τα υπάρχοντα πρότυπα
18
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Πρότυπα Μεταδεδομένων
AACR2
MARC
Text Encoding Initiative - TEI Header (1990)
Dublin Core - DC (1995)
Encoded Archival Description – EAD (1996)
Open Archives Initiative - OAI
Visual Resources Association Core– VRA (1997)
Federal Geographic Data Committee for Digital Geospatial Metadata –
FGDC
Data Documentation Initiative – DDI (1997)
Gateway to Educational Materials – GEM (1999)
Government (Global) Information Locator Service - GILS
Metadata Encoding and Transmission Standard – METS
Metadata Object Description Schema – MODS
Computer Interchange of Museum Information – CIMI
Interoperability of Data in E-Commerce Systems – INDECS
Online Information Exchange – ONIX (2000)
19
Extended Markup Language – XML, MARCXML
Australian Recordkeeping Metadata Schema (RKMS)
Κόστος και Λειτουργικότητα
Αναζήτησης και
Μεταδεδομένων
AACR2/MARC
Dublin Core Qualified
Dublin Core Simple
Απλές μηχανές αναζήτησης
Μέτα-μηχανές αναζήτησης
Google (με τεχνικές συνδέσμων)
Κόστος δημιουργίας και χρήσης
20
Τα Μεταδεδομένα είναι
Γλώσσα
• Τα σχήματα μεταδεδομένων είναι γλώσσες για
να γίνονται δηλώσεις για τους πόρους:
– «Το βιβλίο» έχει Title "Gone with the Wind"
– «Η ιστοσελίδα» έχει Publisher "Springer Verlag"
• Οι όροι των λεξιλογίων (στοιχεία) ορίζονται με
πρότυπα – όπως το Dublin Core
• Οι γραμματικές των μεταδεδομένων
περιορίζουν τις δηλώσεις και τα μοντέλα
δεδομένων που μπορεί να χρησιμοποιηθούν –
κάνοντας όμως τη σημασία τους πιο έκδηλη
και σαφή
21
Τα Μεταδεδομένα ως Γλώσσα
• Διαφορετικές κοινωνίες (περιγραφής πόρων)
μιλούν διαφορετικές γλώσσες
– Π.χ. Τι γλώσσες περιγράφουν Ιατρική σε Ελλάδα
και Αγγλία; Η Ιατρική ορολογία είναι κοινή.
– Και οι φυσικοί ομιλητές των διαφορετικών
γλωσσών πρέπει να επικοινωνήσουν …
– Και οι τουρίστες (και οι ομιλητές των
διαφορετικών γλωσσών) μαθαίνουν να «μιλούν
πρωτόγονα» για να επικοινωνήσουν
22
Κανόνες Γραμματικής DC
υπονοούμενο
μία από 15
ρήμα
ιδιότητες
DC:Creator
υπονοούμενο
DC:Title
υποκείμενο
DC:Subject
Τιμή ιδιότητας
(κατάλληλη
περιγραφή)
DC:Date...
Ο πόρος έχει ιδιότητα
X
εξειδικευτές
(επίθετα)
Παραδείγματα Γραμματικής
DC
Ο πόρος έχει Subject
"Languages -- Grammar"
Ο πόρος έχει Date
"2000-06-13"
Οι Γλώσσες Μεταδεδομένων
είναι Πολυγλωσσικές
• Τα μεταδεδομένα δεν είναι ομιλούμενη
γλώσσα
• Τα ουσιαστικά των μεταδεδομένων – τα
«στοιχεία» - είναι σύμβολα που
αντιπροσωπεύουν έννοιες εκφράσιμες σε
πολλαπλές φυσικές γλώσσες
• Τα πρότυπα μπορεί να έχουν δεκάδες
μεταφράσεις
• Οι έννοιες όπως "title", "author" ή "subject",
χρησιμοποιούνται με τον ίδιο τρόπο στα
Ελληνικά, τα Αγγλικά και τα Ιαπωνικά;
25
Οι Γλώσσες Εξελίσσονται με
τη Χρήση
• Αναπόφευκτα, οι γλώσσες αντιστέκονται στην
σταθερότητα
• Οι άνθρωποι «επεκτείνουν» τους αυθεντικούς
ορισμούς
• Οι υλοποιητές παρεξηγούν την επιδιωκόμενη
σημασία ή χρήση των στοιχείων
• Οι υλοποιητές χρησιμοποιούν τοπικούς όρους και
εκφράσεις
• Αν η εφαρμογή δεν ταιριάζει με το πρότυπο, το
πρότυπο συχνά «προσαρμόζεται» να ταιριάζει
στην εφαρμογή
26
Σύνταξη Μεταδεδομένων
Κάθε γλώσσα έχει ένα (ή περισσότερους)
τρόπους γραφής της γλώσσας, για
ανταλλαγή (ή αποθήκευση) πληροφοριών
• ISO2709, για MARC
• HTML – “meta”
• RDF, βασιζόμενο σε XML, για DC, MODS
• … Z39.50
• …
27
Διαλειτουργικότητα με
Μεταδεδομένα
Κύριες προσεγγίσεις διαλειτουργικότητας
• Αναζήτηση σε διαφορετικά συστήματα
– Δεν έχουν τα ίδια μεταδεδομένα, αλλά
αντιστοιχούν τις δυνατότητες αναζήτησης σε ένα
κοινό σύνολο
– Π.χ. Z39.50
• Συγκομιδή μεταδεδομένων
– Μεταφράζουν τα δικά τους μεταδεδομένα σε ένα
κοινό βασικό σύνολο στοιχείων, που διαθέτουν για
συγκομιδή
– Π.χ. OAI
28
Προκλήσεις και Τάσεις στα
Μεταδεδομένα
• «Απλού και ευρύ» και «πλούσιου αλλά
συγκεκριμένου» (απλότητα 
λειτουργικότητα)
• «Γενικού» και «προσαρμοσμένου»
(διαλειτουργικότητα  επεκτασιμότητα )
• «Αναγνώσιμου από ανθρώπους» και
«επεξεργάσιμου από μηχανές» (σε δημιουργία
και χρήση)
• «Κατανομή» και «Συγκέντρωση» σε ένα
μέρος
• Αυτόματη παραγωγή ή με ανθρώπινη
παρέμβαση
29
Παρανοήσεις για
Μεταδεδομένα
• Η πιο λεπτομερής περιγραφή μεταδεδομένων
είναι πάντα καλύτερη;
• Συνήθως ισχύει για συμβατικά τεκμήρια
– Που δεν διαθέτουμε άλλη πληροφορία για αυτά
• Αλλά θα γίνουν και περισσότερα λάθη στην
περιγραφή – θέλει ειδική εκπαίδευση και
μεγάλο κόστος επένδυσης
• Δυσκολεύει τη διαλειτουργικότητα
30
Κατηγορίες Μεταδεδομένων
• Διαχειριστικά (administrative)
Με πληροφορίες για τη διαχείριση και διατήρηση της
εγγραφής, όπως δημιουργία, μετατροπή και σχέσεις με
άλλες εγγραφές, π.χ. κάτοχος, ημερομηνίες δημιουργίας
ή/και μεταβολής, γλώσσα εγγραφής, διαχείρισης
δικαιωμάτων κλπ.
Δομικά (structural)
Με πληροφορίες για την αποθήκευση και παρουσίαση
Περιγραφικά (descriptive)
Με πληροφορίες που περιγράφουν ιδιότητες και
περιεχόμενο του αντικειμένου στο οποίο αναφέρεται η
εγγραφή και συμβάλλουν στην ανάκτηση (ανακάλυψη),
π.χ. τίτλος, συγγραφέας, θεματικοί όροι, περίληψη
31
Φακοί και Όψεις
• Όλες οι κατηγοριοποιήσεις παρέχουν και
πρέπει να παρέχουν μια μεροληπτική όψη
της πραγματικότητας
• Κάθε όψη τονίζει συγκεκριμένα
χαρακτηριστικά και κρύβει άλλα
32
Κατηγορίες Μεταδεδομένων
(2)
Σύμφωνα με το Getty Institute:
•
•
•
•
•
Administrative
Descriptive
Preservation
Technical
Use
33
Getty Institute
34
Getty Institute …
35
Getty Institute …
36
Getty Institute …
37
Getty Institute …
38
Στοιχεία δεδομένων
Στοιχείο δεδομένων (data element)
είναι μία ενότητα δεδομένων για την οποία ο ορισμός (definition), η
αναγνώριση (identification), η αναπαράσταση (representation)
και οι επιτρεπτές τιμές (values) καθορίζονται μέσω ενός συνόλου
ιδιοτήτων (attributes).
Τα στοιχεία δεδομένων εφαρμόζονται στα πληροφοριακά μοντέλα
επιχειρήσεων, στα μοντέλα δεδομένων, στα διαγράμματα ροής
δεδομένων, στο σχεδιασμό βάσεων δεδομένων, στις προδιαγραφές
διεπαφών και στα προγράμματα υπολογιστών.
Για παράδειγμα, σε ένα μοντέλο δεδομένων, στην οντότητα υπάλληλος,
με τις ιδιότητες όνομα, κωδικός, διεύθυνση που πρέπει να
προσδιοριστούν, τα στοιχεία δεδομένων είναι: όνομα υπαλλήλου,
κωδικός υπαλλήλου, διεύθυνση υπαλλήλου.
Αντίστοιχα, στις σχεσιακές βάσεις δεδομένων, στοιχεία δεδομένων είναι
οι ετικέτες των πεδίων, όπως και στα πληροφοριακά συστήματα.
39
Στοιχεία δεδομένων
Το παρακάτω διεθνές πρότυπο περιγράφει τους ορισμούς, τις ιδιότητες και
τις χρήσεις των στοιχείων δεδομένων.
ISO/IEC 11179: Information technology – Specification and
standardization of data elements
Part 1: Framework for the specification of data elements
Part 2: Classification for data elements
Part 3: Basic attributes of data elements
Part 4: Rules and guidelines for the formulation of data definitions
Part 5: Naming and identification principles for data elements
Part 6: Registration of data elements
Τα στοιχεία δεδομένων που σχετίζονται με τα δεδομένα χρόνου,
καλύπτονται από το παρακάτω πρότυπο:
ISO/FDIS 8601: Data elements and interchange formats – Information
interchange – Representation of dates and times.
40
Βασικά στοιχεία δεδομένων –
IFLA (1)
Σύμφωνα με τις λειτουργικές προδιαγραφές για τις
βιβλιογραφικές εγγραφές (FRBR) της IFLA, οι
κύριες εργασίες που κάνουν οι χρήστες είναι:
• Εύρεση (Find) δεδομένων που αντιστοιχούν σε
συγκεκριμένα κριτήρια αναζήτησης (π.χ. θέμα)
• Αναγνώριση (Identify) μίας οντότητας (π.χ.
από μία άλλη με ίδιο τίτλο κλπ)
• Επιλογή (Select) οντότητας που ανταποκρίνεται
στις ανάγκες τους (π.χ. γλώσσα, έκδοση)
• Απόκτηση (Obtain Access) της οντότητας που
περιγράφεται (π.χ. παραγγελία, κράτηση για
δανεισμό, πρόσβαση)
41
Βασικά στοιχεία δεδομένων –
IFLA (2)
•
•
•
•
•
•
•
•
Subject
Date
Conditions of use
Publisher
Name assigned to the resource
Language/mode of expression
Resource identifier
Resource type (i.e., what the resource is, rather
than what it is about)
• Author/creator
• Version
42
Κατηγορίες Μεταδεδομένων
Σύμφωνα με την IFLA:
•
•
•
•
•
•
Administrative
Descriptive
Analytical (subject)
Rights management
Technical
Other, as determined
43
Στοιχεία δεδομένων – IFLA
(1)
Administrative
o
o
o
o
o
o
o
Record number
Date of record creation
Date of last modification
Identification of creator/reviser of record
Language of record
Notes
Relationship of this record to other(s)
44
Στοιχεία δεδομένων - IFLA
(2)
Descriptive
o Title (also alternative and parallel titles; subtitles;
short titles; etc.)
o Creator (author; composer; cartographer; artist; etc.)
o Date
o Publisher
o Unique identifiers (ISBN; ISSN; etc.)
o Dynamic links (URI; URL; etc.)
o Summary; descriptive note; review; etc.
o Audience level
o Physical media; format; etc.
o Language of the item or object
o Version
45
Στοιχεία δεδομένων - IFLA
(3)
Analytical
o Controlled subject terms, e.g., subject headings,
descriptors
o Subject/topic keywords
o Abstract; Table of Contents (TOC)
o Codes derived from classification systems or
categorization schemes
o Other elements of local importance, e.g., department
affiliation; links to other related e-content
46
Στοιχεία δεδομένων - IFLA
(4)
Rights Management
o
o
o
o
o
o
o
o
Restrictions on use
Permission statements
Subscriber/licensing/pay-per-use fees
Acknowledgements
Copyright notice
Retention schedules
Quality ratings
Use disclaimers
47
Στοιχεία δεδομένων - IFLA
(5)
Technical
o
o
o
o
o
Digitizing equipment specifications
Camera positions
Shooting conditions
Coding parameters
Voice recognition and/or read-back hardware and
software
o Optical scanner specifications
o Image rendering equipment
o Type of file and conversion software requirements
48
Στοιχεία δεδομένων – LC
(1)
Χαρακτηριστικά κάθε στοιχείου:
• Ονομασία
– (π.χ. access_category)
• Ορισμός
• Λειτουργία
– (access management, administration, discovery, persistent identifier,
presentation, digital preservation and preservation reformatting)
• Τύπος
– (Administrative, Structural, Descriptive)
• Χρήση
– (frequency, requirement)
• Επίπεδο
49
Στοιχεία δεδομένων - LC
(2)
50
Επίπεδα Μεταδεδομένων
Σύμφωνα με την Library of Congress, εφαρμόζονται τα
παρακάτω επίπεδα, με ιεραρχική σειρά:
• Set (ψηφιακή συλλογή αντικειμένων)
• Aggregate (κατηγορία ψηφιακών αντικειμένων, π.χ.
εικόνες)
• Primary Object (πρωτογενές αντικείμενο, ισοδύναμο του
φυσικού, π.χ. βιβλίο)
• Intermediate Object (άποψη ή συστατικό του
πρωτογενούς αντικειμένου, π.χ. παρουσίαση των σελίδων
του βιβλίου ως εικόνες ή ως κείμενο)
• Terminal Object (το αρχείο ή τα αρχεία με το ψηφιακό
περιεχόμενο του αντικειμένου)
Σημ. 1: Τα μεταδεδομένα κάθε επιπέδου εφαρμόζονται σε όλα τα συστατικά του
στο παρακάτω επίπεδο. Για το τελευταίο επίπεδο, αυτά είναι κυρίως δομικά
μεταδεδομένα (μέγεθος αρχείων κλπ).
51
Σημ. 2: Οι τιμές για τα μεταδεδομένα τα σχετικά με δικαιώματα πρόσβασης
μπορεί να είναι διαφορετικές στα επί μέρους επίπεδα.
Επιλογή μεταδεδομένων
Είναι σημαντικό να καθοριστούν
• το πεδίο εφαρμογής
• τα κριτήρια
• οι μορφές των ψηφιακών αντικειμένων και
συλλογών
• ο βαθμός λεπτομέρειας στην περιγραφή και
παρουσίαση
προκειμένου να αξιολογηθούν τα πρότυπα
μεταδεδομένων και επιλεγεί το κατάλληλο.
Ερώτηση: Ποια μπορεί να είναι τα βασικά στοιχεία που θα
περιγράφουν μια δεδομένη ψηφιακή συλλογή;
52
Απάντηση (παράδειγμα)
Υποχρεωτικά
• Τίτλος
• Συγγραφέας
• Θέμα
• Ηλεκτρονική διεύθυνση
Επιθυμητά
• Εκδότης
• Ημερομηνία
• Κατηγορία
• Σχόλια
Αλλα σχετικά με συλλογή
• Αναγνωριστικά
• Γλώσσα
• Έκδοση
• Πνευματικά δικαιώματα
• ………………………….
53
Προσαρμογή Μεταδεδομένων
• Τα μεταδεδομένα προσαρμόζονται σε
πολλαπλές παραλλαγές / ποικιλίες
– Αποτυπώνοντας την ανομοιομορφία των
δημιουργών και διατηρητών μεταδεδομένων
– Προσφέροντας για κάθε κοινότητα
(συγκεκριμένο χώρο) εξειδικευμένη
λειτουργικότητα, δημιουργία, διαχείριση,
πρόσβαση, …
• Τηρώντας τα αντίστοιχα πρότυπα …
• Μεγαλύτερη εξειδίκευση = μεγαλύτερη
λειτουργικότητα = λιγότερη
διαλειτουργικότητα!
54
Τι είναι το Προφίλ
Εφαρμογής
• Ένα σχήμα μεταδεδομένων που ενσωματώνει
ένα σύνολο στοιχείων από ένα ή
περισσότερα σύνολα στοιχείων
μεταδεδομένων (ή λεξιλογίων ή χώρους
ονομάτων – namespaces)
• Ένα σύνολο από πολιτικές που ορίζουν πώς
τα στοιχεία πρέπει να εφαρμόζονται στο πεδίο
της εφαρμογής
• Ένα σύνολο οδηγιών που ξεκαθαρίζουν τις
πολιτικές που αφορούν τα στοιχεία
55
Λεξιλόγια και Προφίλ
Εφαρμογών
• Το Λεξιλόγιο δηλώνει όρους και ορισμούς
– Λεξιλόγιο Dublin Core = Πρότυπο Dublin Core
• Το Προφίλ Εφαρμογής επαναχρησιμοποιεί όρους από ένα ή περισσότερα
λεξιλόγια
– Μπορεί να συνδυάζει όρους από πολλαπλά
λεξιλόγια
– Μπορεί να προσαρμόζει (εξειδικεύει) ορισμούς για
τοπικούς σκοπούς ή εξειδικευμένους τομείς
(domain-specific)
– Όλοι οι όροι πρέπει να ορίζονται στα λεξιλόγια
56
– Μπορεί να περιλαμβάνει τοπικά ορισμένα λεξιλόγια
Συμπεράσματα
• Χρήση προτύπων και καθιερωμένων κανόνων
• Όχι αυτοσχεδιασμοί στην περιγραφή των
δεδομένων
• Έστω και να φαινομενικά επαρκούν για την
εφαρμογή
• Δεν φτάνει να δουλεύει μια εφαρμογή
• Πρέπει να μπορεί να δια-λειτουργεί στο
μέλλον
57
Marc
Διάταξη δεδομένων (format) : σύνολο
κανόνων για τη δομή και το περιεχόμενο
των δεδομένων
58
•
•
•
•
•
•
Η Μέθοδος των MARC
10/1000 κατηγορίες/πεδία
Με υποπεδία
Με σαφή μονοσήμαντη σημασία
Με υποχρεωτικά και προαιρετικά πεδία,
Με πεδία (αδόμητων) σημειώσεων
Επεκτείνονται πεπερασμένα για νέα
πληροφορία
– Λειτουργούν σαν ένα σύνολο γραμματοκιβωτίων
• Επαρκές για αυτόνομες συλλογές
• Συστήνουν ανταλλαγή τους με ISO2709
59
Μειονεκτήματα του MARC
• Τα μεταδεδομένα συνδέονται με μόνο ένα
αντικείμενο ανά εγγραφή
• Δύσκολοι χαρακτηρισμοί συχνά
καταγράφονται σε λάθος θέση
• Μη σχεσιακό, δόμηση με περιορισμούς
• Επεκτείνεται, αλλά τοπικά, περιορισμένα και
αδόμητα
• Χρειάζεται αλλαγές στα δεδομένα για να
παρακολουθεί την εξέλιξη
– Π.χ. CDROM  μεγάλο ή μικρό!
• Κοστίζει $50 / πλήρη εγγραφή
60
Πεδίο 856
(1)
4#$uhttp://www.ionio.gr$zΙόνιο Πανεπιστήμιο
Electronic Location and Access
http://lcweb.loc.gov/marc/bibliographic/ecbdhold.html#mrcb856
Επαναλαμβανόμενο πεδίο, εάν βρίσκεται σε παραπάνω από
μία θέση ή χρησιμοποιείται παραπάνω από μία μέθοδος
πρόσβασης, για τους παρακάτω λόγους:
– Διαφορετικοί τρόποι πρόσβασης (π.χ. με HTTP, FTP, TELNET)
– Διαφορετικά μέρη ενός τεκμηρίου είναι ηλεκτρονικά, οπότε
χρησιμοποιείται το υποπεδίο $3 για να δηλωθεί το μέρος
– Πολλές θέσεις στο διαδίκτυο (mirror sites) για λόγους ασφάλειας
και διευκόλυνσης της πρόσβασης διεθνώς
– Εμφάνιση σε διαφορετικές μορφές (π.χ. κείμενα σε html, pdf κλπ,
εικόνες με διαφορετική ανάλυση)
– Υπαρξη σχετικών τεκμηρίων που χρειάζεται να οριστούν
61
Πεδίο 856
(2)
1ος Δείκτης: Μέθοδος πρόσβασης
#
0
1
2
3
4
5
Δεν παρέχονται πληροφορίες
Ηλεκτρονικό ταχυδρομείο
ftp (πρωτόκολλο μεταφοράς αρχείων)
remote login (telnet) απομακρυσμένη
πρόσβαση
dial-up επιλεγόμενο τηλεφωνικό δίκτυο
http Διαδίκτυο
Η μέθοδος δηλώνεται στο υποπεδίο $2
62
Πεδίο 856
(3)
2ος Δείκτης: Σχέση
(ανάμεσα στην ηλεκτρονική πηγή που περιγράφεται στο
πεδίο 856 και στις πληροφορίες της βιβλιογραφικής
εγγραφής)
#
1
Δεν παρέχονται πληροφορίες
Πηγή (όταν αναφέρεται σε όλο το τεκμήριο που
περιγράφεται στην εγγραφή, διαφορετικά για μέρος
αυτού χρησιμοποιείται το υποπεδίο $3)
2
Εκδοση της πηγής (στο 856 τίθεται η διεύθυνση της
ηλεκτρονικής έκδοσης του τεκμηρίου που
περιγράφεται
στην εγγραφή)
3
Σχετική πηγή (η θέση που δίνεται στο 856 αφορά
ηλεκτρονική πηγή που σχετίζεται με το
περιγραφόμενο στην εγγραφή τεκμήριο.)
63
4
Δεν δημιουργείται σταθερή εμφάνιση
Πεδίο 856
(4)
$a – Ονομασία διαθέτη – π.χ. όταν ο 1ος δείκτης είναι 0, 1
ή2
(Ε)
$b – Αριθμός πρόσβασης στο διαθέτη (π.χ. IP, αριθμός
τηλεφώνου)
(ΔΕ)
$c – Πληροφορίες συμπίεσης (Ε)
$d – Διαδρομή– π.χ. όταν ο 1ος δείκτης είναι 1 (ftp)
(Ε)
$f – Ηλεκτρονική ονομασία - π.χ. όταν ο 1ος δείκτης είναι
0ή1
(Ε)
$g - Uniform Resource Name (π.χ. DOI) (Ε)
$h – Επεξεργαστής αιτήματος (κωδικός χρήστη πριν από
το σύμβολο @)
(ΔΕ)
$i – Οδηγίες (στον απομακρυσμένο διαθέτη να
επεξεργαστεί
ένα αίτημα) (Ε)
64
$j - Bits per second (ΔΕ)
Πεδίο 856
(5)
$k – Κλειδάριθμός (Password) (ΔΕ)
$l - Logon (login)
(ΔΕ)
$m – Επαφή για βοήθεια στην πρόσβαση
(Ε)
$n – Ονομασία της θέσης του διαθέτη (γεωγραφική κλπ)
(ΔΕ)
$o – Λειτουργικό σύστημα (ΔΕ)
$p - Πόρτα (ΔΕ)
$q – Ηλεκτρονικός τύπος διάταξης δεδομένων (text/HTML,
ASCII, Postscript file, εκτελέσιμο αρχείο, JPEG) (ΔΕ)
$r – Ρυθμίσεις (ΔΕ)
$s – Μέγεθος αρχείου (Ε)
$t - Terminal emulation (Ε)
$u - Uniform Resource Locator (URL) (ΔΕ)
65
Πεδίο 856
(6)
$v – Ωρες που είναι διαθέσιμος ο τρόπος πρόσβασης (Ε)
$w – Αριθμός ελέγχου εγγραφής (Ε)
$x – Μη δημόσια σημείωση (Ε)
$z – Δημόσια σημείωση (Ε)
$2 – Μέθοδος πρόσβασης (όταν ο πρώτος δείκτης είναι 7)
(ΔΕ)
$3 – Υλικά που προσδιορίζονται (πληροφορίες που
προσδιορίζουν το μέρος του βιβλιογραφικού τεμαχίου
στο οποίο εφαρμόζεται το πεδίο ) (ΔΕ)
$6 – Σύνδεση (βλέπε υποπεδία ελέγχου) (ΔΕ)
$8 – Αριθμός σύνδεσης και σειράς του πεδίου (Ε)
66
Πεδίο 856
(7)
Τα πιο συχνά χρησιμοποιούμενα στοιχεία είναι :
1ος δείκτης = 4 για HTTP (μπορεί να μείνει κενός)
υποπεδίο $u = [HTTP URL]
υποπεδίο $3 = δηλώνεται σε ποιο URL αναφέρεται (π.χ.
συγκεκριμένο κεφάλαιο, περίληψη,
πίνακας περιεχομένων κλπ)
υποπεδίο $z = σημειώσεις
Ζήτημα: Ξεχωριστά αντίτυπα και ηλεκτρονικές συνδέσεις
(;)
67
Πεδίο 856
(8)
Παραδείγματα
0#$umailto:[email protected] $iejap subscription
1#$u ftp://path.net/pub/docs/urn2urc.ps
2#$utelnet://pucc.princeton.edu $nPrinceton University,
Princeton, N.J.
3#$alocis.loc.gov $b140.147.254.3 [email protected]
$t3270 $tline mode (e.g., vt100) $vM-F 06:00-21:30
USA EST, Sat. 08:30-17:00 USA EST, Sun. 13:00-17:00
USA
40$uhttp://jefferson.village.virginia.edu/pmc/contents.ht
ml
4#$uhttp://hdl.handle.net/loc.test/gotthome$gurn:hdl.loc
.test/
68
gotthome
Στοιχεία δεδομένων και
Unimarc (1)
Τίτλος
Παράλληλος τίτλος
Συγγραφείς
Διεύθυνση συγγραφέα
Δήλωση έκδοσης
Δημοσίευση, διάθεση
Φυσική περιγραφή
Συνοδευτικό υλικό
Σειρά
200
510
200$f $g,
και/ή 700, 701,
710, 711
700$p, 701$p,
710$p, 711$p
205
210
215
215, 307
225, 410
69
Κατάλογος υπερσυνδέσμων
•
•
•
•
•
•
•
Gill, Tony. "Metadata and the World Wide Web." In Introduction to Metadata: Pathways to
Digital Information. Version 2.0. Edited by Murtha Baca. (J. Paul Getty Trust, 1998).
http://www.getty.edu/research/institute/standards/intrometadata/2_articles/gill/index.html
Gilliland-Swetland, Anne J. "Setting the Stage." In Introduction to Metadata: Pathways to
Digital Information. Version 2.0. Edited by Murtha Baca. (J. Paul Getty Trust, 1998)..
http://www.getty.edu/research/institute/standards/intrometadata/2_articles/index.html
Metadata Demystified: A guide for publishers. NISO Press, July 2003.
http://www.niso.org/standards/resources/Metadata_Demystified.pdf
Arms, Caroline R. “Some Observations on Metadata and Digital Libraries”. In: Conference
on
Bibliographic
Control
for
the
New
Millennium,
September
2000.
http://lcweb.loc.gov/catdir/bibcontrol/arms_paper.html
Caplan, Priscilla. “International Metadata Initiatives: Lessons in Bibliographic Control. In:
Conference on Bibliographic Control for the New Millennium, September 2000.
http://lcweb.loc.gov/catdir/bibcontrol/caplan_paper.html
2003 Dublin Core Conference: Supporting Communities of Discourse and Practice-Metadata
Research and Application, 28 Sept. – 2 Oct. 2003, Washington USA.
http://www.ischool.washington.edu/dc2003/index.html
Guidance on the Structure, Content, and Application of Metadata Records for Digital
Resources and Collections. Report of the IFLA Cataloguing Section Working Group on the
Use of Metadata Schemas. Draft – for Worldwide Review 27 October, 2003.
http://www.ifla.org/VII/s13/guide/metaguide03.pdf
70
Κατάλογος υπερσυνδέσμων
•
•
•
•
•
•
•
•
•
•
•
Dublin Core Metadata Initiative (DCMI). http://dublincore.org/
The Dublin Core Metadata Element Set. ANSI/NISO Z39.85-2001.
http://www.niso.org/standards/resources/Z39-85.pdf
Metadata
Encoding
and
Transmission
Standard
http://www.loc.gov/standards/mets/
Metadata
Object
Description
Schema"
(MODS)
http://www.loc.gov/standards/mods/
MARC Standards Website. http://lcweb.loc.gov/marc/
OCLC, Bibliographic formats and standards. http://www.oclc.org/bibformats/
UKOLN's metadata site http://www.ukoln.ac.uk/metadata/
IFLA http://ifla.inist.fr/II/metadata.htm
IFLA Functional Requirements for Bibliographic Records.
www.ifla.org/VII/s13/frbr/frbr.pdf
Consortium for the Computer Interchange of Museum Information (CIMI)
http://www.cimi.org
"The Value of Metadata".
http://www.fgdc.gov/publications/documents/metadata/metabroc.html
71
Κατάλογος υπερσυνδέσμων
•
•
•
•
•
•
Bishoff, Liz, and William A. Garrison. "Metadata, Cataloging, Digitization and Retrieval:
Who's Doing What to Whom: The Colorado Digitization Project Experience." Discussion
paper presented at the Library of Congress Bicentennial Conference on Bibliographic
Control for the New Millen74nium, November 15-17, 2000.
Online:
http://lcweb.loc.gov/catdir/bibcontrol/bishoff_paper.html
"Dublin Core/MARC/GILS Crosswalk." http://www.loc.gov/marc/dccross.html
Gilliland-Swetland, Anne J. "Setting the Stage." In Introduction to Metadata: Pathways to
Digital Information. Version 2.0. Edited by Murtha Baca. (J. Paul Getty Trust, 1998)..
http://www.getty.edu/research/institute/standards/intrometadata/2_articles/index.html
Guenther, Rebecca, and Sally McCallum. "New Metadata Standards for Digital Resources:
MODS and METS." Bulletin of the American Society for Information Science and
Technology (Dec/Jan. 2003): 12-15.
Lee-Smeltzer, Kuang-Hwei. "Finding the Needle: Controlled Vocabularies, Resource
Discovery, and the Dublin Core." Library Collections, Acquisitions, & Technical Services 24
(2000) 205-215.
Stringer-Hye, Suellen. " Introduction to the Semantic Web, Organizing the Web for Better
Information Retrieval or Can Librarians really save the Web?" In Knowledge Technologies
2002 - Seattle, March 2000.
http://www.knowledgetechnologies.net/proceedings/presentations/stringerhye/suellenstringer-hye.htm
72