Transcript EAD-XML

FULBI
26 SEPTEMBRE 2002
De MARC à MARKUP
Pierre-Yves Duchemin
[email protected]
17/07/2015
toto
2
FULBI
26 SEPTEMBRE 2002
De MARC à MARKUP
ou
« There is a life beyond MARC… »
Pierre-Yves Duchemin
[email protected]
17/07/2015
toto
3
VERS UNE NOUVELLE VISION DU
CATALOGUE ET DU RÔLE DE LA
BIBLIOTHÈQUE
• L’évolution des accès publics en ligne et l’enrichissement des catalogues,
• Structuration électronique de documents,
• Métadonnées et Dublin Core,
• Formats de structuration électronique : SGML, HTML, XML,
• XSL, RDF,
• L’impact dans les bibliothèques,
• Qu’est-ce qu’une DTD ?
• DTD : ISO 12083, TEI, EBIND, MASTER, EAD,
• EAD en France,
• EAD et MARC,
• ONIX et MARC,
17/07/2015
toto
4
• Le schéma
XML.
LE CONTEXTE
• Constat : les normes bibliothéconomiques actuelles, les outils
informatiques disponibles centrés sur la gestion de l'information
secondaire ne sont pas adaptés à la gestion de la documentation
numérique.
17/07/2015
toto
5
LE CONTEXTE
• Constat : les normes bibliothéconomiques actuelles, les outils
informatiques disponibles centrés sur la gestion de l'information
secondaire ne sont pas adaptés à la gestion de la documentation
numérique.
• Le dispositif institutionnel et la culture professionnelle, s’ils permettent la
gestion de l’existant, n'anticipent pas sur l'avenir et ne permettent pas de le
préparer convenablement.
17/07/2015
toto
6
LE CONTEXTE
• Constat : les normes bibliothéconomiques actuelles, les outils
informatiques disponibles centrés sur la gestion de l'information
secondaire ne sont pas adaptés à la gestion de la documentation
numérique.
• Le dispositif institutionnel et la culture professionnelle, s’ils permettent la
gestion de l’existant, n'anticipent pas sur l'avenir et ne permettent pas de le
préparer convenablement.
• Cette situation pose la question de la construction des outils, celle des
contenus et celle de la méthode de construction de ces outils et de ces
contenus. Elle mêle étroitement choix techniques, choix des normes,
choix informatique, politique de formation et intervention déterminée
sur les enjeux de l'accès au savoir dans une société dite de l’information,
qui, en17/07/2015
réalité, met méthodiquement toto
en place verrous et péages.
7
LE CONTEXTE
• Les SIGB actuels, articulés autour des formats de la famille MARC,
de l’information secondaire (description bibliographique et indexation)
et de la gestion des exemplaires physiques ne sont pas adaptés à la
gestion des documents numériques : le champ 856 de MARC21 et
d’UNIMARC est une tentative de solution pour établir un lien entre le
SIGB et le système de GED .
17/07/2015
toto
8
LE CONTEXTE
• Les SIGB actuels, articulés autour des formats de la famille MARC,
de l’information secondaire (description bibliographique et indexation)
et de la gestion des exemplaires physiques ne sont pas adaptés à la
gestion des documents numériques : le champ 856 de MARC21 et
d’UNIMARC est une tentative de solution pour établir un lien entre le
SIGB et le système de GED .
• Les propositions d'évolution des SIGB ne manqueront pas, mais est-ce
vraiment dans ce sens que les solutions doivent être recherchées ?
17/07/2015
toto
9
LE CONTEXTE
• La mise en œuvre de nouveaux systèmes de gestion autour de normes et
standards qui ne sont pas spécifiques aux bibliothèques (du type XML et
plus largement standards du Web) et de nouvelles fonctionnalités, pose la
question de l’intégration de systèmes hétérogènes dans un système
d’information offrant à l’utilisateur une vue unique sur les données et un
accès transparent. On passe du système intégré à l’intégration de systèmes.
17/07/2015
toto
10
LE CONTEXTE
• La mise en œuvre de nouveaux systèmes de gestion autour de normes et
standards qui ne sont pas spécifiques aux bibliothèques (du type XML et
plus largement standards du Web) et de nouvelles fonctionnalités, pose la
question de l’intégration de systèmes hétérogènes dans un système
d’information offrant à l’utilisateur une vue unique sur les données et un
accès transparent. On passe du système intégré à l’intégration de systèmes.
• On ne saurait cependant se contenter de voir dans ce processus une
simple (r)évolution technique supplémentaire. La multiplicité des
applications de XML et des DTD montre que les enjeux portent - ou
sont susceptibles de porter - sur l’ensemble des domaines documentaires
et culturels, et donnent une nouvelle actualité, sous le concept de
convergence, d’interopérabilité et d’accès universel au document, aux
recherches de synergies qui ont marqué les entreprises de normalisation
et de structuration
des données aux différentes
étapes de leur histoire.
17/07/2015
toto
11
LE CONTEXTE
• L’Internet et le Web, en permettant la disponibilité simultanée des
ressources primaires, du catalogue ou des métadonnées et des instruments
de navigation grâce à l’utilisation des mêmes standards et des mêmes
outils informatiques de gestion, d’indexation et d’utilisation, offrent pour la
première fois aux bibliothèques, archives, musées et centres de
documentation, la possibilité d’envisager d’utiliser des standards communs
permettant l’échange de données ou leur juxtaposition sur un site Web.
17/07/2015
toto
12
LE CONTEXTE
• L’Internet et le Web, en permettant la disponibilité simultanée des
ressources primaires, du catalogue ou des métadonnées et des instruments
de navigation grâce à l’utilisation des mêmes standards et des mêmes
outils informatiques de gestion, d’indexation et d’utilisation, offrent pour la
première fois aux bibliothèques, archives, musées et centres de
documentation, la possibilité d’envisager d’utiliser des standards communs
permettant l’échange de données ou leur juxtaposition sur un site Web.
• XML, XSL, DTD, métadonnées... La littérature professionnelle fait sans
cesse depuis plusieurs mois référence à ces termes, sans pour autant
réellement donner les moyens d'en comprendre les tenants et les
aboutissants.
17/07/2015
toto
13
LE CONTEXTE
• Il est vrai que les horizons ouverts par XML sont larges et donc difficiles à
cerner.
17/07/2015
toto
14
LE CONTEXTE
• Il est vrai que les horizons ouverts par XML sont larges et donc difficiles à
cerner.
• XML
est avant tout un outil qui permet de
produire des documents primaires structurés, ce
qui facilite la gestion, l'exploitation et la diffusion
de l'information.
17/07/2015
toto
15
LE CONTEXTE
• Il est vrai que les horizons ouverts par XML sont larges et donc difficiles à
cerner.
• XML
est avant tout un outil qui permet de
produire des documents primaires structurés, ce
qui facilite la gestion, l'exploitation et la diffusion
de l'information.
• Les
DTD définissent des formats de description
de données.
17/07/2015
toto
16
LE CONTEXTE
• XML est un « métalangage » qui constitue un moyen de normalisation
des métadonnées (avec, il faut le souligner, à peu près les mêmes
problèmes que ceux qui avaient présidé à la normalisation des données
bibliographiques). Certains logiciels documentaires mettent déjà en avant
les avantages que ce « métalangage » offre en matière de gestion des bases
documentaires, notamment pour les fonctions d'importation et
d'exportation de données.
17/07/2015
toto
17
LE CONTEXTE
• XML est un « métalangage » qui constitue un moyen de normalisation
des métadonnées (avec, il faut le souligner, à peu près les mêmes
problèmes que ceux qui avaient présidé à la normalisation des données
bibliographiques). Certains logiciels documentaires mettent déjà en avant
les avantages que ce « métalangage » offre en matière de gestion des bases
documentaires, notamment pour les fonctions d'importation et
d'exportation de données.
• Le faible nombre d'expériences concrètes françaises réalisées jusqu’alors
par de grands établissements (Direction des Archives de France,
Bibliothèque nationale de France et quelques bibliothèques universitaires)
et des outils à l’ergonomie encore peu développée (ne sont
actuellement disponibles que des éditeurs XML) expliquent une
perplexité et une circonspection très largement partagées par les
professionnels
de l'information.
17/07/2015
toto
18
LE CONTEXTE
• Il existe des liaisons possibles entre les formats aujourd’hui utilisés et les
nouvelles pistes qui s’ouvrent aux établissements. Tout catalogue, sous
quelque forme que ce soit, comporte obligatoirement trois principes
fondamentaux :
- des éléments qui décrivent les données proprement dites,
- une structuration formelle de ces données qui facilite l’échange,
- une présentation plus ou moins laissée au libre choix de l’utilisateur.
17/07/2015
toto
19
LE CONTEXTE
• Il existe des liaisons possibles entre les formats aujourd’hui utilisés et les
nouvelles pistes qui s’ouvrent aux établissements. Tout catalogue, sous
quelque forme que ce soit, comporte obligatoirement trois principes
fondamentaux :
- des éléments qui décrivent les données proprement dites,
- une structuration formelle de ces données qui facilite l’échange,
- une présentation plus ou moins laissée au libre choix de l’utilisateur.
• Les normes de catalogage qui ont abouti à l’ISBD mêlaient le fond et la
forme, le concept et le contenant, les éléments, la structure et la
présentation. L’apparition des formats MARC, au milieu des années
1960, a dissocié éléments et structure en laissant aux progiciels le soin
de créer une forme de présentation. Les nouveaux standards
électroniques distinguent plus finement éléments et structure et proposent
en plus
une formalisation de la présentation
qui, sans être figée, reste20
17/07/2015
toto
normative tout en permettant des possibilités de sorties très diverses :
STRUCTURE GÉNÉRALE D’UN CATALOGUE
Éléments
Formats Métadonnées DTD
MARC
externes
DTD (TEI, EAD, ISO 12083),
Métadonnées
STRUCTURE GÉNÉRALE D’UN CATALOGUE STRUCTURE GÉNÉRALE D’UN CATALOGUE
Structure
Présentation
17/07/2015
ISBD ISO 2709
HTML
ISBD,
OPAC
SGML
XML
ISBD, OPAC, XSL, Pages Web,
CD-Rom, impression papier, Braille
toto
21
L’ÉVOLUTION
DES ACCÈS PUBLICS EN LIGNE
ET L’ENRICHISSEMENT DES
CATALOGUES
17/07/2015
toto
22
SIGB AVEC PASSERELLE WEB, RESSOURCES
NUMÉRIQUES ASSOCIÉES ET INTÉGRATION AU
NIVEAU DU POSTE CLIENT
17/07/2015
toto
23
SIGB, RESSOURCES NUMÉRIQUES ASSOCIÉES ET
INTÉGRATION AU NIVEAU DE L’INTERGICIEL
17/07/2015
toto
24
ACCÈS À DES BASES HÉTÉROGÈNES
(NORME ISO 239.50 ET PASSERELLE WEB)
17/07/2015
toto
25
FACTEURS D’ÉVOLUTION
• Développement de l’Internet et du Web,
17/07/2015
toto
26
FACTEURS D’ÉVOLUTION
• Développement de l’Internet et du Web,
• Changement de nature des catalogues :
outre l’information bibliographique et les accès :
- intégration de documents numériques,
- lien à l’image ou au texte intégral,
- lien vers une ressource distante,
- lien relançant la recherche,
17/07/2015
toto
27
FACTEURS D’ÉVOLUTION
• Développement de l’Internet et du Web,
• Changement de nature des catalogues :
outre l’information bibliographique et les accès :
- intégration de documents numériques,
- lien à l’image ou au texte intégral,
- lien vers une ressource distante,
- lien relançant la recherche,
• Besoin de structurer les documents numériques en XML pour
l’accès et l’édition sur l’Internet.
17/07/2015
toto
28
FACTEURS D’ÉVOLUTION
• Disponibilité simultanée des ressources primaires, du
catalogue ou des métadonnées et des instruments de
navigation grâce à l’utilisation des :
- mêmes standards (http, HTML, XML, Dublin Core, etc.),
- mêmes outils informatiques de gestion, d’indexation et d’utilisation,
17/07/2015
toto
29
FACTEURS D’ÉVOLUTION
• Disponibilité simultanée des ressources primaires, du
catalogue ou des métadonnées et des instruments de
navigation grâce à l’utilisation des :
- mêmes standards (http, HTML, XML, Dublin Core, etc.),
- mêmes outils informatiques de gestion, d’indexation et d’utilisation,
• Convergence possible entre bibliothèques, archives, centres
de documentation et musées : une seule interface de
navigation.
17/07/2015
toto
30
STRUCTURATION ÉLECTRONIQUE
• Codification correspondant aux :
- aspects physiques du document,
- macrostructure : mise en page de chaque type de page,
17/07/2015
toto
31
MACROSTRUCTURE D’UNE PAGE
PAGE
Haut
Titre
Corps
Colonne
gauche
Colonne
droite
Image
Notes
Bas
17/07/2015
Numéro
toto
32
MACROSTRUCTURE D’UNE PAGE
PAGE
Haut
PAGE
Titre
Corps
Colonne
gauche
Haut
Corps
Bas
Colonne
droite
Titre
Numéro
Image
Bas
17/07/2015
Notes
Colonne
gauche
Colonne
droite
Numéro
Image
Notes
toto
33
STRUCTURATION ÉLECTRONIQUE
• Codification correspondant aux :
- aspects physiques du document,
- macrostructure : mise en page de chaque type de page,
- aspects logiques du document,
- microstructure : attributs typographiques permettant de baliser
des portions de texte (citations en italique, etc.),
17/07/2015
Bibliothèque
nationale de France
toto
34
STRUCTURATION ÉLECTRONIQUE
• Codification correspondant aux :
- aspects physiques du document,
- macrostructure : mise en page de chaque type de page,
- aspects logiques du document,
- microstructure : attributs typographiques permettant de baliser
des portions de texte (citations en italique, etc.),
- types d’éléments logiques : titre, auteur, chapitre, section,
paragraphe, figure, note, bibliographie, etc.,
17/07/2015
Bibliothèque
nationale de France
toto
35
STRUCTURATION ÉLECTRONIQUE
• Codification correspondant aux :
- aspects physiques du document,
- macrostructure : mise en page de chaque type de page,
- aspects logiques du document,
- microstructure : attributs typographiques permettant de baliser
des portions de texte (citations en italique, etc.),
- types d’éléments logiques : titre, auteur, chapitre, section,
paragraphe, figure, note, bibliographie, etc.,
• Définition des éléments et de leur organisation (linéaire,
hiérarchique ...).
17/07/2015
Bibliothèque
nationale de France
toto
36
MÉTADONNÉES
• Métadonnées = données sur les données (information
secondaire) pour :
17/07/2015
Bibliothèque
nationale de France
toto
37
MÉTADONNÉES
• Métadonnées = données sur les données (information
secondaire) pour :
- la gestion des ressources bibliographiques ou d’information,
- l’information sur le contenu du document pour faciliter sa recherche,
sa localisation et son identification,
- le suivi de l’utilisation et du respect des droits associés à la ressource
(électronique ou non),
- l’utilisation des supports analogiques comme ressources
électroniques,
- l’interopérabilité des données grâce à des standards de fait et des
normes (Dublin Core, etc.).
17/07/2015
Bibliothèque
nationale de France
toto
38
MÉTADONNÉES « CLASSIQUES »
• Information secondaire et document primaire distincts :
- ex. notice ISBD, enregistrement en format MARC ; le nom du rédacteur et
les dates de mise à jour de la notice sont des métadonnées sur les
métadonnées, etc.
17/07/2015
Bibliothèque
nationale de France
toto
39
MÉTADONNÉES « CLASSIQUES »
• Information secondaire et document primaire distincts :
- ex. notice ISBD, enregistrement en format MARC ; le nom du rédacteur et
les dates de mise à jour de la notice sont des métadonnées sur les
métadonnées, etc.
• Normes et standards propres à chaque catégorie de ressource
primaire (formats pdf, ASCII pour le texte, formats jpeg, tiff, gif ou mpeg
pour l’image, etc.)
17/07/2015
Bibliothèque
nationale de France
toto
40
MÉTADONNÉES « CLASSIQUES »
• Information secondaire et document primaire distincts :
- ex. notice ISBD, enregistrement en format MARC ; le nom du rédacteur et
les dates de mise à jour de la notice sont des métadonnées sur les
métadonnées, etc.
• Normes et standards propres à chaque catégorie de ressource
primaire (formats pdf, ASCII pour le texte, formats jpeg, tiff, gif ou mpeg
pour l’image, etc.)
ou secondaire (formats MARC pour la production et Unimarc ISO
2709/1996 pour la diffusion de l’information bibliographique).
17/07/2015
Bibliothèque
nationale de France
toto
41
MÉTADONNÉES «ÉLECTRONIQUES»
• Toute unité identifiable sur le Web :
- serveur, site Web, page, fragment de contenu, etc.,
- disponibilité simultanée de la ressource électronique elle-même et des
métadonnées qui lui sont associées,
17/07/2015
Bibliothèque
nationale de France
toto
42
MÉTADONNÉES «ÉLECTRONIQUES»
• Toute unité identifiable sur le Web :
- serveur, site Web, page, fragment de contenu, etc.,
- disponibilité simultanée de la ressource électronique elle-même et des
métadonnées qui lui sont associées,
• Métadonnées de ressources électroniques :
- utilisation de standards génériques de codage de la structure logique,
- standards communs utilisés pour la ressource électronique et les
métadonnées,
- identification automatique et « catalogage à la source » des ressources
électroniques saisies selon un format structuré.
17/07/2015
Bibliothèque
nationale de France
toto
43
DUBLIN CORE
15 ÉLÉMENTS :
Contenu
Titre
Sujet
Description
Source
Langage
Relation
Couverture
Propriété intellectuelle
Auteur
Éditeur
Contributeur
Gestion des droits
Matérialisation
Date
Type de ressource
Format
Identifiant
10 ATTRIBUTS DE DÉFINITION DES ÉLÉMENTS (avril 2000) :
-
Nom,
Identifiant,
Version,
Autorité,
Langage,
Définition,
Obligation,
Type,
Occurrence,
Commentaire.
17/07/2015
Bibliothèque
nationale de France
toto
44
DUBLIN CORE
• Dublin Core Metadata Initiative :
http://dublincore.org
17/07/2015
Bibliothèque
nationale de France
toto
45
DUBLIN CORE
• Dublin Core Metadata Initiative :
http://dublincore.org
• Guide d’utilisation du Dublin Core :
http://www.bibl.ulaval.ca/DublinCore/usageguide-20000716fr
.htm
17/07/2015
Bibliothèque
nationale de France
toto
46
LES FORMATS DE
STRUCTURATION ÉLECTRONIQUE
17/07/2015
toto
47
SGML
STANDARD GENERALIZED
MARKUP LANGUAGE
( = Langage normalisé de balisage généralisé)
ISO 8879 (1986) - AFNOR NF Z 71-010 (1990)
17/07/2015
toto
48
SGML
• Successeur du format ML (Markup Language) puis GML
(Generalized Markup Language) qui remonte à la seconde
moitié des années 1960,
17/07/2015
toto
49
SGML
• Successeur du format ML (Markup Language) puis GML
(Generalized Markup Language) qui remonte à la seconde
moitié des années 1960,
• Origine dans le monde de l'édition (années 1980) :
- technique de production de documents papier,
- saisie de documents électroniques en base de données structurées,
- balisage universel qui identifie chaque élément logique de la structure
du document et qui permet son indexation et sa recherche,
17/07/2015
toto
50
SGML
• Successeur du format ML (Markup Language) puis GML
(Generalized Markup Language) qui remonte à la seconde
moitié des années 1960,
• Origine dans le monde de l'édition (années 1980) :
- technique de production de documents papier,
- saisie de documents électroniques en base de données structurées,
- balisage universel qui identifie chaque élément logique de la structure
du document et qui permet son indexation et sa recherche,
• Impact actuel de SGML :
- norme universelle de production de documents,
- applications documentaires (notamment grands corpus : Fondation
Voltaire, Encyclopaedia Universalis, Communauté européenne,
Aérospatiale, Agence spatiale européenne, EDF, Renault, etc.),
17/07/2015
toto
51
- très utilisée dans le monde de l’édition et de l’impression.
SGML
• DTD (définition de type de document),
17/07/2015
toto
52
SGML
• DTD (définition de type de document),
• Un document structuré en SGML est balisé selon une DTD :
le document est une instance de la DTD,
17/07/2015
toto
53
SGML
• DTD (définition de type de document),
• Un document structuré en SGML est balisé selon une DTD :
le document est une instance de la DTD,
• Un éditeur SGML est un logiciel de traitement de texte qui
permet à la fois la saisie des éléments de données et le
contrôle du document et de ses balises,
17/07/2015
toto
54
SGML
• DTD (définition de type de document),
• Un document structuré en SGML est balisé selon une DTD :
le document est une instance de la DTD,
• Un éditeur SGML est un logiciel de traitement de texte qui
permet à la fois la saisie des éléments de données et le
contrôle du document et de ses balises,
• Un parseur (parser ou analyseur) est un programme qui
contrôle que le document électronique encodé en SGML est
balisé conformément à la DTD choisie.
17/07/2015
toto
55
HTML
HyperText Markup Language
(= Langage de balisage hypertextuel)
17/07/2015
toto
56
HTML
• Standard de fait pour les publications sur l’Internet,
17/07/2015
toto
57
HTML
• Standard de fait pour les publications sur l’Internet,
• DTD SGML des pages WEB : titre, texte, listes, points d'ancrage
hypertexte,
17/07/2015
toto
58
HTML
• Standard de fait pour les publications sur l’Internet,
• DTD SGML des pages WEB : titre, texte, listes, points d'ancrage
hypertexte,
• Fonction de navigation :
- liens internes au document ou vers des objets externes ou distants :
lien dans la même page ou vers une autre page du même document,
vers d’autres applications Internet, des objets multimédias, des
programmes, etc.,
- pointeurs pour les liens : URL (Uniform Resource Locators),
17/07/2015
toto
59
HTML
• Standard de fait pour les publications sur l’Internet,
• DTD SGML des pages WEB : titre, texte, listes, points d'ancrage
hypertexte,
• Fonction de navigation :
- liens internes au document ou vers des objets externes ou distants :
lien dans la même page ou vers une autre page du même document,
vers d’autres applications Internet, des objets multimédias, des
programmes, etc.,
- pointeurs pour les liens : URL (Uniform Resource Locators),
• Insiste plus sur la forme que sur la structure du document,
17/07/2015
toto
60
HTML
• Standard de fait pour les publications sur l’Internet,
• DTD SGML des pages WEB : titre, texte, listes, points d'ancrage
hypertexte,
• Fonction de navigation :
- liens internes au document ou vers des objets externes ou distants :
lien dans la même page ou vers une autre page du même document,
vers d’autres applications Internet, des objets multimédias, des
programmes, etc.,
- pointeurs pour les liens : URL (Uniform Resource Locators),
• Insiste plus sur la forme que sur la structure du document,
• Définit la structure physique plus que la structure logique,
17/07/2015
toto
61
HTML
• Standard de fait pour les publications sur l’Internet,
• DTD SGML des pages WEB : titre, texte, listes, points d'ancrage
hypertexte,
• Fonction de navigation :
- liens internes au document ou vers des objets externes ou distants :
lien dans la même page ou vers une autre page du même document,
vers d’autres applications Internet, des objets multimédias, des
programmes, etc.,
- pointeurs pour les liens : URL (Uniform Resource Locators),
• Insiste plus sur la forme que sur la structure du document,
• Définit la structure physique plus que la structure logique,
• Grammaire de balises à sémantique faible,
17/07/2015
toto
62
HTML
• Standard de fait pour les publications sur l’Internet,
• DTD SGML des pages WEB : titre, texte, listes, points d'ancrage
hypertexte,
• Fonction de navigation :
- liens internes au document ou vers des objets externes ou distants :
lien dans la même page ou vers une autre page du même document,
vers d’autres applications Internet, des objets multimédias, des
programmes, etc.,
- pointeurs pour les liens : URL (Uniform Resource Locators),
•
•
•
•
Insiste plus sur la forme que sur la structure du document,
Définit la structure physique plus que la structure logique,
Grammaire de balises à sémantique faible,
17/07/2015
toto
63
Peine à gérer des documents de gros volume (frames).
XML
EXTENDED MARKUP
LANGUAGE
(= Langage de balisage étendu)
1998
17/07/2015
toto
64
XML
• Créé par le W3 Consortium (W3C) de 1996 à avril 1998,
17/07/2015
toto
65
XML
• Créé par le W3 Consortium (W3C) de 1996 à avril 1998,
• Variante plus légère de SGML qui reprend le concept de
balisage structurel, les attributs, les entités, et qui reprend les
liens hypertexte de HTML (ancrage, pointeurs),
17/07/2015
toto
66
XML
• Créé par le W3 Consortium (W3C) de 1996 à avril 1998,
• Variante plus légère de SGML qui reprend le concept de
balisage structurel, les attributs, les entités, et qui reprend les
liens hypertexte de HTML (ancrage, pointeurs),
• À la fois recommandation du W3C et sous-ensemble de la
norme SGML ISO 8879, « métalangage et « métaformat »,
17/07/2015
toto
67
XML
• Créé par le W3 Consortium (W3C) de 1996 à avril 1998,
• Variante plus légère de SGML qui reprend le concept de
balisage structurel, les attributs, les entités, et qui reprend les
liens hypertexte de HTML (ancrage, pointeurs),
• À la fois recommandation du W3C et sous-ensemble de la
norme SGML ISO 8879, « métalangage et « métaformat »,
• La nouveauté qu’apporte XML est sa structure neutre
indépendante de tout logiciel ou plate-forme technique,
17/07/2015
toto
68
XML
• Créé par le W3 Consortium (W3C) de 1996 à avril 1998,
• Variante plus légère de SGML qui reprend le concept de
balisage structurel, les attributs, les entités, et qui reprend les
liens hypertexte de HTML (ancrage, pointeurs),
• À la fois recommandation du W3C et sous-ensemble de la
norme SGML ISO 8879, « métalangage et « métaformat »,
• La nouveauté qu’apporte XML est sa structure neutre
indépendante de tout logiciel ou plate-forme technique,
• Un document XML présente une indépendance totale entre sa
structure logique et son aspect physique, ce qui en fait un
format de stockage et d’archivage pérenne : un fichier XML
n’est qu’un fichier ASCII.
17/07/2015
toto
69
XML
• Créé par le W3 Consortium (W3C) de 1996 à avril 1998,
• Variante plus légère de SGML qui reprend le concept de
balisage structurel, les attributs, les entités, et qui reprend les
liens hypertexte de HTML (ancrage, pointeurs),
• À la fois recommandation du W3C et sous-ensemble de la
norme SGML ISO 8879, « métalangage et « métaformat »,
• La nouveauté qu’apporte XML est sa structure neutre
indépendante de tout logiciel ou plate-forme technique,
• Un document XML présente une indépendance totale entre sa
structure logique et son aspect physique, ce qui en fait un
format de stockage et d’archivage pérenne : un fichier XML
n’est qu’un fichier ASCII.
17/07/2015
(« a bit is a bit… »)
toto
70
QU’EST-CE QUE XML ?
17/07/2015
toto
71
QU’EST-CE QUE XML ?
• XML n’est pas…
17/07/2015
toto
72
QU’EST-CE QUE XML ?
• XML n’est pas…
- un format,
17/07/2015
toto
73
QU’EST-CE QUE XML ?
• XML n’est pas…
- un format,
- un logiciel,
17/07/2015
toto
74
QU’EST-CE QUE XML ?
• XML n’est pas…
- un format,
- un logiciel,
- un langage de programmation,
17/07/2015
toto
75
QU’EST-CE QUE XML ?
• XML n’est pas…
- un format,
- un logiciel,
- un langage de programmation,
- un protocole de communication ;
17/07/2015
toto
76
QU’EST-CE QUE XML ?
• XML n’est pas…
- un format,
- un logiciel,
- un langage de programmation,
- un protocole de communication ;
• XML est un peu tout cela à la fois ; c’est aussi…
17/07/2015
toto
77
QU’EST-CE QUE XML ?
• XML n’est pas…
- un format,
- un logiciel,
- un langage de programmation,
- un protocole de communication ;
• XML est un peu tout cela à la fois ; c’est aussi…
- une infrastructure,
17/07/2015
toto
78
QU’EST-CE QUE XML ?
• XML n’est pas…
- un format,
- un logiciel,
- un langage de programmation,
- un protocole de communication ;
• XML est un peu tout cela à la fois ; c’est aussi…
- une infrastructure,
- une méthodologie,
17/07/2015
toto
79
QU’EST-CE QUE XML ?
• XML n’est pas…
- un format,
- un logiciel,
- un langage de programmation,
- un protocole de communication ;
• XML est un peu tout cela à la fois ; c’est aussi…
- une infrastructure,
- une méthodologie,
- une « philosophie ».
17/07/2015
toto
80
QU’EST-CE QUE XML ?
17/07/2015
toto
81
QU’EST-CE QUE XML ?
• Un HTML extensible ?
17/07/2015
toto
82
QU’EST-CE QUE XML ?
• Un HTML extensible ?
- Approche fréquemment utilisée dans la presse de
vulgarisation informatique spécialisée sur le Web,
17/07/2015
toto
83
QU’EST-CE QUE XML ?
• Un HTML extensible ?
- Approche fréquemment utilisée dans la presse de
vulgarisation informatique spécialisée sur le Web,
- XML est présenté comme un format « extensible » qui
permet de créer des pages personnelles « améliorées »,
17/07/2015
toto
84
QU’EST-CE QUE XML ?
• Un HTML extensible ?
- Approche fréquemment utilisée dans la presse de
vulgarisation informatique spécialisée sur le Web,
- XML est présenté comme un format « extensible » qui
permet de créer des pages personnelles « améliorées »,
- Comparaison avec HTML : XML utilise également des
balises, mais, à l’inverse de HTML, on peut définir ses
propres balises.
17/07/2015
toto
85
QU’EST-CE QUE XML ?
• Un HTML extensible ?
- Approche fréquemment utilisée dans la presse de
vulgarisation informatique spécialisée sur le Web,
- XML est présenté comme un format « extensible » qui
permet de créer des pages personnelles « améliorées »,
- Comparaison avec HTML : XML utilise également des
balises, mais, à l’inverse de HTML, on peut définir ses
propres balises.
MAIS cette approche ne donne qu’une vue très fragmentaire
d’XML en occultant totalement sa puissance comme format de
17/07/2015
toto
86
documents
structurés.
QU’EST-CE QUE XML ?
• Une nouvelle architecture pour le Web ?
17/07/2015
toto
87
QU’EST-CE QUE XML ?
• Une nouvelle architecture pour le Web ?
- Approche souvent utilisée par les informaticiens,
notamment en ce qui concerne le commerce électronique et la
« net-économie » (e-business),
17/07/2015
toto
88
QU’EST-CE QUE XML ?
• Une nouvelle architecture pour le Web ?
- Approche souvent utilisée par les informaticiens,
notamment en ce qui concerne le commerce électronique et la
« net-économie » (e-business),
- Approche qui s’appuie sur le Web comme système
d’information et d’échange dans son ensemble,
17/07/2015
toto
89
QU’EST-CE QUE XML ?
• Une nouvelle architecture pour le Web ?
- Approche souvent utilisée par les informaticiens,
notamment en ce qui concerne le commerce électronique et la
« net-économie » (e-business),
- Approche qui s’appuie sur le Web comme système
d’information et d’échange dans son ensemble,
- Approche qui insiste sur les échanges de données, les
protocoles de communication, les interfaces de
programmation, la sécurisation des données, etc.
17/07/2015
toto
90
QU’EST-CE QUE XML ?
• Une nouvelle architecture pour le Web ?
- Approche souvent utilisée par les informaticiens,
notamment en ce qui concerne le commerce électronique et la
« net-économie » (e-business),
- Approche qui s’appuie sur le Web comme système
d’information et d’échange dans son ensemble,
- Approche qui insiste sur les échanges de données, les
protocoles de communication, les interfaces de
programmation, la sécurisation des données, etc.
MAIS, dans cette approche, les applications documentaires
sont totalement mises à l’écart.
17/07/2015
toto
91
QU’EST-CE QUE XML ?
• Un format de documents structurés ?
17/07/2015
toto
92
QU’EST-CE QUE XML ?
• Un format de documents structurés ?
- Approche très utilisée dans le monde documentaire,
17/07/2015
toto
93
QU’EST-CE QUE XML ?
• Un format de documents structurés ?
- Approche très utilisée dans le monde documentaire,
- Approche qui s’appuie sur SGML et les méthodologies
développées pour les grands corpus documentaires,
17/07/2015
toto
94
QU’EST-CE QUE XML ?
• Un format de documents structurés ?
- Approche très utilisée dans le monde documentaire,
- Approche qui s’appuie sur SGML et les méthodologies
développées pour les grands corpus documentaires,
- Approche qui présente XML comme une technologie
permettant de créer des documents plus « intelligents »,
17/07/2015
toto
95
QU’EST-CE QUE XML ?
• Un format de documents structurés ?
- Approche très utilisée dans le monde documentaire,
- Approche qui s’appuie sur SGML et les méthodologies
développées pour les grands corpus documentaires,
- Approche qui présente XML comme une technologie
permettant de créer des documents plus « intelligents »,
- Approche qui insiste sur la pérennisation et la réutilisation de
l’information, la publication sur de multiples supports et en
plusieurs formats, etc.
17/07/2015
toto
96
QU’EST-CE QUE XML ?
• Un format de documents structurés ?
- Approche très utilisée dans le monde documentaire,
- Approche qui s’appuie sur SGML et les méthodologies
développées pour les grands corpus documentaires,
- Approche qui présente XML comme une technologie
permettant de créer des documents plus « intelligents »,
- Approche qui insiste sur la pérennisation et la réutilisation de
l’information, la publication sur de multiples supports et en
plusieurs formats, etc.
MAIS quand cette approche plus réaliste est argumentée hors
du contexte documentaire, elle n’est pas considérée comme
importante.
17/07/2015
toto
97
XML NE S’UTILISE PAS SEUL
• XML est une structure générique dont la mise en page est
réalisée par une feuille de style XSL (eXtensible Stylesheet
Language),
17/07/2015
toto
98
XML NE S’UTILISE PAS SEUL
• XML est une structure générique dont la mise en page est
réalisée par une feuille de style XSL (eXtensible Stylesheet
Language),
- XSL - T (pour les pages Web)
- XSL - FO (pour la publication papier ou sur écran).
17/07/2015
toto
99
XML NE S’UTILISE PAS SEUL
• XML est une structure générique dont la mise en page est
réalisée par une feuille de style XSL (eXtensible Stylesheet
Language),
- XSL - T (pour les pages Web)
- XSL - FO (pour la publication papier ou sur écran).
À partir d’un fichier structuré en XML et en utilisant diverses feuilles de
style XSL, on peut produire des présentations différentes du contenu des
documents, en fonction des supports d’édition (notamment le Web) ou
des publics visés.
17/07/2015
toto
100
XML NE S’UTILISE PAS SEUL
• XML est une structure générique dont la mise en page est
réalisée par une feuille de style XSL (eXtensible Stylesheet
Language),
- XSL - T (pour les pages Web)
- XSL - FO (pour la publication papier ou sur écran).
À partir d’un fichier structuré en XML et en utilisant diverses feuilles de
style XSL, on peut produire des présentations différentes du contenu des
documents, en fonction des supports d’édition (notamment le Web) ou
des publics visés.
CONTENU
(données =
fichier XML)
17/07/2015
toto
101
XML NE S’UTILISE PAS SEUL
• XML est une structure générique dont la mise en page est
réalisée par une feuille de style XSL (eXtensible Stylesheet
Language),
- XSL - T (pour les pages Web)
- XSL - FO (pour la publication papier ou sur écran).
À partir d’un fichier structuré en XML et en utilisant diverses feuilles de
style XSL, on peut produire des présentations différentes du contenu des
documents, en fonction des supports d’édition (notamment le Web) ou
des publics visés.
CONTENU
PRÉSENTATION
(données =
(mise en page =
fichier XML)
plusieurs fichiers
XSL possibles)
17/07/2015
toto
102
XML NE S’UTILISE PAS SEUL
• XML est une structure générique dont la mise en page est
réalisée par une feuille de style XSL (eXtensible Stylesheet
Language),
- XSL - T (pour les pages Web)
- XSL - FO (pour la publication papier ou sur écran).
À partir d’un fichier structuré en XML et en utilisant diverses feuilles de
style XSL, on peut produire des présentations différentes du contenu des
documents, en fonction des supports d’édition (notamment le Web) ou
des publics visés.
CONTENU
PRÉSENTATION
(données =
(mise en page =
fichier XML)
plusieurs fichiers
XSL possibles)
SORTIE
17/07/2015
toto
103
(page Web, édition papier,
CD, en Braille, etc. )
XML NE S’UTILISE PAS SEUL
• RDF (Resource Description Framework) est une
recommandation de 1999 qui spécifie la structure des
métadonnées,
17/07/2015
toto
104
XML NE S’UTILISE PAS SEUL
• RDF (Resource Description Framework) est une
recommandation de 1999 qui spécifie la structure des
métadonnées,
• XML Data est utilisée pour typer le contenu des éléments,
17/07/2015
toto
105
XML NE S’UTILISE PAS SEUL
• RDF (Resource Description Framework) est une
recommandation de 1999 qui spécifie la structure des
métadonnées,
• XML Data est utilisée pour typer le contenu des éléments,
• XLL (eXtended Linking Language) est utilisé pour la
création de liens hypertextes simples ou multiples vers des
destinations différentes,
17/07/2015
toto
106
XML NE S’UTILISE PAS SEUL
• RDF (Resource Description Framework) est une
recommandation de 1999 qui spécifie la structure des
métadonnées,
• XML Data est utilisée pour typer le contenu des éléments,
• XLL (eXtended Linking Language) est utilisé pour la
création de liens hypertextes simples ou multiples vers des
destinations différentes,
• Topics Maps est une norme ISO basée à la fois sur SGML et
HyTime et qui utilise les mécanismes d’XLL,
17/07/2015
toto
107
XML NE S’UTILISE PAS SEUL
• RDF (Resource Description Framework) est une
recommandation de 1999 qui spécifie la structure des
métadonnées,
• XML Data est utilisée pour typer le contenu des éléments,
• XLL (eXtended Linking Language) est utilisé pour la
création de liens hypertextes simples ou multiples vers des
destinations différentes,
• Topics Maps est une norme ISO basée à la fois sur SGML et
HyTime et qui utilise les mécanismes d’XLL,
• Le langage XQL (eXtended Query Language), équivalent de
SQL pour les données créées en XML, permettra dans un
proche avenir d’interroger des bases XML en établissant des
requêtes
17/07/2015portant sur la structure
toto de l’information.
108
CARACTÉRISTIQUES DE XML
• Codage conçu pour la distribution des documents ou de
portions de documents :
17/07/2015
toto
109
CARACTÉRISTIQUES DE XML
• Codage conçu pour la distribution des documents ou de
portions de documents :
- document « bien formé » autosuffisant = « autocatalogage »,
17/07/2015
toto
110
CARACTÉRISTIQUES DE XML
• Codage conçu pour la distribution des documents ou de
portions de documents :
- document « bien formé » autosuffisant = « autocatalogage »,
- document « valide » = document « bien formé » conforme à
une DTD,
17/07/2015
toto
111
CARACTÉRISTIQUES DE XML
• Codage conçu pour la distribution des documents ou de
portions de documents :
- document « bien formé » autosuffisant = « autocatalogage »,
- document « valide » = document « bien formé » conforme à
une DTD,
- utilisation facultative d’une DTD,
17/07/2015
toto
112
CARACTÉRISTIQUES DE XML
• Codage conçu pour la distribution des documents ou de
portions de documents :
- document « bien formé » autosuffisant = « autocatalogage »,
- document « valide » = document « bien formé » conforme à
une DTD,
- utilisation facultative d’une DTD,
- permet de créer ses propres balises,
17/07/2015
toto
113
CARACTÉRISTIQUES DE XML
• Codage conçu pour la distribution des documents ou de
portions de documents :
- document « bien formé » autosuffisant = « autocatalogage »,
- document « valide » = document « bien formé » conforme à
une DTD,
- utilisation facultative d’une DTD,
- permet de créer ses propres balises,
- feuilles de style normalisées XSL indépendantes du document
encodé en XML.
17/07/2015
toto
114
CARACTÉRISTIQUES DE XML
• Codage des caractères selon la norme UNICODE (norme ISO
10646-UCS4), soit 4 294 967 296 possibilités de caractères codés
sur 4 octets,
17/07/2015
toto
115
CARACTÉRISTIQUES DE XML
• Codage des caractères selon la norme UNICODE (norme ISO
10646-UCS4), soit 4 294 967 296 possibilités de caractères codés
sur 4 octets,
• De janvier 2000 à juin 2002, 66 % des sites Web
professionnels sont passés de HTML à XML (données INRIA,
siège du W3C).
17/07/2015
toto
116
CARACTÉRISTIQUES DE XML
• Codage des caractères selon la norme UNICODE (norme ISO
10646-UCS4), soit 4 294 967 296 possibilités de caractères codés
sur 4 octets,
• De janvier 2000 à juin 2002, 66 % des sites Web
professionnels sont passés de HTML à XML (données INRIA,
siège du W3C).
• Mais… toujours le même péché de jeunesse : à l’automne
2002, il n’existe pas encore de système de production
« bibliographique » en XML.
17/07/2015
toto
117
XML
• Un changement important qui impose une formation :
17/07/2015
toto
118
XML
• Un changement important qui impose une formation :
- Changement dans les formats bibliographiques et
documentaires = formation pour les catalogueurs et tous ceux qui
traitent de l’information,
17/07/2015
toto
119
XML
• Un changement important qui impose une formation :
- Changement dans les formats bibliographiques et
documentaires = formation pour les catalogueurs et tous ceux qui
traitent de l’information,
- Changement dans les architectures informatiques = formation
pour les informaticiens,
17/07/2015
toto
120
XML
• Un changement important qui impose une formation :
- Changement dans les formats bibliographiques et
documentaires = formation pour les catalogueurs et tous ceux qui
traitent de l’information,
- Changement dans les architectures informatiques = formation
pour les informaticiens,
- Changement d’objets manipulés (de la représentation des
documents aux documents numériques) = formation générale, pour
l’ensemble du personnel,
17/07/2015
toto
121
XML
• Un changement important qui impose une formation :
- Changement dans les formats bibliographiques et
documentaires = formation pour les catalogueurs et tous ceux qui
traitent de l’information,
- Changement dans les architectures informatiques = formation
pour les informaticiens,
- Changement d’objets manipulés (de la représentation des
documents aux documents numériques) = formation générale, pour
l’ensemble du personnel,
- Mais pas de changement pour l’utilisateur : le public utilise
toujours le navigateur et poursuit sa recherche « intuitive ».
17/07/2015
toto
122
L’impact d’XML dans les bibliothèques
PRODUCTION D’INFORMATION :
- Catalogage bibliographique et d’autorité de tous types de documents selon
une DTD,
- Conversion rétrospective de catalogues ou d’instruments de recherche
existants,
- Conversions de notices MARC existantes selon une DTD MARC,
- Conversions rétrospectives de collections spécialisées selon une DTD,
17/07/2015
toto
123
L’impact d’XML dans les bibliothèques
PRODUCTION D’INFORMATION :
- Catalogage bibliographique et d’autorité de tous types de documents selon
une DTD,
- Conversion rétrospective de catalogues ou d’instruments de recherche
existants,
- Conversions de notices MARC existantes selon une DTD MARC,
- Conversions rétrospectives de collections spécialisées selon une DTD,
- Numérisation de documents primaires (en mode texte et image pour les
documents imprimés et en mode image pour les documents graphiques),
- Création de métadonnées et structuration en XML de l’ensemble
métadonnées - documents numérisés,
- Liaison réciproque directe des catalogues ou des métadonnées et des
ressources numériques,
17/07/2015
toto une DTD.
124
- Élaboration
de modèles structurés selon
L’impact d’XML dans les bibliothèques
CONSULTATION ET RECHERCHE D’INFORMATION :
- Consultation simultanée de la notice bibliographique ou des
métadonnées et des ressources numériques associées,
- Indexation en texte intégral et liens vers les fichiers d’autorité,
- Recherche possible via le catalogue ou les documents numériques,
- Exportation possible de l’ensemble notice bibliographique ou
métadonnées et ressource numérique.
17/07/2015
toto
125
L’impact d’XML dans les bibliothèques
DIFFUSION D’INFORMATION :
- Édition électronique (CD-Roms, bibliographies, catalogues raisonnés,
inventaires, catalogues d’exposition, etc.),
- Édition sur papier (fourniture d’un flux à l’imprimeur),
- Mise au point d’une chaîne d’édition à la demande des documents
numérisés et structurés en XML,
- Site Web et Intranet,
- Bibliothèque numérique : les instruments de recherche sous forme
d’instances XML conformes à une DTD normalisée peuvent être lus,
échangés et utilisés par la communauté scientifique internationale.
17/07/2015
toto
126
XML
• Site du W3C :
http://www.w3.org/
17/07/2015
toto
127
XML
• Site du W3C :
http://www.w3.org/
• Version 1.0 de XML (15 mars 2001) :
http://www.w3.org/TR/2001/REC-xml-cl4n-20010315
17/07/2015
toto
128
XML
• Site du W3C :
http://www.w3.org/
• Version 1.0 de XML (15 mars 2001) :
http://www.w3.org/TR/2001/REC-xml-cl4n-20010315
• Traduction française de XML 1.0 :
http://babel/alis.com/web_ml/xml/
17/07/2015
toto
129
XML
• Site du W3C :
http://www.w3.org/
• Version 1.0 de XML (15 mars 2001) :
http://www.w3.org/TR/2001/REC-xml-cl4n-20010315
• Traduction française de XML 1.0 :
http://babel/alis.com/web_ml/xml/
• Page de liens du groupe XML « Enrichi » de l’ABF :
http://www.asso.fr/enrichi/docxml.htm
17/07/2015
toto
130
XML
• Educnet :
http://www.educnet.education.gouv.fr/documentation/dossier
/xml.htm
17/07/2015
toto
131
XML
• Educnet :
http://www.educnet.education.gouv.fr/documentation/dossier
/xml.htm
• Mission interministérielle de soutien technique pour le
développement des Technologies de l’Information et de la
Communication dans l’administration (MTIC)°:
http://www.mtic.pm.gouv.fr/XML/
17/07/2015
toto
132
XML
• Educnet :
http://www.educnet.education.gouv.fr/documentation/dossier
/xml.htm
• Mission interministérielle de soutien technique pour le
développement des Technologies de l’Information et de la
Communication dans l’administration (MTIC)°:
http://www.mtic.pm.gouv.fr/XML/
• XML et l’ingénierie des bibliothèques électroniques :
http://www.loria.fr/~ducloy/COURS/URFIST.html
17/07/2015
toto
133
XML
• Educnet :
http://www.educnet.education.gouv.fr/documentation/dossier
/xml.htm
• Mission interministérielle de soutien technique pour le
développement des Technologies de l’Information et de la
Communication dans l’administration (MTIC)°:
http://www.mtic.pm.gouv.fr/XML/
• XML et l’ingénierie des bibliothèques électroniques :
http://www.loria.fr/~ducloy/COURS/URFIST.html
• MutuXML (liste de diffusion, articles, didacticiels, etc.)
http://www.mutu-xml.org
17/07/2015
toto
134
DTD
DÉFINITION
DE
TYPE
DE
DOCUMENT
=
DOCUMENT TYPE DEFINITION
17/07/2015
toto
135
QU’EST-CE QU’UNE DTD ?
17/07/2015
toto
136
QU’EST-CE QU’UNE DTD ?
• Une DTD est un « format » de description des éléments qui
composent le document,
17/07/2015
toto
137
QU’EST-CE QU’UNE DTD ?
• Une DTD est un « format » de description des éléments qui
composent le document, mais une DTD est plus qu’un format
« classique » de type MARC puisqu’elle peut gérer à la fois
non seulement la description bibliographique et les accès ou les
métadonnées mais aussi le document électronique lui-même,
17/07/2015
toto
138
QU’EST-CE QU’UNE DTD ?
• Une DTD est un « format » de description des éléments qui
composent le document, mais une DTD est plus qu’un format
« classique » de type MARC puisqu’elle peut gérer à la fois
non seulement la description bibliographique et les accès ou les
métadonnées mais aussi le document électronique lui-même,
• Description en langage SGML ou XML et codification de la
structure logique d’un document ou d’un ensemble de
documents (partie, chapitre, section, paragraphe),
17/07/2015
toto
139
QU’EST-CE QU’UNE DTD ?
• Une DTD est un « format » de description des éléments qui
composent le document, mais une DTD est plus qu’un format
« classique » de type MARC puisqu’elle peut gérer à la fois
non seulement la description bibliographique et les accès ou les
métadonnées mais aussi le document électronique lui-même,
• Description en langage SGML ou XML et codification de la
structure logique d’un document ou d’un ensemble de
documents (partie, chapitre, section, paragraphe),
• Définition et structuration par balisage des éléments logiques
(auteur, titre, sujet, etc.) et de leur organisation hiérarchique
ou non,
17/07/2015
toto
140
QU’EST-CE QU’UNE DTD ?
• Une DTD est un « format » de description des éléments qui
composent le document, mais une DTD est plus qu’un format
« classique » de type MARC puisqu’elle peut gérer à la fois
non seulement la description bibliographique et les accès ou les
métadonnées mais aussi le document électronique lui-même,
• Description en langage SGML ou XML et codification de la
structure logique d’un document ou d’un ensemble de
documents (partie, chapitre, section, paragraphe),
• Définition et structuration par balisage des éléments logiques
(auteur, titre, sujet, etc.) et de leur organisation hiérarchique
ou non,
• La quasi-intégralité des DTD initialement écrites en SGML
17/07/2015
toto
141
ont été
traduites en XML.
Une DTD se compose :
17/07/2015
toto
142
Une DTD se compose :
• des éléments logiques qui constituent le document,
- ex. : <!ELEMENT auteur
17/07/2015
toto
143
Une DTD se compose :
• des éléments logiques qui constituent le document,
- ex. : <!ELEMENT auteur
• des attributs de qualification de ces éléments,
- ex. : <langencoding="ISO 639-2">
17/07/2015
toto
144
Une DTD se compose :
• des éléments logiques qui constituent le document,
- ex. : <!ELEMENT auteur
• des attributs de qualification de ces éléments,
- ex. : <langencoding="ISO 639-2">
• des entités, c’est-à-dire des chaînes de caractères qui
composent le document ou des documents externes dans un
autre codage (image, son ...) qui sont attachés à un endroit
précis.
- ex. : balise logique d’attache d’un document image (jpeg, tiff, gif, mpeg,
etc.) stocké dans un fichier séparé.
17/07/2015
toto
145
Une DTD se compose :
• des éléments logiques qui constituent le document,
- ex. : <!ELEMENT auteur
• des attributs de qualification de ces éléments,
- ex. : <langencoding="ISO 639-2">
• des entités, c’est-à-dire des chaînes de caractères qui
composent le document ou des documents externes dans un
autre codage (image, son ...) qui sont attachés à un endroit
précis.
- ex. : balise logique d’attache d’un document image (jpeg, tiff, gif, mpeg,
etc.) stocké dans un fichier séparé.
• des balises qui structurent le document.
- ex. : <auteur> xxxxx </auteur>
toto
17/07/2015
146
DTD
• Le document est encodé avec des balises qui encadrent
chaque élément logique de la structure du document, ainsi
identifié comme élément pertinent d’information,
17/07/2015
toto
147
DTD
• Le document est encodé avec des balises qui encadrent
chaque élément logique de la structure du document, ainsi
identifié comme élément pertinent d’information,
• Les balises et leurs règles d’utilisation sont définies dans la
DTD,
17/07/2015
toto
148
DTD
• Le document est encodé avec des balises qui encadrent
chaque élément logique de la structure du document, ainsi
identifié comme élément pertinent d’information,
• Les balises et leurs règles d’utilisation sont définies dans la
DTD,
• Le visualiseur interprète les balises logiques et les transforme
en présentation visuelle ou typographique selon les
spécifications de la feuille de style XSL.
17/07/2015
toto
149
DTD
• Il existe plusieurs DTD :
17/07/2015
toto
150
DTD
• Il existe plusieurs DTD :
- ISO 12083,
http://www.xmlxperts.com/12083xml.htm
17/07/2015
toto
151
DTD
• Il existe plusieurs DTD :
- ISO 12083,
http://www.xmlxperts.com/12083xml.htm
- ISO 12083 pour les monographies et les imprimés,
http://www.xmlxperts.com/xmlbookdtd.htm
17/07/2015
toto
152
DTD
• Il existe plusieurs DTD :
- ISO 12083,
http://www.xmlxperts.com/12083xml.htm
- ISO 12083 pour les monographies et les imprimés,
http://www.xmlxperts.com/xmlbookdtd.htm
- ISO 12083 pour les périodiques,
http://www.xmlxperts.com/xmlserialdtd.htm
17/07/2015
toto
153
DTD
• Il existe plusieurs DTD :
- ISO 12083,
http://www.xmlxperts.com/12083xml.htm
- ISO 12083 pour les monographies et les imprimés,
http://www.xmlxperts.com/xmlbookdtd.htm
- ISO 12083 pour les périodiques,
http://www.xmlxperts.com/xmlserialdtd.htm
- ISO 12083 pour les articles de périodiques,
http://www.xmlxperts.com/xmlarticledtd.htm
17/07/2015
toto
154
DTD
• Il existe plusieurs DTD :
- ISO 12083,
http://www.xmlxperts.com/12083xml.htm
- ISO 12083 pour les monographies et les imprimés,
http://www.xmlxperts.com/xmlbookdtd.htm
- ISO 12083 pour les périodiques,
http://www.xmlxperts.com/xmlserialdtd.htm
- ISO 12083 pour les articles de périodiques,
http://www.xmlxperts.com/xmlarticledtd.htm
- ISO 12083 pour les formules mathématiques,
17/07/2015
toto
http://www.xmlxperts.com/xmlmathdtd.htm
155
• et aussi :
DTD
- TEI (Text Encoding Initiative) pour le traitement des textes
publiés sous forme électronique, notamment en sciences
humaines et en linguistique,
http://www.tei-c.org
17/07/2015
toto
156
• et aussi :
DTD
- TEI (Text Encoding Initiative) pour le traitement des textes
publiés sous forme électronique, notamment en sciences
humaines et en linguistique,
http://www.tei-c.org
- EAD (Encoded Archival Description) pour le traitement des
fonds d’archives et des collections spécialisées,
http://lcweb.loc.gov/ead/
17/07/2015
toto
157
• et aussi :
DTD
- TEI (Text Encoding Initiative) pour le traitement des textes
publiés sous forme électronique, notamment en sciences
humaines et en linguistique,
http://www.tei-c.org
- EAD (Encoded Archival Description) pour le traitement des
fonds d’archives et des collections spécialisées,
http://lcweb.loc.gov/ead/
- EBIND pour lier les métadonnées au document numérique,
http://sunsite.berkeley.edu/Ebind
17/07/2015
toto
158
• et aussi :
DTD
- TEI (Text Encoding Initiative) pour le traitement des textes
publiés sous forme électronique, notamment en sciences
humaines et en linguistique,
http://www.tei-c.org
- EAD (Encoded Archival Description) pour le traitement des
fonds d’archives et des collections spécialisées,
http://lcweb.loc.gov/ead/
- EBIND pour lier les métadonnées au document numérique,
http://sunsite.berkeley.edu/Ebind
- MASTER pour les manuscrits médiévaux,
http://www.cta.dmu.ac.uk/projects/master/
17/07/2015
toto
159
• et encore :
DTD
- XMLMARC,
http://xmlmarc.stanford.edu/
17/07/2015
toto
160
• et encore :
DTD
- XMLMARC,
http://xmlmarc.stanford.edu/
- DTD USMARC,
http://lcweb.loc.gov/marc/marcdtd/marcdtdback.htm
17/07/2015
toto
161
• et encore :
DTD
- XMLMARC,
http://xmlmarc.stanford.edu/
- DTD USMARC,
http://lcweb.loc.gov/marc/marcdtd/marcdtdback.htm
- DTD Unimarc BiblioML (bibliographique et autorités),
http://www.culture.fr/BiblioML.
17/07/2015
toto
162
DTD
• et encore :
- XMLMARC,
http://xmlmarc.stanford.edu/
- DTD USMARC,
http://lcweb.loc.gov/marc/marcdtd/marcdtdback.htm
- DTD Unimarc BiblioML (bibliographique et autorités),
http://www.culture.fr/BiblioML.
- ONIX
http://www.editeur.org/onix.html
17/07/2015
toto
163
DTD
• et encore :
- XMLMARC,
http://xmlmarc.stanford.edu/
- DTD USMARC,
http://lcweb.loc.gov/marc/marcdtd/marcdtdback.htm
- DTD Unimarc BiblioML (bibliographique et autorités),
http://www.culture.fr/BiblioML.
- ONIX
http://www.editeur.org/onix.html
- DocBook
etc.
17/07/2015
http://www.docbook.org/
toto
164
TEI
ISO 12083
1998
17/07/2015nationale de France
Bibliothèque
toto
165
ISO 12083
TEI
• Norme internationale,
17/07/2015nationale de France
Bibliothèque
toto
166
ISO 12083
TEI
• Norme internationale,
• La DTD ISO 12083 a délibérément été conçue dans une
optique générale, afin de permettre la création de DTD plus
spécifiques,
17/07/2015nationale de France
Bibliothèque
toto
167
ISO 12083
TEI
• Norme internationale,
• La DTD ISO 12083 a délibérément été conçue dans une
optique générale, afin de permettre la création de DTD plus
spécifiques,
• C’est un document de référence pour faciliter l’échange et
l’archivage de divers types de publications,
17/07/2015nationale de France
Bibliothèque
toto
168
ISO 12083
TEI
• Norme internationale,
• La DTD ISO 12083 a délibérément été conçue dans une
optique générale, afin de permettre la création de DTD plus
spécifiques,
• C’est un document de référence pour faciliter l’échange et
l’archivage de divers types de publications,
• Le principe d’ISO 12083 est de fournir un jeu d’éléments qui
permettent la structuration d’ouvrages imprimés, de
périodiques, d’articles sous forme imprimée ou électronique.
17/07/2015nationale de France
Bibliothèque
toto
169
APPLICATIONS
ISO
12083
TEI
• Université Laval (ouvrages français),
http://www.bibl.ulaval.ca/doelec/pul/
17/07/2015nationale de France
Bibliothèque
toto
170
APPLICATIONS
ISO
12083
TEI
• Université Laval (ouvrages français),
http://www.bibl.ulaval.ca/doelec/pul/
• Université de Montréal,
http://mapageweb.umontreal.ca/marcoux/grds/martintd/index.html
17/07/2015nationale de France
Bibliothèque
toto
171
APPLICATIONS
ISO
12083
TEI
• Université Laval (ouvrages français),
http://www.bibl.ulaval.ca/doelec/pul/
• Université de Montréal,
http://mapageweb.umontreal.ca/marcoux/grds/martintd/index.html
• SUNET (Swedish University NETwork),
http://ftp.unet.se/pub/etext/ota/TEI/software/docs/SGMLinfo/I
17/07/2015nationale de France
toto
172
Bibliothèque
CADDiso.html
TEI
TEI
TEXT ENCODING INITIATIVE
1990
17/07/2015nationale de France
Bibliothèque
toto
173
TEI
• DTD basée sur SGML créée en 1988 pour la linguistique et
la recherche en sciences humaines ; traduite en XML,
17/07/2015
toto
174
TEI
• DTD basée sur SGML créée en 1988 pour la linguistique et
la recherche en sciences humaines ; traduite en XML,
• Méthode de balisage de textes manuscrits, dactylographiés
ou saisis sous forme électronique pour leur utilisation par
des chercheurs,
17/07/2015
toto
175
TEI
• DTD basée sur SGML créée en 1988 pour la linguistique et
la recherche en sciences humaines ; traduite en XML,
• Méthode de balisage de textes manuscrits, dactylographiés
ou saisis sous forme électronique pour leur utilisation par
des chercheurs,
• Balisage permettant de caractériser les variantes de texte
ou les variantes d’édition,
17/07/2015
toto
176
TEI
• DTD basée sur SGML créée en 1988 pour la linguistique et
la recherche en sciences humaines ; traduite en XML,
• Méthode de balisage de textes manuscrits, dactylographiés
ou saisis sous forme électronique pour leur utilisation par
des chercheurs,
• Balisage permettant de caractériser les variantes de texte
ou les variantes d’édition,
• Permet au chercheur de travailler en texte intégral.
17/07/2015
toto
177
TEI
• TEI (Text Encoding Initiative),
http://www.uic.edu/orgs/tei/
17/07/2015
toto
178
TEI
• TEI (Text Encoding Initiative),
http://www.uic.edu/orgs/tei/
• TEI Consortium,
http://www.tei-c.org
17/07/2015
toto
179
TEI
• TEI (Text Encoding Initiative),
http://www.uic.edu/orgs/tei/
• TEI Consortium,
http://www.tei-c.org
• TEI simplifiée,
http://www.emn.fr/perso/fekete/TEI/tei2latex/teiu5.fr.html
17/07/2015
toto
180
APPLICATIONS TEI
• Electronic Text Archive, Leiden,
http://www.etal.nl/goldenage
17/07/2015
toto
181
APPLICATIONS TEI
• Electronic Text Archive, Leiden,
http://www.etal.nl/goldenage
• Kolb Proust Archive, Univerty of Illinois,
http://www.library.uiuc.edu/kolbp
17/07/2015
toto
182
APPLICATIONS TEI
• Electronic Text Archive, Leiden,
http://www.etal.nl/goldenage
• Kolb Proust Archive, Univerty of Illinois,
http://www.library.uiuc.edu/kolbp
• Oxford University,
http://www.voltaire.ox.ac.uk
17/07/2015
toto
183
APPLICATIONS TEI
• Electronic Text Archive, Leiden,
http://www.etal.nl/goldenage
• Kolb Proust Archive, Univerty of Illinois,
http://www.library.uiuc.edu/kolbp
• Oxford University,
http://www.voltaire.ox.ac.uk
• Laboratoire LOrrain de Recherche en Informatique et ses
Applications,
http://www.loria.fr/Projet/Silfide
17/07/2015
toto
184
EAD
ENCODED ARCHIVAL DESCRIPTION
(= Description archivistique encodée)
1998
17/07/2015
toto
185
GENÈSE DE L’EAD
• Convergence entre les archivistes et les bibliothécaires nord-américains,
17/07/2015
toto
186
GENÈSE DE L’EAD
• Convergence entre les archivistes et les bibliothécaires nord-américains,
• Origine :
- remplacement du format MARC-AMC (Archival and Manuscript Control) ,
- recherche d’un format permettant de restituer la structure hiérarchique des
collections d’archives, manuscrits, papiers, estampes, photographies, cartes,
monnaies, enregistrements sonores, films, etc.,
- DTD initiée par la Bibliothèque de l’Université de Berkeley pour la Society
of American Archivists en 1993,
17/07/2015
toto
187
GENÈSE DE L’EAD
• Convergence entre les archivistes et les bibliothécaires nord-américains,
• Origine :
- remplacement du format MARC-AMC (Archival and Manuscript Control) ,
- recherche d’un format permettant de restituer la structure hiérarchique des
collections d’archives, manuscrits, papiers, estampes, photographies, cartes,
monnaies, enregistrements sonores, films, etc.,
- DTD initiée par la Bibliothèque de l’Université de Berkeley pour la Society
of American Archivists en 1993,
• Groupe de travail (SAA Committee on Archival Information Exchange)
réunissant la Bibliothèque du Congrès, RLG, OCLC, le Public Records
Office qui a produit une version bêta en octobre 1996 ; version 1.0 de juin
1998,
17/07/2015
toto
188
GENÈSE DE L’EAD
• Convergence entre les archivistes et les bibliothécaires nord-américains,
• Origine :
- remplacement du format MARC-AMC (Archival and Manuscript Control) ,
- recherche d’un format permettant de restituer la structure hiérarchique des
collections d’archives, manuscrits, papiers, estampes, photographies, cartes,
monnaies, enregistrements sonores, films, etc.,
- DTD initiée par la Bibliothèque de l’Université de Berkeley pour la Society
of American Archivists en 1993,
• Groupe de travail (SAA Committee on Archival Information Exchange)
réunissant la Bibliothèque du Congrès, RLG, OCLC, le Public Records
Office qui a produit une version bêta en octobre 1996 ; version 1.0 de juin
1998,
• Standard maintenu par le Library of Congress Development and Marc
Standards
Office, ce qui garantit la compatibilité
avec les formats MARC.
17/07/2015
toto
189
EAD
• DTD SGML traduite en XML en octobre 1999,
17/07/2015
toto
190
EAD
• DTD SGML traduite en XML en octobre 1999,
• Groupe de travail francophone sur l’EAD (janvier 2000),
17/07/2015
toto
191
EAD
• DTD SGML traduite en XML en octobre 1999,
• Groupe de travail francophone sur l’EAD (janvier 2000),
• Traduction française en cours depuis mai 2000 du guide
d’application et de la bibliothèque des balises par un
groupe de travail AFNOR (CG 46/CN 357, « Modélisation,
production et accès aux documents »).
17/07/2015
toto
192
EAD
• DTD SGML traduite en XML en octobre 1999,
• Groupe de travail francophone sur l’EAD (janvier 2000),
• Traduction française en cours depuis mai 2000 du guide
d’application et de la bibliothèque des balises par un
groupe de travail AFNOR (CG 46/CN 357, « Modélisation,
production et accès aux documents »).
• Le guide d’application et la bibliothèque des balises de
l’EAD décrivent les éléments balisés à utiliser, leur contenu,
leurs attributs et les valeurs de ces attributs, ainsi que
l’ordre de saisie des éléments et les emboîtements requis.
17/07/2015
toto
193
EAD
• Type TEI : en-tête et corps de l’instrument de recherche,
17/07/2015
toto
194
EAD
• Type TEI : en-tête et corps de l’instrument de recherche,
• Description en 12 niveaux hiérarchiques d’arborescence
possibles avec les mêmes éléments de description,
17/07/2015
toto
195
EAD
• Type TEI : en-tête et corps de l’instrument de recherche,
• Description en 12 niveaux hiérarchiques d’arborescence
possibles avec les mêmes éléments de description,
• Utilisation possible de toutes les balises à chaque niveau de
l’arborescence sans redondance des informations,
17/07/2015
toto
196
EAD
• Type TEI : en-tête et corps de l’instrument de recherche,
• Description en 12 niveaux hiérarchiques d’arborescence
possibles avec les mêmes éléments de description,
• Utilisation possible de toutes les balises à chaque niveau de
l’arborescence sans redondance des informations,
• DTD conçue pour encoder les instruments de recherche et les
fonds spécialisés qui permet :
- de considérer un fonds comme un « super document »,
17/07/2015
toto
197
EAD
• Type TEI : en-tête et corps de l’instrument de recherche,
• Description en 12 niveaux hiérarchiques d’arborescence
possibles avec les mêmes éléments de description,
• Utilisation possible de toutes les balises à chaque niveau de
l’arborescence sans redondance des informations,
• DTD conçue pour encoder les instruments de recherche et les
fonds spécialisés qui permet :
- de considérer un fonds comme un « super document »,
- la présentation de descriptions longues et emboîtées,
17/07/2015
toto
198
EAD
• Type TEI : en-tête et corps de l’instrument de recherche,
• Description en 12 niveaux hiérarchiques d’arborescence
possibles avec les mêmes éléments de description,
• Utilisation possible de toutes les balises à chaque niveau de
l’arborescence sans redondance des informations,
• DTD conçue pour encoder les instruments de recherche et les
fonds spécialisés qui permet :
- de considérer un fonds comme un « super document »,
- la présentation de descriptions longues et emboîtées,
- la description à 12 niveaux,
17/07/2015
toto
199
EAD
• Type TEI : en-tête et corps de l’instrument de recherche,
• Description en 12 niveaux hiérarchiques d’arborescence
possibles avec les mêmes éléments de description,
• Utilisation possible de toutes les balises à chaque niveau de
l’arborescence sans redondance des informations,
• DTD conçue pour encoder les instruments de recherche et les
fonds spécialisés qui permet :
- de considérer un fonds comme un « super document »,
- la présentation de descriptions longues et emboîtées,
- la description à 12 niveaux,
- une grande finesse de recherche : chaque élément balisé est
indexable et la recherche en texte intégral est possible sur
17/07/2015
200
l’ensemble du document, toto
CARACTÉRISTIQUES DE L’EAD
• DTD adaptée au traitement de fonds de tous types : imprimés, papiers,
objets, documents « spécialisés » (« special collections »), etc.
17/07/2015
toto
201
CARACTÉRISTIQUES DE L’EAD
• DTD adaptée au traitement de fonds de tous types : imprimés, papiers,
objets, documents « spécialisés » (« special collections »), etc.
• Utilisée par les Archives, les Bibliothèques et les Musées
- pour la description « d’archives » au sens anglo-saxon, c’est-à-dire
pratiquement toute collection hiérarchisée de documents,
- pour la recherche dans des applications Web.
17/07/2015
toto
202
CARACTÉRISTIQUES DE L’EAD
• DTD adaptée au traitement de fonds de tous types : imprimés, papiers,
objets, documents « spécialisés » (« special collections »), etc.
• Utilisée par les Archives, les Bibliothèques et les Musées
- pour la description « d’archives » au sens anglo-saxon, c’est-à-dire
pratiquement toute collection hiérarchisée de documents,
- pour la recherche dans des applications Web.
• Pas de limite de taille pour un instrument de recherche encodé en EAD,
17/07/2015
toto
203
CARACTÉRISTIQUES DE L’EAD
• DTD adaptée au traitement de fonds de tous types : imprimés, papiers,
objets, documents « spécialisés » (« special collections »), etc.
• Utilisée par les Archives, les Bibliothèques et les Musées
- pour la description « d’archives » au sens anglo-saxon, c’est-à-dire
pratiquement toute collection hiérarchisée de documents,
- pour la recherche dans des applications Web.
• Pas de limite de taille pour un instrument de recherche encodé en EAD,
• Attribut "ENCODINGANALOG" = lien avec fichiers d’autorités
(MARC21 ou autres formats MARC) et autres formats de thesauri
(LCSH, Getty, Rameau, Garnier, etc.),
17/07/2015
toto
204
CARACTÉRISTIQUES DE L’EAD
• DTD adaptée au traitement de fonds de tous types : imprimés, papiers,
objets, documents « spécialisés » (« special collections »), etc.
• Utilisée par les Archives, les Bibliothèques et les Musées
- pour la description « d’archives » au sens anglo-saxon, c’est-à-dire
pratiquement toute collection hiérarchisée de documents,
- pour la recherche dans des applications Web.
• Pas de limite de taille pour un instrument de recherche encodé en EAD,
• Attribut "ENCODINGANALOG" = lien avec fichiers d’autorités
(MARC21 ou autres formats MARC) et autres formats de thesauri
(LCSH, Getty, Rameau, Garnier, etc.),
• Élément <dao> = lien avec ressources électroniques distantes,
17/07/2015
toto
205
CARACTÉRISTIQUES DE L’EAD
• DTD adaptée au traitement de fonds de tous types : imprimés, papiers,
objets, documents « spécialisés » (« special collections »), etc.
• Utilisée par les Archives, les Bibliothèques et les Musées
- pour la description « d’archives » au sens anglo-saxon, c’est-à-dire
pratiquement toute collection hiérarchisée de documents,
- pour la recherche dans des applications Web.
• Pas de limite de taille pour un instrument de recherche encodé en EAD,
• Attribut "ENCODINGANALOG" = lien avec fichiers d’autorités
(MARC21 ou autres formats MARC) et autres formats de thesauri
(LCSH, Getty, Rameau, Garnier, etc.),
• Élément <dao> = lien avec ressources électroniques distantes,
• EAD contient la notion de balises englobantes, ce qui permet de
représenter une structure hiérarchisée et d’en réaliser la description à
17/07/2015niveaux si nécessaire.
toto
206
plusieurs
<archdesc>
STRUCTURE DE L’EAD
<dsc type ="combined">
<head> NOUVELLES ACQUISITIONS FRANÇAISES 1972-1986 </head>
<c01><did> 16444-16466. Commandant Esterhazy et Paul Desachy. Papiers…</did>
<c02 level="series"><did> I.  Commandant Esterhazy…</did>
<c03><did> I (16444). Mémoires du commandant Esterhazy…</did>
<c04><did> F. 1-53. Sur sa jeunesse…</did></c04>
<c04><did> F. 54-344. Octobre 1897…</did></c04>
….
</c03>
<c03><did> II (16445). Interviews…</did>
<c04><did> F. 1-6. Lettre-récit…</did></c04>
<c04><did> F. 7-16. Projets de déposition…</did></c04>
…
</c03>
<c03><did> III-VIII (16446-16451). Lettres adressées…</did>
<c04><did> III (16446). Lettres adressées… avant 1897…</did></c04>
<c04><did> IV-VIII (16447-16457). Lettres adressées… avant 1897…</did>
<c05><did> IV (16447). Abeniacar - Buchan</did></c05>
…
<c05><did> VIII (16451). Ray – Wilson</did></c05>
17/07/2015
toto
</c04>
207
EAD
• Page d’accueil de la DTD EAD :
http://lcweb.loc.gov/ead/
17/07/2015
toto
208
EAD
• Page d’accueil de la DTD EAD :
http://lcweb.loc.gov/ead/
• Projet européen MALVINE (MAnuscripts and Letters Via
Integrated Networks in Europe) (participation française de
l’ITEM) :
http://helmer.hit.uib.no/malvine/EAD/page.html
17/07/2015
toto
209
APPLICATIONS EAD
• Université de Californie à Berkeley,
http://sunsite.berkeley.edu/FindingAids/EAD/bfac.html
17/07/2015
toto
210
APPLICATIONS EAD
• Université de Californie à Berkeley,
http://sunsite.berkeley.edu/FindingAids/EAD/bfac.html
• Université Cornell,
http://www.cornell.edu/
17/07/2015
toto
211
APPLICATIONS EAD
• Université de Californie à Berkeley,
http://sunsite.berkeley.edu/FindingAids/EAD/bfac.html
• Université Cornell,
http://www.cornell.edu/
• Library of Congress. Development of the EAD DTD,
http://www.loc.gov/ead/eadback.html
17/07/2015
toto
212
APPLICATIONS EAD
• Université de Californie à Berkeley,
http://sunsite.berkeley.edu/FindingAids/EAD/bfac.html
• Université Cornell,
http://www.cornell.edu/
• Library of Congress. Development of the EAD DTD,
http://www.loc.gov/ead/eadback.html
• New York Public Library
http://www.nypl.org
17/07/2015
toto
213
APPLICATIONS EAD
• Université de Californie à Berkeley,
http://sunsite.berkeley.edu/FindingAids/EAD/bfac.html
• Université Cornell,
http://www.cornell.edu/
• Library of Congress. Development of the EAD DTD,
http://www.loc.gov/ead/eadback.html
• New York Public Library
http://www.nypl.org
• Université de Virginie,
jefferson.village.virginia.edu/ead/
17/07/2015
toto
214
APPLICATIONS EAD
• Université de Californie à Berkeley,
http://sunsite.berkeley.edu/FindingAids/EAD/bfac.html
• Université Cornell,
http://www.cornell.edu/
• Library of Congress. Development of the EAD DTD,
http://www.loc.gov/ead/eadback.html
• New York Public Library
http://www.nypl.org
• Université de Virginie,
jefferson.village.virginia.edu/ead/
• EAD Working Group,
http://sunsite.berkeley.edu/FindingAids/EAD/eadwg.html
17/07/2015
toto
215
L’EAD EN FRANCE
• 1999 : avec le soutien financier de la Mission de la
recherche et de la technologie du ministère de la Culture,
conversion en EAD d’un inventaire des Archives des
Pyrénées-Orientales,
17/07/2015
toto
216
L’EAD EN FRANCE
• 1999 : avec le soutien financier de la Mission de la
recherche et de la technologie du ministère de la Culture,
conversion en EAD d’un inventaire des Archives des
Pyrénées-Orientales,
• 2000 : Groupe de travail francophone sur l’EAD (janvier),
17/07/2015
toto
217
L’EAD EN FRANCE
• 1999 : avec le soutien financier de la Mission de la
recherche et de la technologie du ministère de la Culture,
conversion en EAD d’un inventaire des Archives des
Pyrénées-Orientales,
• 2000 : Groupe de travail francophone sur l’EAD (janvier),
• Traduction française (mai) du guide d’application et de la
bibliothèque des balises par un groupe de travail AFNOR
(CG 46/CN 357, « Modélisation, production et accès aux documents »).
17/07/2015
toto
218
L’EAD EN FRANCE
• 1999 : avec le soutien financier de la Mission de la
recherche et de la technologie du ministère de la Culture,
conversion en EAD d’un inventaire des Archives des
Pyrénées-Orientales,
• 2000 : Groupe de travail francophone sur l’EAD (janvier),
• Traduction française (mai) du guide d’application et de la
bibliothèque des balises par un groupe de travail AFNOR
(CG 46/CN 357, « Modélisation, production et accès aux documents »).
- L’EAD n’étant pas encore un standard validé au plan international, le
groupe de traduction a noté certaines imprécisions de l’EAD pour les
documents spécialisés et a proposé de nombreux ajouts et modifications à
la SAA qui les a acceptés pour la plupart, permettant ainsi à l’EAD d’être
mieux adaptée aux pratiques françaises des bibliothèques, archives,
centres de documentation et musées.
17/07/2015
toto
219
L’EAD EN FRANCE
• 2000 : La Mission de la recherche et de la technologie fait
développer la DTD BiblioML à partir des formats Unimarc
bibliographique et d’autorités,
17/07/2015
toto
220
L’EAD EN FRANCE
• 2000 : La Mission de la recherche et de la technologie fait
développer la DTD BiblioML à partir des formats Unimarc
bibliographique et d’autorités,
• - À la BNF, conversion des données en EAD, structuration en
XML du dernier volume paru des Nouvelles acquisitions
françaises (NAF) et création d’une feuille de style pour
l’affichage sur écran ; le projet comporte en outre l’ajout des
textes et des images libres de droits disponibles sur Gallica, des
ektachromes et clichés noir et blanc numérisés et le
chargement sur le site Web de la BNF,
17/07/2015
toto
221
L’EAD EN FRANCE
• 2000 : La Mission de la recherche et de la technologie fait
développer la DTD BiblioML à partir des formats Unimarc
bibliographique et d’autorités,
• - À la BNF, conversion des données en EAD, structuration en
XML du dernier volume paru des Nouvelles acquisitions
françaises (NAF) et création d’une feuille de style pour
l’affichage sur écran ; le projet comporte en outre l’ajout des
textes et des images libres de droits disponibles sur Gallica, des
ektachromes et clichés noir et blanc numérisés et le
chargement sur le site Web de la BNF,
• - Études menées par l’INHA sur une éventuelle utilisation de
EAD et XML.
17/07/2015
toto
222
L’EAD EN FRANCE
• 2001 : le DOSI du ministère de la Culture fait développer
pour les Archives de France un outil de saisie EAD XML
d’après les spécifications d’un CCTP rédigé à l’automne 2000,
17/07/2015
toto
223
L’EAD EN FRANCE
• 2001 : le DOSI du ministère de la Culture fait développer
pour les Archives de France un outil de saisie EAD XML
d’après les spécifications d’un CCTP rédigé à l’automne 2000,
• Projets en cours de conception ou de réalisation :
- Direction des Archives de France,
- Centre historique des archives nationales (Archives
privées),
- Bibliothèque nationale de France,
- Direction du livre et de la lecture,
- Bibliothèque de l’Institut de France,
- Fondation Napoléon (Conseil d’État),
- Bibliothèque de l’Institut Pasteur,
- Centre de documentation du Musée du Louvre,
- IMEC, etc.
17/07/2015
toto
224
EAD ET MARC
• Aucune incompatibilité fonctionnelle entre EAD et les
formats MARC,
17/07/2015
toto
225
EAD ET MARC
• Aucune incompatibilité fonctionnelle entre EAD et les
formats MARC,
• Complémentarité entre EAD-XML et MARC :
17/07/2015
toto
226
EAD ET MARC
• Aucune incompatibilité fonctionnelle entre EAD et les
formats MARC,
• Complémentarité entre EAD-XML et MARC :
- puissance de la structure logique de XML et son
arborescence a priori infinie,
17/07/2015
toto
227
EAD ET MARC
• Aucune incompatibilité fonctionnelle entre EAD et les
formats MARC,
• Complémentarité entre EAD-XML et MARC :
- puissance de la structure logique de XML et son
arborescence a priori infinie,
- précision de la structure logique de l’EAD et de son
arborescence à 12 niveaux,
17/07/2015
toto
228
EAD ET MARC
• Aucune incompatibilité fonctionnelle entre EAD et les
formats MARC,
• Complémentarité entre EAD-XML et MARC :
- puissance de la structure logique de XML et son
arborescence a priori infinie,
- précision de la structure logique de l’EAD et de son
arborescence à 12 niveaux,
- netteté de l’aspect sémantique de MARC (999 zones
possibles, mais arborescence à 2 niveaux seulement : zones,
sous-zones).
17/07/2015
toto
229
EAD ET MARC
• Pour les bibliothèques, possibilité d’ajouter un en-tête EAD
(notamment pour la gestion des droits) à des notices MARC
liées à des fichiers d’autorité pour obtenir un système
d’interrogation structuré en XML, ce qui permet l’affichage
simultané des ressources numériques,
17/07/2015
toto
230
EAD ET MARC
• Pour les bibliothèques, possibilité d’ajouter un en-tête EAD
(notamment pour la gestion des droits) à des notices MARC
liées à des fichiers d’autorité pour obtenir un système
d’interrogation structuré en XML, ce qui permet l’affichage
simultané des ressources numériques,
• Le schéma XML est une voie à explorer pour les
bibliothèques : il permet l’utilisation de plusieurs DTD dans le
même document XML.
17/07/2015
toto
231
EAD ET MARC
• MARC-PM (Machine Readable Cataloguing Perl Module) :
http://marcpm.sourceforge.net/
17/07/2015
toto
232
EAD ET MARC
• MARC-PM (Machine Readable Cataloguing Perl Module) :
http://marcpm.sourceforge.net/
• MARC-PM :
http://marcpm.sourceforge.net/documentation/marc::xml/
MARC-XML.htm
17/07/2015
toto
233
EAD ET MARC
• MARC-PM (Machine Readable Cataloguing Perl Module) :
http://marcpm.sourceforge.net/
• MARC-PM :
http://marcpm.sourceforge.net/documentation/marc::xml/
MARC-XML.htm
• Library of Congress :
http://lcweb.loc.gov/marc/marcsgml.html
17/07/2015
toto
234
ONIX ET MARC :
Enregistrement UNIMARC
000
NNNNnam# 22NNNNN2n 450
001
1234567890
010
##
$a 0816016356$bhardback$d35.00 USD
100
##
$a YYYYMMDD 1987 m eng 01
101
##
$a EN
200
#1
$a British English, A-Zed
205
##
$a Edition 3
210
##
$c Facts on file publications$d1987
215
##
$a 493 p.$d9.25 x 6.25 x 1.2
330
##
$a BRITISH ENGLISH, A TO ZED is the thoroughly updated, revised, and expanded
third edition of Norman Schur’s highly acclaimed transatlantic dictionary for English speakers. First
published as BRITISH SELF-TAUGHT and then as ENGLISH ENGLISH, this collection of Briticisms
for Americans, and Americanisms for the British, is a scholarly yet witty lexicon, combining definitions
with commentary on the most frequently used and some lesser known words and phrases. Highly
readable, it’s a snip of a book, and one that sorts out – through comments in American – the “Queen’s
English” – confounding as it may seem
700
#1
$a Schur$bNorman W$4070
886
2#
$a A Harvard graduate in Latin and Italian literature, Norman Schur attended the
University of Rome and the Sorbonne before returning to the United States to study law at Harvard and
Columbia
Law Schools. Now retired from legal practice,
Mr Schur is a fluent speaker and writer
17/07/2015
toto
235of both
British and American English
ONIX ET MARC :
17/07/2015
<product>
<a001>1234567890</a001>
<a002>03</a002>
<b004>0816016356</b004>
<b012>BB</b012>
<b028>British English, A to Zed</b028>
<contributor>
<b035>A01</b035>
<b037>Schur, Norman W</b037>
<b044>A Harvard graduate in Latin and Italian literature, Norman Schur […] is a
fluent speaker and writer of both British and American English </b044>
</contributor>
<b056>REV</b056>
<b057>3</b057>
<b059>EN</b059>
<b061>493</b061>
<b064>REF008000</b064>
<b073>01</b073>
<b079>Facts on File Publications</b079>
<b081>Facts on File Inc</b081>
<b003>1987</b003>
<c096>9.25</c096>
<c097>6.25</c097>
<c098>1.2</c098>
<d101>BRITISH ENGLISH, A TO ZED is the thoroughly updated, […] in
American – the “Queen’s English” – confounding as it may seem.</d101>
<supplydetail>
<price>
<j151>35.00</j151>
</price>
toto
236
</supplydetail>
</product>
EAD ET MARC :
FORMAT MARC
DTD EAD
999 zones descriptives
160 zones descriptives
12 niveaux
2 niveaux (zone, sous-zone)
FONDS
PIÈCES
RECUEILS
17/07/2015
toto
237
DANS UN SCHÉMA XML :
DTD MARC
999 zones descriptives
FONDS
DTD EAD
12 niveaux
PIÈCES
RECUEILS
17/07/2015
IMAGES
TEXTES EN MODE IMAGE
totoTEXTES EN MODE TEXTE
238