Transcript EAD-XML
FULBI 26 SEPTEMBRE 2002 De MARC à MARKUP Pierre-Yves Duchemin [email protected] 17/07/2015 toto 2 FULBI 26 SEPTEMBRE 2002 De MARC à MARKUP ou « There is a life beyond MARC… » Pierre-Yves Duchemin [email protected] 17/07/2015 toto 3 VERS UNE NOUVELLE VISION DU CATALOGUE ET DU RÔLE DE LA BIBLIOTHÈQUE • L’évolution des accès publics en ligne et l’enrichissement des catalogues, • Structuration électronique de documents, • Métadonnées et Dublin Core, • Formats de structuration électronique : SGML, HTML, XML, • XSL, RDF, • L’impact dans les bibliothèques, • Qu’est-ce qu’une DTD ? • DTD : ISO 12083, TEI, EBIND, MASTER, EAD, • EAD en France, • EAD et MARC, • ONIX et MARC, 17/07/2015 toto 4 • Le schéma XML. LE CONTEXTE • Constat : les normes bibliothéconomiques actuelles, les outils informatiques disponibles centrés sur la gestion de l'information secondaire ne sont pas adaptés à la gestion de la documentation numérique. 17/07/2015 toto 5 LE CONTEXTE • Constat : les normes bibliothéconomiques actuelles, les outils informatiques disponibles centrés sur la gestion de l'information secondaire ne sont pas adaptés à la gestion de la documentation numérique. • Le dispositif institutionnel et la culture professionnelle, s’ils permettent la gestion de l’existant, n'anticipent pas sur l'avenir et ne permettent pas de le préparer convenablement. 17/07/2015 toto 6 LE CONTEXTE • Constat : les normes bibliothéconomiques actuelles, les outils informatiques disponibles centrés sur la gestion de l'information secondaire ne sont pas adaptés à la gestion de la documentation numérique. • Le dispositif institutionnel et la culture professionnelle, s’ils permettent la gestion de l’existant, n'anticipent pas sur l'avenir et ne permettent pas de le préparer convenablement. • Cette situation pose la question de la construction des outils, celle des contenus et celle de la méthode de construction de ces outils et de ces contenus. Elle mêle étroitement choix techniques, choix des normes, choix informatique, politique de formation et intervention déterminée sur les enjeux de l'accès au savoir dans une société dite de l’information, qui, en17/07/2015 réalité, met méthodiquement toto en place verrous et péages. 7 LE CONTEXTE • Les SIGB actuels, articulés autour des formats de la famille MARC, de l’information secondaire (description bibliographique et indexation) et de la gestion des exemplaires physiques ne sont pas adaptés à la gestion des documents numériques : le champ 856 de MARC21 et d’UNIMARC est une tentative de solution pour établir un lien entre le SIGB et le système de GED . 17/07/2015 toto 8 LE CONTEXTE • Les SIGB actuels, articulés autour des formats de la famille MARC, de l’information secondaire (description bibliographique et indexation) et de la gestion des exemplaires physiques ne sont pas adaptés à la gestion des documents numériques : le champ 856 de MARC21 et d’UNIMARC est une tentative de solution pour établir un lien entre le SIGB et le système de GED . • Les propositions d'évolution des SIGB ne manqueront pas, mais est-ce vraiment dans ce sens que les solutions doivent être recherchées ? 17/07/2015 toto 9 LE CONTEXTE • La mise en œuvre de nouveaux systèmes de gestion autour de normes et standards qui ne sont pas spécifiques aux bibliothèques (du type XML et plus largement standards du Web) et de nouvelles fonctionnalités, pose la question de l’intégration de systèmes hétérogènes dans un système d’information offrant à l’utilisateur une vue unique sur les données et un accès transparent. On passe du système intégré à l’intégration de systèmes. 17/07/2015 toto 10 LE CONTEXTE • La mise en œuvre de nouveaux systèmes de gestion autour de normes et standards qui ne sont pas spécifiques aux bibliothèques (du type XML et plus largement standards du Web) et de nouvelles fonctionnalités, pose la question de l’intégration de systèmes hétérogènes dans un système d’information offrant à l’utilisateur une vue unique sur les données et un accès transparent. On passe du système intégré à l’intégration de systèmes. • On ne saurait cependant se contenter de voir dans ce processus une simple (r)évolution technique supplémentaire. La multiplicité des applications de XML et des DTD montre que les enjeux portent - ou sont susceptibles de porter - sur l’ensemble des domaines documentaires et culturels, et donnent une nouvelle actualité, sous le concept de convergence, d’interopérabilité et d’accès universel au document, aux recherches de synergies qui ont marqué les entreprises de normalisation et de structuration des données aux différentes étapes de leur histoire. 17/07/2015 toto 11 LE CONTEXTE • L’Internet et le Web, en permettant la disponibilité simultanée des ressources primaires, du catalogue ou des métadonnées et des instruments de navigation grâce à l’utilisation des mêmes standards et des mêmes outils informatiques de gestion, d’indexation et d’utilisation, offrent pour la première fois aux bibliothèques, archives, musées et centres de documentation, la possibilité d’envisager d’utiliser des standards communs permettant l’échange de données ou leur juxtaposition sur un site Web. 17/07/2015 toto 12 LE CONTEXTE • L’Internet et le Web, en permettant la disponibilité simultanée des ressources primaires, du catalogue ou des métadonnées et des instruments de navigation grâce à l’utilisation des mêmes standards et des mêmes outils informatiques de gestion, d’indexation et d’utilisation, offrent pour la première fois aux bibliothèques, archives, musées et centres de documentation, la possibilité d’envisager d’utiliser des standards communs permettant l’échange de données ou leur juxtaposition sur un site Web. • XML, XSL, DTD, métadonnées... La littérature professionnelle fait sans cesse depuis plusieurs mois référence à ces termes, sans pour autant réellement donner les moyens d'en comprendre les tenants et les aboutissants. 17/07/2015 toto 13 LE CONTEXTE • Il est vrai que les horizons ouverts par XML sont larges et donc difficiles à cerner. 17/07/2015 toto 14 LE CONTEXTE • Il est vrai que les horizons ouverts par XML sont larges et donc difficiles à cerner. • XML est avant tout un outil qui permet de produire des documents primaires structurés, ce qui facilite la gestion, l'exploitation et la diffusion de l'information. 17/07/2015 toto 15 LE CONTEXTE • Il est vrai que les horizons ouverts par XML sont larges et donc difficiles à cerner. • XML est avant tout un outil qui permet de produire des documents primaires structurés, ce qui facilite la gestion, l'exploitation et la diffusion de l'information. • Les DTD définissent des formats de description de données. 17/07/2015 toto 16 LE CONTEXTE • XML est un « métalangage » qui constitue un moyen de normalisation des métadonnées (avec, il faut le souligner, à peu près les mêmes problèmes que ceux qui avaient présidé à la normalisation des données bibliographiques). Certains logiciels documentaires mettent déjà en avant les avantages que ce « métalangage » offre en matière de gestion des bases documentaires, notamment pour les fonctions d'importation et d'exportation de données. 17/07/2015 toto 17 LE CONTEXTE • XML est un « métalangage » qui constitue un moyen de normalisation des métadonnées (avec, il faut le souligner, à peu près les mêmes problèmes que ceux qui avaient présidé à la normalisation des données bibliographiques). Certains logiciels documentaires mettent déjà en avant les avantages que ce « métalangage » offre en matière de gestion des bases documentaires, notamment pour les fonctions d'importation et d'exportation de données. • Le faible nombre d'expériences concrètes françaises réalisées jusqu’alors par de grands établissements (Direction des Archives de France, Bibliothèque nationale de France et quelques bibliothèques universitaires) et des outils à l’ergonomie encore peu développée (ne sont actuellement disponibles que des éditeurs XML) expliquent une perplexité et une circonspection très largement partagées par les professionnels de l'information. 17/07/2015 toto 18 LE CONTEXTE • Il existe des liaisons possibles entre les formats aujourd’hui utilisés et les nouvelles pistes qui s’ouvrent aux établissements. Tout catalogue, sous quelque forme que ce soit, comporte obligatoirement trois principes fondamentaux : - des éléments qui décrivent les données proprement dites, - une structuration formelle de ces données qui facilite l’échange, - une présentation plus ou moins laissée au libre choix de l’utilisateur. 17/07/2015 toto 19 LE CONTEXTE • Il existe des liaisons possibles entre les formats aujourd’hui utilisés et les nouvelles pistes qui s’ouvrent aux établissements. Tout catalogue, sous quelque forme que ce soit, comporte obligatoirement trois principes fondamentaux : - des éléments qui décrivent les données proprement dites, - une structuration formelle de ces données qui facilite l’échange, - une présentation plus ou moins laissée au libre choix de l’utilisateur. • Les normes de catalogage qui ont abouti à l’ISBD mêlaient le fond et la forme, le concept et le contenant, les éléments, la structure et la présentation. L’apparition des formats MARC, au milieu des années 1960, a dissocié éléments et structure en laissant aux progiciels le soin de créer une forme de présentation. Les nouveaux standards électroniques distinguent plus finement éléments et structure et proposent en plus une formalisation de la présentation qui, sans être figée, reste20 17/07/2015 toto normative tout en permettant des possibilités de sorties très diverses : STRUCTURE GÉNÉRALE D’UN CATALOGUE Éléments Formats Métadonnées DTD MARC externes DTD (TEI, EAD, ISO 12083), Métadonnées STRUCTURE GÉNÉRALE D’UN CATALOGUE STRUCTURE GÉNÉRALE D’UN CATALOGUE Structure Présentation 17/07/2015 ISBD ISO 2709 HTML ISBD, OPAC SGML XML ISBD, OPAC, XSL, Pages Web, CD-Rom, impression papier, Braille toto 21 L’ÉVOLUTION DES ACCÈS PUBLICS EN LIGNE ET L’ENRICHISSEMENT DES CATALOGUES 17/07/2015 toto 22 SIGB AVEC PASSERELLE WEB, RESSOURCES NUMÉRIQUES ASSOCIÉES ET INTÉGRATION AU NIVEAU DU POSTE CLIENT 17/07/2015 toto 23 SIGB, RESSOURCES NUMÉRIQUES ASSOCIÉES ET INTÉGRATION AU NIVEAU DE L’INTERGICIEL 17/07/2015 toto 24 ACCÈS À DES BASES HÉTÉROGÈNES (NORME ISO 239.50 ET PASSERELLE WEB) 17/07/2015 toto 25 FACTEURS D’ÉVOLUTION • Développement de l’Internet et du Web, 17/07/2015 toto 26 FACTEURS D’ÉVOLUTION • Développement de l’Internet et du Web, • Changement de nature des catalogues : outre l’information bibliographique et les accès : - intégration de documents numériques, - lien à l’image ou au texte intégral, - lien vers une ressource distante, - lien relançant la recherche, 17/07/2015 toto 27 FACTEURS D’ÉVOLUTION • Développement de l’Internet et du Web, • Changement de nature des catalogues : outre l’information bibliographique et les accès : - intégration de documents numériques, - lien à l’image ou au texte intégral, - lien vers une ressource distante, - lien relançant la recherche, • Besoin de structurer les documents numériques en XML pour l’accès et l’édition sur l’Internet. 17/07/2015 toto 28 FACTEURS D’ÉVOLUTION • Disponibilité simultanée des ressources primaires, du catalogue ou des métadonnées et des instruments de navigation grâce à l’utilisation des : - mêmes standards (http, HTML, XML, Dublin Core, etc.), - mêmes outils informatiques de gestion, d’indexation et d’utilisation, 17/07/2015 toto 29 FACTEURS D’ÉVOLUTION • Disponibilité simultanée des ressources primaires, du catalogue ou des métadonnées et des instruments de navigation grâce à l’utilisation des : - mêmes standards (http, HTML, XML, Dublin Core, etc.), - mêmes outils informatiques de gestion, d’indexation et d’utilisation, • Convergence possible entre bibliothèques, archives, centres de documentation et musées : une seule interface de navigation. 17/07/2015 toto 30 STRUCTURATION ÉLECTRONIQUE • Codification correspondant aux : - aspects physiques du document, - macrostructure : mise en page de chaque type de page, 17/07/2015 toto 31 MACROSTRUCTURE D’UNE PAGE PAGE Haut Titre Corps Colonne gauche Colonne droite Image Notes Bas 17/07/2015 Numéro toto 32 MACROSTRUCTURE D’UNE PAGE PAGE Haut PAGE Titre Corps Colonne gauche Haut Corps Bas Colonne droite Titre Numéro Image Bas 17/07/2015 Notes Colonne gauche Colonne droite Numéro Image Notes toto 33 STRUCTURATION ÉLECTRONIQUE • Codification correspondant aux : - aspects physiques du document, - macrostructure : mise en page de chaque type de page, - aspects logiques du document, - microstructure : attributs typographiques permettant de baliser des portions de texte (citations en italique, etc.), 17/07/2015 Bibliothèque nationale de France toto 34 STRUCTURATION ÉLECTRONIQUE • Codification correspondant aux : - aspects physiques du document, - macrostructure : mise en page de chaque type de page, - aspects logiques du document, - microstructure : attributs typographiques permettant de baliser des portions de texte (citations en italique, etc.), - types d’éléments logiques : titre, auteur, chapitre, section, paragraphe, figure, note, bibliographie, etc., 17/07/2015 Bibliothèque nationale de France toto 35 STRUCTURATION ÉLECTRONIQUE • Codification correspondant aux : - aspects physiques du document, - macrostructure : mise en page de chaque type de page, - aspects logiques du document, - microstructure : attributs typographiques permettant de baliser des portions de texte (citations en italique, etc.), - types d’éléments logiques : titre, auteur, chapitre, section, paragraphe, figure, note, bibliographie, etc., • Définition des éléments et de leur organisation (linéaire, hiérarchique ...). 17/07/2015 Bibliothèque nationale de France toto 36 MÉTADONNÉES • Métadonnées = données sur les données (information secondaire) pour : 17/07/2015 Bibliothèque nationale de France toto 37 MÉTADONNÉES • Métadonnées = données sur les données (information secondaire) pour : - la gestion des ressources bibliographiques ou d’information, - l’information sur le contenu du document pour faciliter sa recherche, sa localisation et son identification, - le suivi de l’utilisation et du respect des droits associés à la ressource (électronique ou non), - l’utilisation des supports analogiques comme ressources électroniques, - l’interopérabilité des données grâce à des standards de fait et des normes (Dublin Core, etc.). 17/07/2015 Bibliothèque nationale de France toto 38 MÉTADONNÉES « CLASSIQUES » • Information secondaire et document primaire distincts : - ex. notice ISBD, enregistrement en format MARC ; le nom du rédacteur et les dates de mise à jour de la notice sont des métadonnées sur les métadonnées, etc. 17/07/2015 Bibliothèque nationale de France toto 39 MÉTADONNÉES « CLASSIQUES » • Information secondaire et document primaire distincts : - ex. notice ISBD, enregistrement en format MARC ; le nom du rédacteur et les dates de mise à jour de la notice sont des métadonnées sur les métadonnées, etc. • Normes et standards propres à chaque catégorie de ressource primaire (formats pdf, ASCII pour le texte, formats jpeg, tiff, gif ou mpeg pour l’image, etc.) 17/07/2015 Bibliothèque nationale de France toto 40 MÉTADONNÉES « CLASSIQUES » • Information secondaire et document primaire distincts : - ex. notice ISBD, enregistrement en format MARC ; le nom du rédacteur et les dates de mise à jour de la notice sont des métadonnées sur les métadonnées, etc. • Normes et standards propres à chaque catégorie de ressource primaire (formats pdf, ASCII pour le texte, formats jpeg, tiff, gif ou mpeg pour l’image, etc.) ou secondaire (formats MARC pour la production et Unimarc ISO 2709/1996 pour la diffusion de l’information bibliographique). 17/07/2015 Bibliothèque nationale de France toto 41 MÉTADONNÉES «ÉLECTRONIQUES» • Toute unité identifiable sur le Web : - serveur, site Web, page, fragment de contenu, etc., - disponibilité simultanée de la ressource électronique elle-même et des métadonnées qui lui sont associées, 17/07/2015 Bibliothèque nationale de France toto 42 MÉTADONNÉES «ÉLECTRONIQUES» • Toute unité identifiable sur le Web : - serveur, site Web, page, fragment de contenu, etc., - disponibilité simultanée de la ressource électronique elle-même et des métadonnées qui lui sont associées, • Métadonnées de ressources électroniques : - utilisation de standards génériques de codage de la structure logique, - standards communs utilisés pour la ressource électronique et les métadonnées, - identification automatique et « catalogage à la source » des ressources électroniques saisies selon un format structuré. 17/07/2015 Bibliothèque nationale de France toto 43 DUBLIN CORE 15 ÉLÉMENTS : Contenu Titre Sujet Description Source Langage Relation Couverture Propriété intellectuelle Auteur Éditeur Contributeur Gestion des droits Matérialisation Date Type de ressource Format Identifiant 10 ATTRIBUTS DE DÉFINITION DES ÉLÉMENTS (avril 2000) : - Nom, Identifiant, Version, Autorité, Langage, Définition, Obligation, Type, Occurrence, Commentaire. 17/07/2015 Bibliothèque nationale de France toto 44 DUBLIN CORE • Dublin Core Metadata Initiative : http://dublincore.org 17/07/2015 Bibliothèque nationale de France toto 45 DUBLIN CORE • Dublin Core Metadata Initiative : http://dublincore.org • Guide d’utilisation du Dublin Core : http://www.bibl.ulaval.ca/DublinCore/usageguide-20000716fr .htm 17/07/2015 Bibliothèque nationale de France toto 46 LES FORMATS DE STRUCTURATION ÉLECTRONIQUE 17/07/2015 toto 47 SGML STANDARD GENERALIZED MARKUP LANGUAGE ( = Langage normalisé de balisage généralisé) ISO 8879 (1986) - AFNOR NF Z 71-010 (1990) 17/07/2015 toto 48 SGML • Successeur du format ML (Markup Language) puis GML (Generalized Markup Language) qui remonte à la seconde moitié des années 1960, 17/07/2015 toto 49 SGML • Successeur du format ML (Markup Language) puis GML (Generalized Markup Language) qui remonte à la seconde moitié des années 1960, • Origine dans le monde de l'édition (années 1980) : - technique de production de documents papier, - saisie de documents électroniques en base de données structurées, - balisage universel qui identifie chaque élément logique de la structure du document et qui permet son indexation et sa recherche, 17/07/2015 toto 50 SGML • Successeur du format ML (Markup Language) puis GML (Generalized Markup Language) qui remonte à la seconde moitié des années 1960, • Origine dans le monde de l'édition (années 1980) : - technique de production de documents papier, - saisie de documents électroniques en base de données structurées, - balisage universel qui identifie chaque élément logique de la structure du document et qui permet son indexation et sa recherche, • Impact actuel de SGML : - norme universelle de production de documents, - applications documentaires (notamment grands corpus : Fondation Voltaire, Encyclopaedia Universalis, Communauté européenne, Aérospatiale, Agence spatiale européenne, EDF, Renault, etc.), 17/07/2015 toto 51 - très utilisée dans le monde de l’édition et de l’impression. SGML • DTD (définition de type de document), 17/07/2015 toto 52 SGML • DTD (définition de type de document), • Un document structuré en SGML est balisé selon une DTD : le document est une instance de la DTD, 17/07/2015 toto 53 SGML • DTD (définition de type de document), • Un document structuré en SGML est balisé selon une DTD : le document est une instance de la DTD, • Un éditeur SGML est un logiciel de traitement de texte qui permet à la fois la saisie des éléments de données et le contrôle du document et de ses balises, 17/07/2015 toto 54 SGML • DTD (définition de type de document), • Un document structuré en SGML est balisé selon une DTD : le document est une instance de la DTD, • Un éditeur SGML est un logiciel de traitement de texte qui permet à la fois la saisie des éléments de données et le contrôle du document et de ses balises, • Un parseur (parser ou analyseur) est un programme qui contrôle que le document électronique encodé en SGML est balisé conformément à la DTD choisie. 17/07/2015 toto 55 HTML HyperText Markup Language (= Langage de balisage hypertextuel) 17/07/2015 toto 56 HTML • Standard de fait pour les publications sur l’Internet, 17/07/2015 toto 57 HTML • Standard de fait pour les publications sur l’Internet, • DTD SGML des pages WEB : titre, texte, listes, points d'ancrage hypertexte, 17/07/2015 toto 58 HTML • Standard de fait pour les publications sur l’Internet, • DTD SGML des pages WEB : titre, texte, listes, points d'ancrage hypertexte, • Fonction de navigation : - liens internes au document ou vers des objets externes ou distants : lien dans la même page ou vers une autre page du même document, vers d’autres applications Internet, des objets multimédias, des programmes, etc., - pointeurs pour les liens : URL (Uniform Resource Locators), 17/07/2015 toto 59 HTML • Standard de fait pour les publications sur l’Internet, • DTD SGML des pages WEB : titre, texte, listes, points d'ancrage hypertexte, • Fonction de navigation : - liens internes au document ou vers des objets externes ou distants : lien dans la même page ou vers une autre page du même document, vers d’autres applications Internet, des objets multimédias, des programmes, etc., - pointeurs pour les liens : URL (Uniform Resource Locators), • Insiste plus sur la forme que sur la structure du document, 17/07/2015 toto 60 HTML • Standard de fait pour les publications sur l’Internet, • DTD SGML des pages WEB : titre, texte, listes, points d'ancrage hypertexte, • Fonction de navigation : - liens internes au document ou vers des objets externes ou distants : lien dans la même page ou vers une autre page du même document, vers d’autres applications Internet, des objets multimédias, des programmes, etc., - pointeurs pour les liens : URL (Uniform Resource Locators), • Insiste plus sur la forme que sur la structure du document, • Définit la structure physique plus que la structure logique, 17/07/2015 toto 61 HTML • Standard de fait pour les publications sur l’Internet, • DTD SGML des pages WEB : titre, texte, listes, points d'ancrage hypertexte, • Fonction de navigation : - liens internes au document ou vers des objets externes ou distants : lien dans la même page ou vers une autre page du même document, vers d’autres applications Internet, des objets multimédias, des programmes, etc., - pointeurs pour les liens : URL (Uniform Resource Locators), • Insiste plus sur la forme que sur la structure du document, • Définit la structure physique plus que la structure logique, • Grammaire de balises à sémantique faible, 17/07/2015 toto 62 HTML • Standard de fait pour les publications sur l’Internet, • DTD SGML des pages WEB : titre, texte, listes, points d'ancrage hypertexte, • Fonction de navigation : - liens internes au document ou vers des objets externes ou distants : lien dans la même page ou vers une autre page du même document, vers d’autres applications Internet, des objets multimédias, des programmes, etc., - pointeurs pour les liens : URL (Uniform Resource Locators), • • • • Insiste plus sur la forme que sur la structure du document, Définit la structure physique plus que la structure logique, Grammaire de balises à sémantique faible, 17/07/2015 toto 63 Peine à gérer des documents de gros volume (frames). XML EXTENDED MARKUP LANGUAGE (= Langage de balisage étendu) 1998 17/07/2015 toto 64 XML • Créé par le W3 Consortium (W3C) de 1996 à avril 1998, 17/07/2015 toto 65 XML • Créé par le W3 Consortium (W3C) de 1996 à avril 1998, • Variante plus légère de SGML qui reprend le concept de balisage structurel, les attributs, les entités, et qui reprend les liens hypertexte de HTML (ancrage, pointeurs), 17/07/2015 toto 66 XML • Créé par le W3 Consortium (W3C) de 1996 à avril 1998, • Variante plus légère de SGML qui reprend le concept de balisage structurel, les attributs, les entités, et qui reprend les liens hypertexte de HTML (ancrage, pointeurs), • À la fois recommandation du W3C et sous-ensemble de la norme SGML ISO 8879, « métalangage et « métaformat », 17/07/2015 toto 67 XML • Créé par le W3 Consortium (W3C) de 1996 à avril 1998, • Variante plus légère de SGML qui reprend le concept de balisage structurel, les attributs, les entités, et qui reprend les liens hypertexte de HTML (ancrage, pointeurs), • À la fois recommandation du W3C et sous-ensemble de la norme SGML ISO 8879, « métalangage et « métaformat », • La nouveauté qu’apporte XML est sa structure neutre indépendante de tout logiciel ou plate-forme technique, 17/07/2015 toto 68 XML • Créé par le W3 Consortium (W3C) de 1996 à avril 1998, • Variante plus légère de SGML qui reprend le concept de balisage structurel, les attributs, les entités, et qui reprend les liens hypertexte de HTML (ancrage, pointeurs), • À la fois recommandation du W3C et sous-ensemble de la norme SGML ISO 8879, « métalangage et « métaformat », • La nouveauté qu’apporte XML est sa structure neutre indépendante de tout logiciel ou plate-forme technique, • Un document XML présente une indépendance totale entre sa structure logique et son aspect physique, ce qui en fait un format de stockage et d’archivage pérenne : un fichier XML n’est qu’un fichier ASCII. 17/07/2015 toto 69 XML • Créé par le W3 Consortium (W3C) de 1996 à avril 1998, • Variante plus légère de SGML qui reprend le concept de balisage structurel, les attributs, les entités, et qui reprend les liens hypertexte de HTML (ancrage, pointeurs), • À la fois recommandation du W3C et sous-ensemble de la norme SGML ISO 8879, « métalangage et « métaformat », • La nouveauté qu’apporte XML est sa structure neutre indépendante de tout logiciel ou plate-forme technique, • Un document XML présente une indépendance totale entre sa structure logique et son aspect physique, ce qui en fait un format de stockage et d’archivage pérenne : un fichier XML n’est qu’un fichier ASCII. 17/07/2015 (« a bit is a bit… ») toto 70 QU’EST-CE QUE XML ? 17/07/2015 toto 71 QU’EST-CE QUE XML ? • XML n’est pas… 17/07/2015 toto 72 QU’EST-CE QUE XML ? • XML n’est pas… - un format, 17/07/2015 toto 73 QU’EST-CE QUE XML ? • XML n’est pas… - un format, - un logiciel, 17/07/2015 toto 74 QU’EST-CE QUE XML ? • XML n’est pas… - un format, - un logiciel, - un langage de programmation, 17/07/2015 toto 75 QU’EST-CE QUE XML ? • XML n’est pas… - un format, - un logiciel, - un langage de programmation, - un protocole de communication ; 17/07/2015 toto 76 QU’EST-CE QUE XML ? • XML n’est pas… - un format, - un logiciel, - un langage de programmation, - un protocole de communication ; • XML est un peu tout cela à la fois ; c’est aussi… 17/07/2015 toto 77 QU’EST-CE QUE XML ? • XML n’est pas… - un format, - un logiciel, - un langage de programmation, - un protocole de communication ; • XML est un peu tout cela à la fois ; c’est aussi… - une infrastructure, 17/07/2015 toto 78 QU’EST-CE QUE XML ? • XML n’est pas… - un format, - un logiciel, - un langage de programmation, - un protocole de communication ; • XML est un peu tout cela à la fois ; c’est aussi… - une infrastructure, - une méthodologie, 17/07/2015 toto 79 QU’EST-CE QUE XML ? • XML n’est pas… - un format, - un logiciel, - un langage de programmation, - un protocole de communication ; • XML est un peu tout cela à la fois ; c’est aussi… - une infrastructure, - une méthodologie, - une « philosophie ». 17/07/2015 toto 80 QU’EST-CE QUE XML ? 17/07/2015 toto 81 QU’EST-CE QUE XML ? • Un HTML extensible ? 17/07/2015 toto 82 QU’EST-CE QUE XML ? • Un HTML extensible ? - Approche fréquemment utilisée dans la presse de vulgarisation informatique spécialisée sur le Web, 17/07/2015 toto 83 QU’EST-CE QUE XML ? • Un HTML extensible ? - Approche fréquemment utilisée dans la presse de vulgarisation informatique spécialisée sur le Web, - XML est présenté comme un format « extensible » qui permet de créer des pages personnelles « améliorées », 17/07/2015 toto 84 QU’EST-CE QUE XML ? • Un HTML extensible ? - Approche fréquemment utilisée dans la presse de vulgarisation informatique spécialisée sur le Web, - XML est présenté comme un format « extensible » qui permet de créer des pages personnelles « améliorées », - Comparaison avec HTML : XML utilise également des balises, mais, à l’inverse de HTML, on peut définir ses propres balises. 17/07/2015 toto 85 QU’EST-CE QUE XML ? • Un HTML extensible ? - Approche fréquemment utilisée dans la presse de vulgarisation informatique spécialisée sur le Web, - XML est présenté comme un format « extensible » qui permet de créer des pages personnelles « améliorées », - Comparaison avec HTML : XML utilise également des balises, mais, à l’inverse de HTML, on peut définir ses propres balises. MAIS cette approche ne donne qu’une vue très fragmentaire d’XML en occultant totalement sa puissance comme format de 17/07/2015 toto 86 documents structurés. QU’EST-CE QUE XML ? • Une nouvelle architecture pour le Web ? 17/07/2015 toto 87 QU’EST-CE QUE XML ? • Une nouvelle architecture pour le Web ? - Approche souvent utilisée par les informaticiens, notamment en ce qui concerne le commerce électronique et la « net-économie » (e-business), 17/07/2015 toto 88 QU’EST-CE QUE XML ? • Une nouvelle architecture pour le Web ? - Approche souvent utilisée par les informaticiens, notamment en ce qui concerne le commerce électronique et la « net-économie » (e-business), - Approche qui s’appuie sur le Web comme système d’information et d’échange dans son ensemble, 17/07/2015 toto 89 QU’EST-CE QUE XML ? • Une nouvelle architecture pour le Web ? - Approche souvent utilisée par les informaticiens, notamment en ce qui concerne le commerce électronique et la « net-économie » (e-business), - Approche qui s’appuie sur le Web comme système d’information et d’échange dans son ensemble, - Approche qui insiste sur les échanges de données, les protocoles de communication, les interfaces de programmation, la sécurisation des données, etc. 17/07/2015 toto 90 QU’EST-CE QUE XML ? • Une nouvelle architecture pour le Web ? - Approche souvent utilisée par les informaticiens, notamment en ce qui concerne le commerce électronique et la « net-économie » (e-business), - Approche qui s’appuie sur le Web comme système d’information et d’échange dans son ensemble, - Approche qui insiste sur les échanges de données, les protocoles de communication, les interfaces de programmation, la sécurisation des données, etc. MAIS, dans cette approche, les applications documentaires sont totalement mises à l’écart. 17/07/2015 toto 91 QU’EST-CE QUE XML ? • Un format de documents structurés ? 17/07/2015 toto 92 QU’EST-CE QUE XML ? • Un format de documents structurés ? - Approche très utilisée dans le monde documentaire, 17/07/2015 toto 93 QU’EST-CE QUE XML ? • Un format de documents structurés ? - Approche très utilisée dans le monde documentaire, - Approche qui s’appuie sur SGML et les méthodologies développées pour les grands corpus documentaires, 17/07/2015 toto 94 QU’EST-CE QUE XML ? • Un format de documents structurés ? - Approche très utilisée dans le monde documentaire, - Approche qui s’appuie sur SGML et les méthodologies développées pour les grands corpus documentaires, - Approche qui présente XML comme une technologie permettant de créer des documents plus « intelligents », 17/07/2015 toto 95 QU’EST-CE QUE XML ? • Un format de documents structurés ? - Approche très utilisée dans le monde documentaire, - Approche qui s’appuie sur SGML et les méthodologies développées pour les grands corpus documentaires, - Approche qui présente XML comme une technologie permettant de créer des documents plus « intelligents », - Approche qui insiste sur la pérennisation et la réutilisation de l’information, la publication sur de multiples supports et en plusieurs formats, etc. 17/07/2015 toto 96 QU’EST-CE QUE XML ? • Un format de documents structurés ? - Approche très utilisée dans le monde documentaire, - Approche qui s’appuie sur SGML et les méthodologies développées pour les grands corpus documentaires, - Approche qui présente XML comme une technologie permettant de créer des documents plus « intelligents », - Approche qui insiste sur la pérennisation et la réutilisation de l’information, la publication sur de multiples supports et en plusieurs formats, etc. MAIS quand cette approche plus réaliste est argumentée hors du contexte documentaire, elle n’est pas considérée comme importante. 17/07/2015 toto 97 XML NE S’UTILISE PAS SEUL • XML est une structure générique dont la mise en page est réalisée par une feuille de style XSL (eXtensible Stylesheet Language), 17/07/2015 toto 98 XML NE S’UTILISE PAS SEUL • XML est une structure générique dont la mise en page est réalisée par une feuille de style XSL (eXtensible Stylesheet Language), - XSL - T (pour les pages Web) - XSL - FO (pour la publication papier ou sur écran). 17/07/2015 toto 99 XML NE S’UTILISE PAS SEUL • XML est une structure générique dont la mise en page est réalisée par une feuille de style XSL (eXtensible Stylesheet Language), - XSL - T (pour les pages Web) - XSL - FO (pour la publication papier ou sur écran). À partir d’un fichier structuré en XML et en utilisant diverses feuilles de style XSL, on peut produire des présentations différentes du contenu des documents, en fonction des supports d’édition (notamment le Web) ou des publics visés. 17/07/2015 toto 100 XML NE S’UTILISE PAS SEUL • XML est une structure générique dont la mise en page est réalisée par une feuille de style XSL (eXtensible Stylesheet Language), - XSL - T (pour les pages Web) - XSL - FO (pour la publication papier ou sur écran). À partir d’un fichier structuré en XML et en utilisant diverses feuilles de style XSL, on peut produire des présentations différentes du contenu des documents, en fonction des supports d’édition (notamment le Web) ou des publics visés. CONTENU (données = fichier XML) 17/07/2015 toto 101 XML NE S’UTILISE PAS SEUL • XML est une structure générique dont la mise en page est réalisée par une feuille de style XSL (eXtensible Stylesheet Language), - XSL - T (pour les pages Web) - XSL - FO (pour la publication papier ou sur écran). À partir d’un fichier structuré en XML et en utilisant diverses feuilles de style XSL, on peut produire des présentations différentes du contenu des documents, en fonction des supports d’édition (notamment le Web) ou des publics visés. CONTENU PRÉSENTATION (données = (mise en page = fichier XML) plusieurs fichiers XSL possibles) 17/07/2015 toto 102 XML NE S’UTILISE PAS SEUL • XML est une structure générique dont la mise en page est réalisée par une feuille de style XSL (eXtensible Stylesheet Language), - XSL - T (pour les pages Web) - XSL - FO (pour la publication papier ou sur écran). À partir d’un fichier structuré en XML et en utilisant diverses feuilles de style XSL, on peut produire des présentations différentes du contenu des documents, en fonction des supports d’édition (notamment le Web) ou des publics visés. CONTENU PRÉSENTATION (données = (mise en page = fichier XML) plusieurs fichiers XSL possibles) SORTIE 17/07/2015 toto 103 (page Web, édition papier, CD, en Braille, etc. ) XML NE S’UTILISE PAS SEUL • RDF (Resource Description Framework) est une recommandation de 1999 qui spécifie la structure des métadonnées, 17/07/2015 toto 104 XML NE S’UTILISE PAS SEUL • RDF (Resource Description Framework) est une recommandation de 1999 qui spécifie la structure des métadonnées, • XML Data est utilisée pour typer le contenu des éléments, 17/07/2015 toto 105 XML NE S’UTILISE PAS SEUL • RDF (Resource Description Framework) est une recommandation de 1999 qui spécifie la structure des métadonnées, • XML Data est utilisée pour typer le contenu des éléments, • XLL (eXtended Linking Language) est utilisé pour la création de liens hypertextes simples ou multiples vers des destinations différentes, 17/07/2015 toto 106 XML NE S’UTILISE PAS SEUL • RDF (Resource Description Framework) est une recommandation de 1999 qui spécifie la structure des métadonnées, • XML Data est utilisée pour typer le contenu des éléments, • XLL (eXtended Linking Language) est utilisé pour la création de liens hypertextes simples ou multiples vers des destinations différentes, • Topics Maps est une norme ISO basée à la fois sur SGML et HyTime et qui utilise les mécanismes d’XLL, 17/07/2015 toto 107 XML NE S’UTILISE PAS SEUL • RDF (Resource Description Framework) est une recommandation de 1999 qui spécifie la structure des métadonnées, • XML Data est utilisée pour typer le contenu des éléments, • XLL (eXtended Linking Language) est utilisé pour la création de liens hypertextes simples ou multiples vers des destinations différentes, • Topics Maps est une norme ISO basée à la fois sur SGML et HyTime et qui utilise les mécanismes d’XLL, • Le langage XQL (eXtended Query Language), équivalent de SQL pour les données créées en XML, permettra dans un proche avenir d’interroger des bases XML en établissant des requêtes 17/07/2015portant sur la structure toto de l’information. 108 CARACTÉRISTIQUES DE XML • Codage conçu pour la distribution des documents ou de portions de documents : 17/07/2015 toto 109 CARACTÉRISTIQUES DE XML • Codage conçu pour la distribution des documents ou de portions de documents : - document « bien formé » autosuffisant = « autocatalogage », 17/07/2015 toto 110 CARACTÉRISTIQUES DE XML • Codage conçu pour la distribution des documents ou de portions de documents : - document « bien formé » autosuffisant = « autocatalogage », - document « valide » = document « bien formé » conforme à une DTD, 17/07/2015 toto 111 CARACTÉRISTIQUES DE XML • Codage conçu pour la distribution des documents ou de portions de documents : - document « bien formé » autosuffisant = « autocatalogage », - document « valide » = document « bien formé » conforme à une DTD, - utilisation facultative d’une DTD, 17/07/2015 toto 112 CARACTÉRISTIQUES DE XML • Codage conçu pour la distribution des documents ou de portions de documents : - document « bien formé » autosuffisant = « autocatalogage », - document « valide » = document « bien formé » conforme à une DTD, - utilisation facultative d’une DTD, - permet de créer ses propres balises, 17/07/2015 toto 113 CARACTÉRISTIQUES DE XML • Codage conçu pour la distribution des documents ou de portions de documents : - document « bien formé » autosuffisant = « autocatalogage », - document « valide » = document « bien formé » conforme à une DTD, - utilisation facultative d’une DTD, - permet de créer ses propres balises, - feuilles de style normalisées XSL indépendantes du document encodé en XML. 17/07/2015 toto 114 CARACTÉRISTIQUES DE XML • Codage des caractères selon la norme UNICODE (norme ISO 10646-UCS4), soit 4 294 967 296 possibilités de caractères codés sur 4 octets, 17/07/2015 toto 115 CARACTÉRISTIQUES DE XML • Codage des caractères selon la norme UNICODE (norme ISO 10646-UCS4), soit 4 294 967 296 possibilités de caractères codés sur 4 octets, • De janvier 2000 à juin 2002, 66 % des sites Web professionnels sont passés de HTML à XML (données INRIA, siège du W3C). 17/07/2015 toto 116 CARACTÉRISTIQUES DE XML • Codage des caractères selon la norme UNICODE (norme ISO 10646-UCS4), soit 4 294 967 296 possibilités de caractères codés sur 4 octets, • De janvier 2000 à juin 2002, 66 % des sites Web professionnels sont passés de HTML à XML (données INRIA, siège du W3C). • Mais… toujours le même péché de jeunesse : à l’automne 2002, il n’existe pas encore de système de production « bibliographique » en XML. 17/07/2015 toto 117 XML • Un changement important qui impose une formation : 17/07/2015 toto 118 XML • Un changement important qui impose une formation : - Changement dans les formats bibliographiques et documentaires = formation pour les catalogueurs et tous ceux qui traitent de l’information, 17/07/2015 toto 119 XML • Un changement important qui impose une formation : - Changement dans les formats bibliographiques et documentaires = formation pour les catalogueurs et tous ceux qui traitent de l’information, - Changement dans les architectures informatiques = formation pour les informaticiens, 17/07/2015 toto 120 XML • Un changement important qui impose une formation : - Changement dans les formats bibliographiques et documentaires = formation pour les catalogueurs et tous ceux qui traitent de l’information, - Changement dans les architectures informatiques = formation pour les informaticiens, - Changement d’objets manipulés (de la représentation des documents aux documents numériques) = formation générale, pour l’ensemble du personnel, 17/07/2015 toto 121 XML • Un changement important qui impose une formation : - Changement dans les formats bibliographiques et documentaires = formation pour les catalogueurs et tous ceux qui traitent de l’information, - Changement dans les architectures informatiques = formation pour les informaticiens, - Changement d’objets manipulés (de la représentation des documents aux documents numériques) = formation générale, pour l’ensemble du personnel, - Mais pas de changement pour l’utilisateur : le public utilise toujours le navigateur et poursuit sa recherche « intuitive ». 17/07/2015 toto 122 L’impact d’XML dans les bibliothèques PRODUCTION D’INFORMATION : - Catalogage bibliographique et d’autorité de tous types de documents selon une DTD, - Conversion rétrospective de catalogues ou d’instruments de recherche existants, - Conversions de notices MARC existantes selon une DTD MARC, - Conversions rétrospectives de collections spécialisées selon une DTD, 17/07/2015 toto 123 L’impact d’XML dans les bibliothèques PRODUCTION D’INFORMATION : - Catalogage bibliographique et d’autorité de tous types de documents selon une DTD, - Conversion rétrospective de catalogues ou d’instruments de recherche existants, - Conversions de notices MARC existantes selon une DTD MARC, - Conversions rétrospectives de collections spécialisées selon une DTD, - Numérisation de documents primaires (en mode texte et image pour les documents imprimés et en mode image pour les documents graphiques), - Création de métadonnées et structuration en XML de l’ensemble métadonnées - documents numérisés, - Liaison réciproque directe des catalogues ou des métadonnées et des ressources numériques, 17/07/2015 toto une DTD. 124 - Élaboration de modèles structurés selon L’impact d’XML dans les bibliothèques CONSULTATION ET RECHERCHE D’INFORMATION : - Consultation simultanée de la notice bibliographique ou des métadonnées et des ressources numériques associées, - Indexation en texte intégral et liens vers les fichiers d’autorité, - Recherche possible via le catalogue ou les documents numériques, - Exportation possible de l’ensemble notice bibliographique ou métadonnées et ressource numérique. 17/07/2015 toto 125 L’impact d’XML dans les bibliothèques DIFFUSION D’INFORMATION : - Édition électronique (CD-Roms, bibliographies, catalogues raisonnés, inventaires, catalogues d’exposition, etc.), - Édition sur papier (fourniture d’un flux à l’imprimeur), - Mise au point d’une chaîne d’édition à la demande des documents numérisés et structurés en XML, - Site Web et Intranet, - Bibliothèque numérique : les instruments de recherche sous forme d’instances XML conformes à une DTD normalisée peuvent être lus, échangés et utilisés par la communauté scientifique internationale. 17/07/2015 toto 126 XML • Site du W3C : http://www.w3.org/ 17/07/2015 toto 127 XML • Site du W3C : http://www.w3.org/ • Version 1.0 de XML (15 mars 2001) : http://www.w3.org/TR/2001/REC-xml-cl4n-20010315 17/07/2015 toto 128 XML • Site du W3C : http://www.w3.org/ • Version 1.0 de XML (15 mars 2001) : http://www.w3.org/TR/2001/REC-xml-cl4n-20010315 • Traduction française de XML 1.0 : http://babel/alis.com/web_ml/xml/ 17/07/2015 toto 129 XML • Site du W3C : http://www.w3.org/ • Version 1.0 de XML (15 mars 2001) : http://www.w3.org/TR/2001/REC-xml-cl4n-20010315 • Traduction française de XML 1.0 : http://babel/alis.com/web_ml/xml/ • Page de liens du groupe XML « Enrichi » de l’ABF : http://www.asso.fr/enrichi/docxml.htm 17/07/2015 toto 130 XML • Educnet : http://www.educnet.education.gouv.fr/documentation/dossier /xml.htm 17/07/2015 toto 131 XML • Educnet : http://www.educnet.education.gouv.fr/documentation/dossier /xml.htm • Mission interministérielle de soutien technique pour le développement des Technologies de l’Information et de la Communication dans l’administration (MTIC)°: http://www.mtic.pm.gouv.fr/XML/ 17/07/2015 toto 132 XML • Educnet : http://www.educnet.education.gouv.fr/documentation/dossier /xml.htm • Mission interministérielle de soutien technique pour le développement des Technologies de l’Information et de la Communication dans l’administration (MTIC)°: http://www.mtic.pm.gouv.fr/XML/ • XML et l’ingénierie des bibliothèques électroniques : http://www.loria.fr/~ducloy/COURS/URFIST.html 17/07/2015 toto 133 XML • Educnet : http://www.educnet.education.gouv.fr/documentation/dossier /xml.htm • Mission interministérielle de soutien technique pour le développement des Technologies de l’Information et de la Communication dans l’administration (MTIC)°: http://www.mtic.pm.gouv.fr/XML/ • XML et l’ingénierie des bibliothèques électroniques : http://www.loria.fr/~ducloy/COURS/URFIST.html • MutuXML (liste de diffusion, articles, didacticiels, etc.) http://www.mutu-xml.org 17/07/2015 toto 134 DTD DÉFINITION DE TYPE DE DOCUMENT = DOCUMENT TYPE DEFINITION 17/07/2015 toto 135 QU’EST-CE QU’UNE DTD ? 17/07/2015 toto 136 QU’EST-CE QU’UNE DTD ? • Une DTD est un « format » de description des éléments qui composent le document, 17/07/2015 toto 137 QU’EST-CE QU’UNE DTD ? • Une DTD est un « format » de description des éléments qui composent le document, mais une DTD est plus qu’un format « classique » de type MARC puisqu’elle peut gérer à la fois non seulement la description bibliographique et les accès ou les métadonnées mais aussi le document électronique lui-même, 17/07/2015 toto 138 QU’EST-CE QU’UNE DTD ? • Une DTD est un « format » de description des éléments qui composent le document, mais une DTD est plus qu’un format « classique » de type MARC puisqu’elle peut gérer à la fois non seulement la description bibliographique et les accès ou les métadonnées mais aussi le document électronique lui-même, • Description en langage SGML ou XML et codification de la structure logique d’un document ou d’un ensemble de documents (partie, chapitre, section, paragraphe), 17/07/2015 toto 139 QU’EST-CE QU’UNE DTD ? • Une DTD est un « format » de description des éléments qui composent le document, mais une DTD est plus qu’un format « classique » de type MARC puisqu’elle peut gérer à la fois non seulement la description bibliographique et les accès ou les métadonnées mais aussi le document électronique lui-même, • Description en langage SGML ou XML et codification de la structure logique d’un document ou d’un ensemble de documents (partie, chapitre, section, paragraphe), • Définition et structuration par balisage des éléments logiques (auteur, titre, sujet, etc.) et de leur organisation hiérarchique ou non, 17/07/2015 toto 140 QU’EST-CE QU’UNE DTD ? • Une DTD est un « format » de description des éléments qui composent le document, mais une DTD est plus qu’un format « classique » de type MARC puisqu’elle peut gérer à la fois non seulement la description bibliographique et les accès ou les métadonnées mais aussi le document électronique lui-même, • Description en langage SGML ou XML et codification de la structure logique d’un document ou d’un ensemble de documents (partie, chapitre, section, paragraphe), • Définition et structuration par balisage des éléments logiques (auteur, titre, sujet, etc.) et de leur organisation hiérarchique ou non, • La quasi-intégralité des DTD initialement écrites en SGML 17/07/2015 toto 141 ont été traduites en XML. Une DTD se compose : 17/07/2015 toto 142 Une DTD se compose : • des éléments logiques qui constituent le document, - ex. : <!ELEMENT auteur 17/07/2015 toto 143 Une DTD se compose : • des éléments logiques qui constituent le document, - ex. : <!ELEMENT auteur • des attributs de qualification de ces éléments, - ex. : <langencoding="ISO 639-2"> 17/07/2015 toto 144 Une DTD se compose : • des éléments logiques qui constituent le document, - ex. : <!ELEMENT auteur • des attributs de qualification de ces éléments, - ex. : <langencoding="ISO 639-2"> • des entités, c’est-à-dire des chaînes de caractères qui composent le document ou des documents externes dans un autre codage (image, son ...) qui sont attachés à un endroit précis. - ex. : balise logique d’attache d’un document image (jpeg, tiff, gif, mpeg, etc.) stocké dans un fichier séparé. 17/07/2015 toto 145 Une DTD se compose : • des éléments logiques qui constituent le document, - ex. : <!ELEMENT auteur • des attributs de qualification de ces éléments, - ex. : <langencoding="ISO 639-2"> • des entités, c’est-à-dire des chaînes de caractères qui composent le document ou des documents externes dans un autre codage (image, son ...) qui sont attachés à un endroit précis. - ex. : balise logique d’attache d’un document image (jpeg, tiff, gif, mpeg, etc.) stocké dans un fichier séparé. • des balises qui structurent le document. - ex. : <auteur> xxxxx </auteur> toto 17/07/2015 146 DTD • Le document est encodé avec des balises qui encadrent chaque élément logique de la structure du document, ainsi identifié comme élément pertinent d’information, 17/07/2015 toto 147 DTD • Le document est encodé avec des balises qui encadrent chaque élément logique de la structure du document, ainsi identifié comme élément pertinent d’information, • Les balises et leurs règles d’utilisation sont définies dans la DTD, 17/07/2015 toto 148 DTD • Le document est encodé avec des balises qui encadrent chaque élément logique de la structure du document, ainsi identifié comme élément pertinent d’information, • Les balises et leurs règles d’utilisation sont définies dans la DTD, • Le visualiseur interprète les balises logiques et les transforme en présentation visuelle ou typographique selon les spécifications de la feuille de style XSL. 17/07/2015 toto 149 DTD • Il existe plusieurs DTD : 17/07/2015 toto 150 DTD • Il existe plusieurs DTD : - ISO 12083, http://www.xmlxperts.com/12083xml.htm 17/07/2015 toto 151 DTD • Il existe plusieurs DTD : - ISO 12083, http://www.xmlxperts.com/12083xml.htm - ISO 12083 pour les monographies et les imprimés, http://www.xmlxperts.com/xmlbookdtd.htm 17/07/2015 toto 152 DTD • Il existe plusieurs DTD : - ISO 12083, http://www.xmlxperts.com/12083xml.htm - ISO 12083 pour les monographies et les imprimés, http://www.xmlxperts.com/xmlbookdtd.htm - ISO 12083 pour les périodiques, http://www.xmlxperts.com/xmlserialdtd.htm 17/07/2015 toto 153 DTD • Il existe plusieurs DTD : - ISO 12083, http://www.xmlxperts.com/12083xml.htm - ISO 12083 pour les monographies et les imprimés, http://www.xmlxperts.com/xmlbookdtd.htm - ISO 12083 pour les périodiques, http://www.xmlxperts.com/xmlserialdtd.htm - ISO 12083 pour les articles de périodiques, http://www.xmlxperts.com/xmlarticledtd.htm 17/07/2015 toto 154 DTD • Il existe plusieurs DTD : - ISO 12083, http://www.xmlxperts.com/12083xml.htm - ISO 12083 pour les monographies et les imprimés, http://www.xmlxperts.com/xmlbookdtd.htm - ISO 12083 pour les périodiques, http://www.xmlxperts.com/xmlserialdtd.htm - ISO 12083 pour les articles de périodiques, http://www.xmlxperts.com/xmlarticledtd.htm - ISO 12083 pour les formules mathématiques, 17/07/2015 toto http://www.xmlxperts.com/xmlmathdtd.htm 155 • et aussi : DTD - TEI (Text Encoding Initiative) pour le traitement des textes publiés sous forme électronique, notamment en sciences humaines et en linguistique, http://www.tei-c.org 17/07/2015 toto 156 • et aussi : DTD - TEI (Text Encoding Initiative) pour le traitement des textes publiés sous forme électronique, notamment en sciences humaines et en linguistique, http://www.tei-c.org - EAD (Encoded Archival Description) pour le traitement des fonds d’archives et des collections spécialisées, http://lcweb.loc.gov/ead/ 17/07/2015 toto 157 • et aussi : DTD - TEI (Text Encoding Initiative) pour le traitement des textes publiés sous forme électronique, notamment en sciences humaines et en linguistique, http://www.tei-c.org - EAD (Encoded Archival Description) pour le traitement des fonds d’archives et des collections spécialisées, http://lcweb.loc.gov/ead/ - EBIND pour lier les métadonnées au document numérique, http://sunsite.berkeley.edu/Ebind 17/07/2015 toto 158 • et aussi : DTD - TEI (Text Encoding Initiative) pour le traitement des textes publiés sous forme électronique, notamment en sciences humaines et en linguistique, http://www.tei-c.org - EAD (Encoded Archival Description) pour le traitement des fonds d’archives et des collections spécialisées, http://lcweb.loc.gov/ead/ - EBIND pour lier les métadonnées au document numérique, http://sunsite.berkeley.edu/Ebind - MASTER pour les manuscrits médiévaux, http://www.cta.dmu.ac.uk/projects/master/ 17/07/2015 toto 159 • et encore : DTD - XMLMARC, http://xmlmarc.stanford.edu/ 17/07/2015 toto 160 • et encore : DTD - XMLMARC, http://xmlmarc.stanford.edu/ - DTD USMARC, http://lcweb.loc.gov/marc/marcdtd/marcdtdback.htm 17/07/2015 toto 161 • et encore : DTD - XMLMARC, http://xmlmarc.stanford.edu/ - DTD USMARC, http://lcweb.loc.gov/marc/marcdtd/marcdtdback.htm - DTD Unimarc BiblioML (bibliographique et autorités), http://www.culture.fr/BiblioML. 17/07/2015 toto 162 DTD • et encore : - XMLMARC, http://xmlmarc.stanford.edu/ - DTD USMARC, http://lcweb.loc.gov/marc/marcdtd/marcdtdback.htm - DTD Unimarc BiblioML (bibliographique et autorités), http://www.culture.fr/BiblioML. - ONIX http://www.editeur.org/onix.html 17/07/2015 toto 163 DTD • et encore : - XMLMARC, http://xmlmarc.stanford.edu/ - DTD USMARC, http://lcweb.loc.gov/marc/marcdtd/marcdtdback.htm - DTD Unimarc BiblioML (bibliographique et autorités), http://www.culture.fr/BiblioML. - ONIX http://www.editeur.org/onix.html - DocBook etc. 17/07/2015 http://www.docbook.org/ toto 164 TEI ISO 12083 1998 17/07/2015nationale de France Bibliothèque toto 165 ISO 12083 TEI • Norme internationale, 17/07/2015nationale de France Bibliothèque toto 166 ISO 12083 TEI • Norme internationale, • La DTD ISO 12083 a délibérément été conçue dans une optique générale, afin de permettre la création de DTD plus spécifiques, 17/07/2015nationale de France Bibliothèque toto 167 ISO 12083 TEI • Norme internationale, • La DTD ISO 12083 a délibérément été conçue dans une optique générale, afin de permettre la création de DTD plus spécifiques, • C’est un document de référence pour faciliter l’échange et l’archivage de divers types de publications, 17/07/2015nationale de France Bibliothèque toto 168 ISO 12083 TEI • Norme internationale, • La DTD ISO 12083 a délibérément été conçue dans une optique générale, afin de permettre la création de DTD plus spécifiques, • C’est un document de référence pour faciliter l’échange et l’archivage de divers types de publications, • Le principe d’ISO 12083 est de fournir un jeu d’éléments qui permettent la structuration d’ouvrages imprimés, de périodiques, d’articles sous forme imprimée ou électronique. 17/07/2015nationale de France Bibliothèque toto 169 APPLICATIONS ISO 12083 TEI • Université Laval (ouvrages français), http://www.bibl.ulaval.ca/doelec/pul/ 17/07/2015nationale de France Bibliothèque toto 170 APPLICATIONS ISO 12083 TEI • Université Laval (ouvrages français), http://www.bibl.ulaval.ca/doelec/pul/ • Université de Montréal, http://mapageweb.umontreal.ca/marcoux/grds/martintd/index.html 17/07/2015nationale de France Bibliothèque toto 171 APPLICATIONS ISO 12083 TEI • Université Laval (ouvrages français), http://www.bibl.ulaval.ca/doelec/pul/ • Université de Montréal, http://mapageweb.umontreal.ca/marcoux/grds/martintd/index.html • SUNET (Swedish University NETwork), http://ftp.unet.se/pub/etext/ota/TEI/software/docs/SGMLinfo/I 17/07/2015nationale de France toto 172 Bibliothèque CADDiso.html TEI TEI TEXT ENCODING INITIATIVE 1990 17/07/2015nationale de France Bibliothèque toto 173 TEI • DTD basée sur SGML créée en 1988 pour la linguistique et la recherche en sciences humaines ; traduite en XML, 17/07/2015 toto 174 TEI • DTD basée sur SGML créée en 1988 pour la linguistique et la recherche en sciences humaines ; traduite en XML, • Méthode de balisage de textes manuscrits, dactylographiés ou saisis sous forme électronique pour leur utilisation par des chercheurs, 17/07/2015 toto 175 TEI • DTD basée sur SGML créée en 1988 pour la linguistique et la recherche en sciences humaines ; traduite en XML, • Méthode de balisage de textes manuscrits, dactylographiés ou saisis sous forme électronique pour leur utilisation par des chercheurs, • Balisage permettant de caractériser les variantes de texte ou les variantes d’édition, 17/07/2015 toto 176 TEI • DTD basée sur SGML créée en 1988 pour la linguistique et la recherche en sciences humaines ; traduite en XML, • Méthode de balisage de textes manuscrits, dactylographiés ou saisis sous forme électronique pour leur utilisation par des chercheurs, • Balisage permettant de caractériser les variantes de texte ou les variantes d’édition, • Permet au chercheur de travailler en texte intégral. 17/07/2015 toto 177 TEI • TEI (Text Encoding Initiative), http://www.uic.edu/orgs/tei/ 17/07/2015 toto 178 TEI • TEI (Text Encoding Initiative), http://www.uic.edu/orgs/tei/ • TEI Consortium, http://www.tei-c.org 17/07/2015 toto 179 TEI • TEI (Text Encoding Initiative), http://www.uic.edu/orgs/tei/ • TEI Consortium, http://www.tei-c.org • TEI simplifiée, http://www.emn.fr/perso/fekete/TEI/tei2latex/teiu5.fr.html 17/07/2015 toto 180 APPLICATIONS TEI • Electronic Text Archive, Leiden, http://www.etal.nl/goldenage 17/07/2015 toto 181 APPLICATIONS TEI • Electronic Text Archive, Leiden, http://www.etal.nl/goldenage • Kolb Proust Archive, Univerty of Illinois, http://www.library.uiuc.edu/kolbp 17/07/2015 toto 182 APPLICATIONS TEI • Electronic Text Archive, Leiden, http://www.etal.nl/goldenage • Kolb Proust Archive, Univerty of Illinois, http://www.library.uiuc.edu/kolbp • Oxford University, http://www.voltaire.ox.ac.uk 17/07/2015 toto 183 APPLICATIONS TEI • Electronic Text Archive, Leiden, http://www.etal.nl/goldenage • Kolb Proust Archive, Univerty of Illinois, http://www.library.uiuc.edu/kolbp • Oxford University, http://www.voltaire.ox.ac.uk • Laboratoire LOrrain de Recherche en Informatique et ses Applications, http://www.loria.fr/Projet/Silfide 17/07/2015 toto 184 EAD ENCODED ARCHIVAL DESCRIPTION (= Description archivistique encodée) 1998 17/07/2015 toto 185 GENÈSE DE L’EAD • Convergence entre les archivistes et les bibliothécaires nord-américains, 17/07/2015 toto 186 GENÈSE DE L’EAD • Convergence entre les archivistes et les bibliothécaires nord-américains, • Origine : - remplacement du format MARC-AMC (Archival and Manuscript Control) , - recherche d’un format permettant de restituer la structure hiérarchique des collections d’archives, manuscrits, papiers, estampes, photographies, cartes, monnaies, enregistrements sonores, films, etc., - DTD initiée par la Bibliothèque de l’Université de Berkeley pour la Society of American Archivists en 1993, 17/07/2015 toto 187 GENÈSE DE L’EAD • Convergence entre les archivistes et les bibliothécaires nord-américains, • Origine : - remplacement du format MARC-AMC (Archival and Manuscript Control) , - recherche d’un format permettant de restituer la structure hiérarchique des collections d’archives, manuscrits, papiers, estampes, photographies, cartes, monnaies, enregistrements sonores, films, etc., - DTD initiée par la Bibliothèque de l’Université de Berkeley pour la Society of American Archivists en 1993, • Groupe de travail (SAA Committee on Archival Information Exchange) réunissant la Bibliothèque du Congrès, RLG, OCLC, le Public Records Office qui a produit une version bêta en octobre 1996 ; version 1.0 de juin 1998, 17/07/2015 toto 188 GENÈSE DE L’EAD • Convergence entre les archivistes et les bibliothécaires nord-américains, • Origine : - remplacement du format MARC-AMC (Archival and Manuscript Control) , - recherche d’un format permettant de restituer la structure hiérarchique des collections d’archives, manuscrits, papiers, estampes, photographies, cartes, monnaies, enregistrements sonores, films, etc., - DTD initiée par la Bibliothèque de l’Université de Berkeley pour la Society of American Archivists en 1993, • Groupe de travail (SAA Committee on Archival Information Exchange) réunissant la Bibliothèque du Congrès, RLG, OCLC, le Public Records Office qui a produit une version bêta en octobre 1996 ; version 1.0 de juin 1998, • Standard maintenu par le Library of Congress Development and Marc Standards Office, ce qui garantit la compatibilité avec les formats MARC. 17/07/2015 toto 189 EAD • DTD SGML traduite en XML en octobre 1999, 17/07/2015 toto 190 EAD • DTD SGML traduite en XML en octobre 1999, • Groupe de travail francophone sur l’EAD (janvier 2000), 17/07/2015 toto 191 EAD • DTD SGML traduite en XML en octobre 1999, • Groupe de travail francophone sur l’EAD (janvier 2000), • Traduction française en cours depuis mai 2000 du guide d’application et de la bibliothèque des balises par un groupe de travail AFNOR (CG 46/CN 357, « Modélisation, production et accès aux documents »). 17/07/2015 toto 192 EAD • DTD SGML traduite en XML en octobre 1999, • Groupe de travail francophone sur l’EAD (janvier 2000), • Traduction française en cours depuis mai 2000 du guide d’application et de la bibliothèque des balises par un groupe de travail AFNOR (CG 46/CN 357, « Modélisation, production et accès aux documents »). • Le guide d’application et la bibliothèque des balises de l’EAD décrivent les éléments balisés à utiliser, leur contenu, leurs attributs et les valeurs de ces attributs, ainsi que l’ordre de saisie des éléments et les emboîtements requis. 17/07/2015 toto 193 EAD • Type TEI : en-tête et corps de l’instrument de recherche, 17/07/2015 toto 194 EAD • Type TEI : en-tête et corps de l’instrument de recherche, • Description en 12 niveaux hiérarchiques d’arborescence possibles avec les mêmes éléments de description, 17/07/2015 toto 195 EAD • Type TEI : en-tête et corps de l’instrument de recherche, • Description en 12 niveaux hiérarchiques d’arborescence possibles avec les mêmes éléments de description, • Utilisation possible de toutes les balises à chaque niveau de l’arborescence sans redondance des informations, 17/07/2015 toto 196 EAD • Type TEI : en-tête et corps de l’instrument de recherche, • Description en 12 niveaux hiérarchiques d’arborescence possibles avec les mêmes éléments de description, • Utilisation possible de toutes les balises à chaque niveau de l’arborescence sans redondance des informations, • DTD conçue pour encoder les instruments de recherche et les fonds spécialisés qui permet : - de considérer un fonds comme un « super document », 17/07/2015 toto 197 EAD • Type TEI : en-tête et corps de l’instrument de recherche, • Description en 12 niveaux hiérarchiques d’arborescence possibles avec les mêmes éléments de description, • Utilisation possible de toutes les balises à chaque niveau de l’arborescence sans redondance des informations, • DTD conçue pour encoder les instruments de recherche et les fonds spécialisés qui permet : - de considérer un fonds comme un « super document », - la présentation de descriptions longues et emboîtées, 17/07/2015 toto 198 EAD • Type TEI : en-tête et corps de l’instrument de recherche, • Description en 12 niveaux hiérarchiques d’arborescence possibles avec les mêmes éléments de description, • Utilisation possible de toutes les balises à chaque niveau de l’arborescence sans redondance des informations, • DTD conçue pour encoder les instruments de recherche et les fonds spécialisés qui permet : - de considérer un fonds comme un « super document », - la présentation de descriptions longues et emboîtées, - la description à 12 niveaux, 17/07/2015 toto 199 EAD • Type TEI : en-tête et corps de l’instrument de recherche, • Description en 12 niveaux hiérarchiques d’arborescence possibles avec les mêmes éléments de description, • Utilisation possible de toutes les balises à chaque niveau de l’arborescence sans redondance des informations, • DTD conçue pour encoder les instruments de recherche et les fonds spécialisés qui permet : - de considérer un fonds comme un « super document », - la présentation de descriptions longues et emboîtées, - la description à 12 niveaux, - une grande finesse de recherche : chaque élément balisé est indexable et la recherche en texte intégral est possible sur 17/07/2015 200 l’ensemble du document, toto CARACTÉRISTIQUES DE L’EAD • DTD adaptée au traitement de fonds de tous types : imprimés, papiers, objets, documents « spécialisés » (« special collections »), etc. 17/07/2015 toto 201 CARACTÉRISTIQUES DE L’EAD • DTD adaptée au traitement de fonds de tous types : imprimés, papiers, objets, documents « spécialisés » (« special collections »), etc. • Utilisée par les Archives, les Bibliothèques et les Musées - pour la description « d’archives » au sens anglo-saxon, c’est-à-dire pratiquement toute collection hiérarchisée de documents, - pour la recherche dans des applications Web. 17/07/2015 toto 202 CARACTÉRISTIQUES DE L’EAD • DTD adaptée au traitement de fonds de tous types : imprimés, papiers, objets, documents « spécialisés » (« special collections »), etc. • Utilisée par les Archives, les Bibliothèques et les Musées - pour la description « d’archives » au sens anglo-saxon, c’est-à-dire pratiquement toute collection hiérarchisée de documents, - pour la recherche dans des applications Web. • Pas de limite de taille pour un instrument de recherche encodé en EAD, 17/07/2015 toto 203 CARACTÉRISTIQUES DE L’EAD • DTD adaptée au traitement de fonds de tous types : imprimés, papiers, objets, documents « spécialisés » (« special collections »), etc. • Utilisée par les Archives, les Bibliothèques et les Musées - pour la description « d’archives » au sens anglo-saxon, c’est-à-dire pratiquement toute collection hiérarchisée de documents, - pour la recherche dans des applications Web. • Pas de limite de taille pour un instrument de recherche encodé en EAD, • Attribut "ENCODINGANALOG" = lien avec fichiers d’autorités (MARC21 ou autres formats MARC) et autres formats de thesauri (LCSH, Getty, Rameau, Garnier, etc.), 17/07/2015 toto 204 CARACTÉRISTIQUES DE L’EAD • DTD adaptée au traitement de fonds de tous types : imprimés, papiers, objets, documents « spécialisés » (« special collections »), etc. • Utilisée par les Archives, les Bibliothèques et les Musées - pour la description « d’archives » au sens anglo-saxon, c’est-à-dire pratiquement toute collection hiérarchisée de documents, - pour la recherche dans des applications Web. • Pas de limite de taille pour un instrument de recherche encodé en EAD, • Attribut "ENCODINGANALOG" = lien avec fichiers d’autorités (MARC21 ou autres formats MARC) et autres formats de thesauri (LCSH, Getty, Rameau, Garnier, etc.), • Élément <dao> = lien avec ressources électroniques distantes, 17/07/2015 toto 205 CARACTÉRISTIQUES DE L’EAD • DTD adaptée au traitement de fonds de tous types : imprimés, papiers, objets, documents « spécialisés » (« special collections »), etc. • Utilisée par les Archives, les Bibliothèques et les Musées - pour la description « d’archives » au sens anglo-saxon, c’est-à-dire pratiquement toute collection hiérarchisée de documents, - pour la recherche dans des applications Web. • Pas de limite de taille pour un instrument de recherche encodé en EAD, • Attribut "ENCODINGANALOG" = lien avec fichiers d’autorités (MARC21 ou autres formats MARC) et autres formats de thesauri (LCSH, Getty, Rameau, Garnier, etc.), • Élément <dao> = lien avec ressources électroniques distantes, • EAD contient la notion de balises englobantes, ce qui permet de représenter une structure hiérarchisée et d’en réaliser la description à 17/07/2015niveaux si nécessaire. toto 206 plusieurs <archdesc> STRUCTURE DE L’EAD <dsc type ="combined"> <head> NOUVELLES ACQUISITIONS FRANÇAISES 1972-1986 </head> <c01><did> 16444-16466. Commandant Esterhazy et Paul Desachy. Papiers…</did> <c02 level="series"><did> I. Commandant Esterhazy…</did> <c03><did> I (16444). Mémoires du commandant Esterhazy…</did> <c04><did> F. 1-53. Sur sa jeunesse…</did></c04> <c04><did> F. 54-344. Octobre 1897…</did></c04> …. </c03> <c03><did> II (16445). Interviews…</did> <c04><did> F. 1-6. Lettre-récit…</did></c04> <c04><did> F. 7-16. Projets de déposition…</did></c04> … </c03> <c03><did> III-VIII (16446-16451). Lettres adressées…</did> <c04><did> III (16446). Lettres adressées… avant 1897…</did></c04> <c04><did> IV-VIII (16447-16457). Lettres adressées… avant 1897…</did> <c05><did> IV (16447). Abeniacar - Buchan</did></c05> … <c05><did> VIII (16451). Ray – Wilson</did></c05> 17/07/2015 toto </c04> 207 EAD • Page d’accueil de la DTD EAD : http://lcweb.loc.gov/ead/ 17/07/2015 toto 208 EAD • Page d’accueil de la DTD EAD : http://lcweb.loc.gov/ead/ • Projet européen MALVINE (MAnuscripts and Letters Via Integrated Networks in Europe) (participation française de l’ITEM) : http://helmer.hit.uib.no/malvine/EAD/page.html 17/07/2015 toto 209 APPLICATIONS EAD • Université de Californie à Berkeley, http://sunsite.berkeley.edu/FindingAids/EAD/bfac.html 17/07/2015 toto 210 APPLICATIONS EAD • Université de Californie à Berkeley, http://sunsite.berkeley.edu/FindingAids/EAD/bfac.html • Université Cornell, http://www.cornell.edu/ 17/07/2015 toto 211 APPLICATIONS EAD • Université de Californie à Berkeley, http://sunsite.berkeley.edu/FindingAids/EAD/bfac.html • Université Cornell, http://www.cornell.edu/ • Library of Congress. Development of the EAD DTD, http://www.loc.gov/ead/eadback.html 17/07/2015 toto 212 APPLICATIONS EAD • Université de Californie à Berkeley, http://sunsite.berkeley.edu/FindingAids/EAD/bfac.html • Université Cornell, http://www.cornell.edu/ • Library of Congress. Development of the EAD DTD, http://www.loc.gov/ead/eadback.html • New York Public Library http://www.nypl.org 17/07/2015 toto 213 APPLICATIONS EAD • Université de Californie à Berkeley, http://sunsite.berkeley.edu/FindingAids/EAD/bfac.html • Université Cornell, http://www.cornell.edu/ • Library of Congress. Development of the EAD DTD, http://www.loc.gov/ead/eadback.html • New York Public Library http://www.nypl.org • Université de Virginie, jefferson.village.virginia.edu/ead/ 17/07/2015 toto 214 APPLICATIONS EAD • Université de Californie à Berkeley, http://sunsite.berkeley.edu/FindingAids/EAD/bfac.html • Université Cornell, http://www.cornell.edu/ • Library of Congress. Development of the EAD DTD, http://www.loc.gov/ead/eadback.html • New York Public Library http://www.nypl.org • Université de Virginie, jefferson.village.virginia.edu/ead/ • EAD Working Group, http://sunsite.berkeley.edu/FindingAids/EAD/eadwg.html 17/07/2015 toto 215 L’EAD EN FRANCE • 1999 : avec le soutien financier de la Mission de la recherche et de la technologie du ministère de la Culture, conversion en EAD d’un inventaire des Archives des Pyrénées-Orientales, 17/07/2015 toto 216 L’EAD EN FRANCE • 1999 : avec le soutien financier de la Mission de la recherche et de la technologie du ministère de la Culture, conversion en EAD d’un inventaire des Archives des Pyrénées-Orientales, • 2000 : Groupe de travail francophone sur l’EAD (janvier), 17/07/2015 toto 217 L’EAD EN FRANCE • 1999 : avec le soutien financier de la Mission de la recherche et de la technologie du ministère de la Culture, conversion en EAD d’un inventaire des Archives des Pyrénées-Orientales, • 2000 : Groupe de travail francophone sur l’EAD (janvier), • Traduction française (mai) du guide d’application et de la bibliothèque des balises par un groupe de travail AFNOR (CG 46/CN 357, « Modélisation, production et accès aux documents »). 17/07/2015 toto 218 L’EAD EN FRANCE • 1999 : avec le soutien financier de la Mission de la recherche et de la technologie du ministère de la Culture, conversion en EAD d’un inventaire des Archives des Pyrénées-Orientales, • 2000 : Groupe de travail francophone sur l’EAD (janvier), • Traduction française (mai) du guide d’application et de la bibliothèque des balises par un groupe de travail AFNOR (CG 46/CN 357, « Modélisation, production et accès aux documents »). - L’EAD n’étant pas encore un standard validé au plan international, le groupe de traduction a noté certaines imprécisions de l’EAD pour les documents spécialisés et a proposé de nombreux ajouts et modifications à la SAA qui les a acceptés pour la plupart, permettant ainsi à l’EAD d’être mieux adaptée aux pratiques françaises des bibliothèques, archives, centres de documentation et musées. 17/07/2015 toto 219 L’EAD EN FRANCE • 2000 : La Mission de la recherche et de la technologie fait développer la DTD BiblioML à partir des formats Unimarc bibliographique et d’autorités, 17/07/2015 toto 220 L’EAD EN FRANCE • 2000 : La Mission de la recherche et de la technologie fait développer la DTD BiblioML à partir des formats Unimarc bibliographique et d’autorités, • - À la BNF, conversion des données en EAD, structuration en XML du dernier volume paru des Nouvelles acquisitions françaises (NAF) et création d’une feuille de style pour l’affichage sur écran ; le projet comporte en outre l’ajout des textes et des images libres de droits disponibles sur Gallica, des ektachromes et clichés noir et blanc numérisés et le chargement sur le site Web de la BNF, 17/07/2015 toto 221 L’EAD EN FRANCE • 2000 : La Mission de la recherche et de la technologie fait développer la DTD BiblioML à partir des formats Unimarc bibliographique et d’autorités, • - À la BNF, conversion des données en EAD, structuration en XML du dernier volume paru des Nouvelles acquisitions françaises (NAF) et création d’une feuille de style pour l’affichage sur écran ; le projet comporte en outre l’ajout des textes et des images libres de droits disponibles sur Gallica, des ektachromes et clichés noir et blanc numérisés et le chargement sur le site Web de la BNF, • - Études menées par l’INHA sur une éventuelle utilisation de EAD et XML. 17/07/2015 toto 222 L’EAD EN FRANCE • 2001 : le DOSI du ministère de la Culture fait développer pour les Archives de France un outil de saisie EAD XML d’après les spécifications d’un CCTP rédigé à l’automne 2000, 17/07/2015 toto 223 L’EAD EN FRANCE • 2001 : le DOSI du ministère de la Culture fait développer pour les Archives de France un outil de saisie EAD XML d’après les spécifications d’un CCTP rédigé à l’automne 2000, • Projets en cours de conception ou de réalisation : - Direction des Archives de France, - Centre historique des archives nationales (Archives privées), - Bibliothèque nationale de France, - Direction du livre et de la lecture, - Bibliothèque de l’Institut de France, - Fondation Napoléon (Conseil d’État), - Bibliothèque de l’Institut Pasteur, - Centre de documentation du Musée du Louvre, - IMEC, etc. 17/07/2015 toto 224 EAD ET MARC • Aucune incompatibilité fonctionnelle entre EAD et les formats MARC, 17/07/2015 toto 225 EAD ET MARC • Aucune incompatibilité fonctionnelle entre EAD et les formats MARC, • Complémentarité entre EAD-XML et MARC : 17/07/2015 toto 226 EAD ET MARC • Aucune incompatibilité fonctionnelle entre EAD et les formats MARC, • Complémentarité entre EAD-XML et MARC : - puissance de la structure logique de XML et son arborescence a priori infinie, 17/07/2015 toto 227 EAD ET MARC • Aucune incompatibilité fonctionnelle entre EAD et les formats MARC, • Complémentarité entre EAD-XML et MARC : - puissance de la structure logique de XML et son arborescence a priori infinie, - précision de la structure logique de l’EAD et de son arborescence à 12 niveaux, 17/07/2015 toto 228 EAD ET MARC • Aucune incompatibilité fonctionnelle entre EAD et les formats MARC, • Complémentarité entre EAD-XML et MARC : - puissance de la structure logique de XML et son arborescence a priori infinie, - précision de la structure logique de l’EAD et de son arborescence à 12 niveaux, - netteté de l’aspect sémantique de MARC (999 zones possibles, mais arborescence à 2 niveaux seulement : zones, sous-zones). 17/07/2015 toto 229 EAD ET MARC • Pour les bibliothèques, possibilité d’ajouter un en-tête EAD (notamment pour la gestion des droits) à des notices MARC liées à des fichiers d’autorité pour obtenir un système d’interrogation structuré en XML, ce qui permet l’affichage simultané des ressources numériques, 17/07/2015 toto 230 EAD ET MARC • Pour les bibliothèques, possibilité d’ajouter un en-tête EAD (notamment pour la gestion des droits) à des notices MARC liées à des fichiers d’autorité pour obtenir un système d’interrogation structuré en XML, ce qui permet l’affichage simultané des ressources numériques, • Le schéma XML est une voie à explorer pour les bibliothèques : il permet l’utilisation de plusieurs DTD dans le même document XML. 17/07/2015 toto 231 EAD ET MARC • MARC-PM (Machine Readable Cataloguing Perl Module) : http://marcpm.sourceforge.net/ 17/07/2015 toto 232 EAD ET MARC • MARC-PM (Machine Readable Cataloguing Perl Module) : http://marcpm.sourceforge.net/ • MARC-PM : http://marcpm.sourceforge.net/documentation/marc::xml/ MARC-XML.htm 17/07/2015 toto 233 EAD ET MARC • MARC-PM (Machine Readable Cataloguing Perl Module) : http://marcpm.sourceforge.net/ • MARC-PM : http://marcpm.sourceforge.net/documentation/marc::xml/ MARC-XML.htm • Library of Congress : http://lcweb.loc.gov/marc/marcsgml.html 17/07/2015 toto 234 ONIX ET MARC : Enregistrement UNIMARC 000 NNNNnam# 22NNNNN2n 450 001 1234567890 010 ## $a 0816016356$bhardback$d35.00 USD 100 ## $a YYYYMMDD 1987 m eng 01 101 ## $a EN 200 #1 $a British English, A-Zed 205 ## $a Edition 3 210 ## $c Facts on file publications$d1987 215 ## $a 493 p.$d9.25 x 6.25 x 1.2 330 ## $a BRITISH ENGLISH, A TO ZED is the thoroughly updated, revised, and expanded third edition of Norman Schur’s highly acclaimed transatlantic dictionary for English speakers. First published as BRITISH SELF-TAUGHT and then as ENGLISH ENGLISH, this collection of Briticisms for Americans, and Americanisms for the British, is a scholarly yet witty lexicon, combining definitions with commentary on the most frequently used and some lesser known words and phrases. Highly readable, it’s a snip of a book, and one that sorts out – through comments in American – the “Queen’s English” – confounding as it may seem 700 #1 $a Schur$bNorman W$4070 886 2# $a A Harvard graduate in Latin and Italian literature, Norman Schur attended the University of Rome and the Sorbonne before returning to the United States to study law at Harvard and Columbia Law Schools. Now retired from legal practice, Mr Schur is a fluent speaker and writer 17/07/2015 toto 235of both British and American English ONIX ET MARC : 17/07/2015 <product> <a001>1234567890</a001> <a002>03</a002> <b004>0816016356</b004> <b012>BB</b012> <b028>British English, A to Zed</b028> <contributor> <b035>A01</b035> <b037>Schur, Norman W</b037> <b044>A Harvard graduate in Latin and Italian literature, Norman Schur […] is a fluent speaker and writer of both British and American English </b044> </contributor> <b056>REV</b056> <b057>3</b057> <b059>EN</b059> <b061>493</b061> <b064>REF008000</b064> <b073>01</b073> <b079>Facts on File Publications</b079> <b081>Facts on File Inc</b081> <b003>1987</b003> <c096>9.25</c096> <c097>6.25</c097> <c098>1.2</c098> <d101>BRITISH ENGLISH, A TO ZED is the thoroughly updated, […] in American – the “Queen’s English” – confounding as it may seem.</d101> <supplydetail> <price> <j151>35.00</j151> </price> toto 236 </supplydetail> </product> EAD ET MARC : FORMAT MARC DTD EAD 999 zones descriptives 160 zones descriptives 12 niveaux 2 niveaux (zone, sous-zone) FONDS PIÈCES RECUEILS 17/07/2015 toto 237 DANS UN SCHÉMA XML : DTD MARC 999 zones descriptives FONDS DTD EAD 12 niveaux PIÈCES RECUEILS 17/07/2015 IMAGES TEXTES EN MODE IMAGE totoTEXTES EN MODE TEXTE 238