support 1 - Groupe technique sur l`adoption de RDA en France
Download
Report
Transcript support 1 - Groupe technique sur l`adoption de RDA en France
Evolution des catalogues :
Métadonnées, Interopérabilité, web
sémantique, FRBR et RDA
ENS Lyon
17 au 19 juin 2013
Thierry Clavel et Philippe Bourdenet
Programme
Introduction : le contexte
1. Problématique de l’interopérabilité des données en
bibliothèque
Paysage applicatif
Exemple d’interopérabilité : le SCD du Maine
Pourquoi changer ? : Enjeux du Web de données pour les
bibliothèques
2. Métadonnées : jeux et formats
Expression des données en XML
Dublin Core, MODS, ONIX, TEI, EAD METS, LOMFR
3. Interopérabilité des systèmes
Notion de modèle conceptuel
4. Web sémantique et Web de données
5. FRBR et FRAD
6. RDA et le catalogage FRBerisé
Introduction : Le contexte
Bibliothèque scientifique numérique (BSN)
Une « très grande infrastructure de recherche » créée en
2009
Un projet qui fédère l’action des acteurs de
l’enseignement supérieur et de la recherche basé sur la
coopération
9 segments (axes) BSN 1 à BSN9
Projet d’établissement de L’ABES 2012-2015
Le projet compte 8 axes dont :
Missions de l’ABES : mutualisation « acquérir, signaler,
diffuser »
Signalement des ressources électroniques
« priorité absolue »
Projet SGBM
Hub de métadonnées de la recherche
Faire évoluer les catalogues
2012 : Lancement de 2 études en parallèle
Etude du cabinet pléiade sur les outils découverte
Conclusions :
La mutualisation devrait porter sur les données : base
de connaissances nationale intégrée à GOKB
Se doter d’un localisateur national
Etude du groupe de travail SGBM
3 scénarios
Choix du CA de l’ABES du 31/5/2013
SGBM : Choix du scénario 2
Migration des établissements volontaires vers le
SGBM
Maintien de CBS pour le catalogage (transferts
réguliers vers le SGBM)
Étude complémentaire de 6 mois pour le
remplacement de CBS
Etude Pléiade
Développement d’un localisateur national
Hub de métadonnées de la recherche
•Partenariat ABES-CNRS
•Récupération des métadonnées commerciales ou
institutionnelles sous n’importe quel format
•Dédoublonnage, Conversion et Redistribution des
métadonnées « enrichies » vers les bibliothèques du
réseau
que dit le projet sur FRBR et RDA et les
données ?
« L’ABES poursuivra dans la voie de l’ouverture et de
l’interopérabilité de ses données sur le web. Elle
expérimentera la mise en oeuvre du modèle FRBR en
concertation avec la BnF dans la perspective de
l’implémentation du code de catalogage RDA »
Ouverture des données (open data) vers une
interopérabilité technique et juridique
Mouvement international
Plateforme française d'ouverture des données publiques
data.gouv.fr
Exposition des données en RDF
ABES : licence ouverte (LO) recommandée par la
mission ETALAB pour les données produites par le
réseau
BnF : idem pour :
Catalogues
Gallica
Data.BnF.fr
Le comité stratégique bibliographique (CSB)
Composition : ABES, BnF et leurs tutelles
Nouvelles orientations du paysage bibliographique
français :
Exposer les métadonnées des catalogues nationaux
sur le Web de données
FRBRiser les catalogues (BnF et SUDOC)
Permettre un catalogage FRBRisé en révisant les
normes AFNOR (2015)
Préparer l’adoption de RDA pour ne pas s’isoler du
contexte international et européen
rapport d'orientation du 13 novembre 2012
FIN de l’introduction
Open URL et les résolveurs de liens
OPEN URL : protocole de métadonnées permettant de
faitre des liens contextuels
Résolveur de liens : outil informatique implémentant la
norme OpenURL et faisant le lien entre une citation
bibliographique et le texte intégral, en fonction des
abonnements de l'établissement.
Discovery tools (outil découverte)
Logiciel avec fonctions de recherche et facettes
Réservoir unique
Rapidité des résultats
Indexe texte intégral et métadonnées de différentes
bases
Base de connaissance
Autres fonctions : fourniture de documents, résolveur de
liens
Problème récurrent : bruit et pertinence des résultats
Pourquoi changer
nos catalogues ?
ou
Les enjeux du Web de données pour
les bibliothèques
Les catalogues de bibliothèques, monde
merveilleux ?
On a déjà des normes de catalogage (ISBD, AFNOR…)
des formats MARC pour saisir et récupérer des
notices…
Des SIGB qui fonctionnent…
Des OPAC et des catalogues
collectifs accessibles sur le Web…
Alors, pourquoi vouloir changer ?
1 – changer pour l’usager
Mais d’abord, est ce que nos
catalogues conviennent aux
usagers?
Source : Sylvain Machefert
Source : Sylvain Machefert
1 - changer pour L’usager
L’usager est avant tout un internaute :
Il veut tout et tout de suite
Il veut des contenus précis (un article, une chanson, etc.)
Il recherche en priorité sur le Web (et pas spécialement dans des
catalogues)
Il consulte les catalogues en recherche simple à la « google »
Il faut donc :
Faire évoluer nos catalogues pour les adapter à l’usager
Ils ramènent trop de réponses (bruit) sans les classer
Il faut structurer les résultats de recherche pour afficher des
réponses pertinentes
Aller vers l’usager
Pousser les contenus et les données des bibliothèques vers les
usagers/internautes donc sur le Web
Data.bnf.fr
Autre exemple
catalogue collectif ciné-ressources
http://www.cineressources.net/recherche_t.php
« Super » Notice
d'autorité
« nom de personne »
C'est pas merveilleux,
Cette page de résultats ?!
Expérimentation OPENCAT
OPENCAT
2 – changer pour être sur le
Web
Pourquoi Les catalogues de bibliothèques ne sont
ils pas visibles sur le Web ?
Le Web ne parle pas MARC
Le Web a ses propres normes
Et surtout …
Les catalogues sont dans
le Web profond
http://www.flickr.com/photos/markhillary/377
4707075/
http://www.flickr.com/photos/7590540
4@N00/5088208539/
Les catalogues de bibliothèques sont
dans des bases de données (silos) qui ne
sont pas indexées par les moteurs de
recherche
2 - Changer pour être sur le Web
Pourquoi adopter les standards du Web sémantique ?
pour sortir du Web profond et de notre « niche » technologique
des formats MARC
pour évoluer avec le Web
pour que la maintenance
de nos catalogues coûte moins cher
3 - Changer pour rationaliser et enrichir le travail
de catalogage
Récupérer des données produites ailleurs
Par exemple les biographies de Wikipedia
pour les auteurs
Ne pas avoir à répéter les mêmes informations
Réutiliser les données du catalogue
Par exemple : l’indexation matière
Une indexation-matière
recréée pour chaque notice
Indexation matière
dans le SUDOC :
4- Changer pour que nos données soient
réutilisées
créer des « Données liées ouvertes »
Eclater nos notices en données réutilisables
pour que n’importe qui puisse réutiliser
n’importe lesquelles de nos données
de n’importe quelle manière
Quels outils pour le changement ?
Des modèles conceptuels pour
Structurer l’information
bibliographique
Un code de catalogage
Des Technologies et
normes garantissant
l’Interopérabilité du Web
de données
Web de données
Un espace global d’information, ouvert, qui
permet de lier, exploiter, mettre à disposition,
réutiliser les données sur le Web
Métadonnées : Tentative de définition
- données sur (à propos) d’autres données
- Information structurée qui sert à décrire, trouver, localiser,
gérer, ,,, des ressources
Types de Métadonnées
Métadonnées descriptives
Titre, auteur, résumé, mots clés, etc,
Métadonnées de structure
Chapitres d’un livre, organisation d’un texte
Métadonnées de gestion (administratives)
gestion des droits (propriété intellectuelle)
Archivage et conservation
Techniques : format, type, accès aux ressources, etc,
Métadonnées ou notice ?
Métadonnées internes ou externes à une ressource
37
Formats de Métadonnées
- Métadonnées existent dans tous les secteurs
d’activité
- Nombreux formats
- Problème d’interopérabilité
Dublin core : un exemple de métadonnées
Dublin Core
Jeu de métadonnées descriptives normalisées : devenu
une norme ISO (15836) en 2003, maintenu par le DCMI
(Dublin Core Metadata Initiative).
Objectif d’origine:
décrire les ressources électroniques sur Internet dans un
contexte HTML pour faciliter la recherche , avoir des
métadonnées communes à plusieurs communautés
Caractéristiques du Dublin Core :
Simplicité : 15 éléments seulement
Souplesse d’utilisation : tous les éléments sont
facultatifs et répétables
Utilisable dans différents formats : HTML, XML, etc.
Les 15 éléments de base du Dublin Core
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
Title : titre de la ressource
Subject : mots-clés ou language documentaire
Description : présentation du contenu (résumé, table des matières, etc;)
Source : référence à une ressource dont la ressource décrite est dérivée
Language : langue utilisée dans la ressource
Relation : référence à une ressource apparentée
Coverage : couverture spatio-temporelle (périmètre ou domaine
d’application de la ressource)
Creator : auteur principal
Contributor : responsabilité secondaire
Publisher : éditeur (mise à disposition de la ressource)
Rights : gestion des droits
Date : date d’un événement dans le cycle de vie de la ressource
Type : catégorie, fonction ou genre de la ressource (contenu
sémantique)
Format : format, taille de la ressource
Identifier : identifiant (URL, ISSN etc.)
Dublin Core qualifié et non qualifié
Dublin Core non qualifié : utilisation des 15 éléments
seulement
Dublin Core qualifié : Utilisation d’un Référentiel plus
complet : Dubin Core metadata terms
Possibilité de choisir d’autres éléments et des schémas
d’encodage.
•
http://dublincore.org/documents/dcmi-terms/
Exemples de DC qualifié:
1. qualificatifs de raffinement (création de nouveaux éléments)
<meta name="dc.identifier.URI" content=« http://www.enssib.fr">
2.
schéma d’encodage (association d’un élément à un référentiel)
<meta name="dc.subject" scheme = « DDC » content= « 025.314 »>
Exemple pour un site Web
Exemple de notice OAI (métadonnées Dublin
Core)
<record>
<identifier>oai: 2450</identifier>
<dc:title> Accueillir, orienter informer </dc:title>
<dc:creator> Bertrand Calenge</dc:creator>
<dc:type>Monographie imprimée</dc:type>
…
</record>
DC Profil bibliothèques
http://dublincore.org/documents/library-applicationprofile/
Avantages du Dublin core
Simplicité
Reconnaissance internationale : norme ISO
Utilisation grandissante grâce au protocole OAI
PMH
Limites du Dublin Core
Globalement encore peu utilisé à l’échelle du Web
simplicité à double tranchant
15 éléments de base : insuffisant pour décrire des
ressources complexes
Exercice Dublin Core
Transposer en DC simple la notice MARC suivante
MODS Metadata Object Description Schema
MODS
Schéma XML développé par la Bibliothèque du Congrès
pour décrire tout type de ressource
Métadonnées descriptives
Adaptation simplifiée du MARC 21
Indépendant d’un code de catalogage
Plus riche que le Dublin Core
Mappings facilités vers différents jeux de
métadonnées : MARC, DC, RDA, ONIX
MODS
Exemples :
http://www.loc.gov/standards/mods/userguide/examples.
html
Vocabulaire MODS en RDF
http://www.loc.gov/standards/mods/modsrdf/
MODS
A quoi sert MODS ?
Décrire des ressources
Échanger des métadonnées MARC avec d’autres
jeux de métadonnées
Compatibilité OAI PMH et SRU
Qui utilise MODS en France ?
DAPHNE (Données en Archéologie, Préhistoire et
Histoire sur le NEt)
Portail Musique contemporaine
ONIX Online Information eXchange
Format de métadonnées en XML de la chaîne éditoriale
commerciale
éditeurs, diffuseurs libraires
2 schémas
ONIX for books
ONIX for serials
Fait pour l’échange
ONIX for books
Guide ONIX avec aperçu et éléments (version en
français 2009)
200 éléments :
En tête : expéditeur et destinataire
6 blocs :
description du produit
Enrichissement marketing
Détail du contenu
Conditions de publication
Matériels liés (dont autres œuvres)
Conditions d’approvisionnement
ONIX
Utilisation d’ONIX en France :
Electre / cercle de la librairie
Produit ses données en ONIX
ONIX, FRBR RDA et le Web sémantique
Mapping RDA/ONIX framework
Production de données FRBrisées en ONIX possible
ONIX n’est pas disponible sur le Web de données (en
juin 2013)