Transcript Motbis
Motbis Paris, le 30 janvier 2007 Un langage documentaire Au service de l’Education Nationale depuis 1989. Elaboré et maintenu par le SCEREN avec la collaboration d’enseignants, d’experts et de documentalistes. Histoire et collaborations… Motbis a été élaboré à partir de langages existants dans le système éducatif français - Thélyce, Mémobase - mais aussi à partir du vocabulaire Eudised (devenu depuis « Thésaurus Européen de l’Éducation ») ou les vedettes matières RAMEAU. Motbis est le résultat d’un travail collectif du réseau SCEREN [CNDPCRDP], relayé par des documentalistes de lycées et de collèges, mené également, lors de ses différentes versions, en collaboration étroite avec des partenaires extérieurs tels que le Centre national d’Études et de Formation de l’Enfance Inadaptée, l’Institut National de Recherche Pédagogique, le Centre National d’Études et de Ressources en Technologie Avancée, l’Ecole Supérieure de l’Education Nationale (exDPATE-D) le Réseau National de Ressources en Sciences MédicoSociales, en liaison avec le Bureau Van Dijk et le cabinet Assistance et Techniques Documentaires Rappel de définitions… Thésaurus [1] Langage documentaire fondé sur une structuration hiérarchisée d’un ou plusieurs domaines de la connaissance et dans lequel les notions sont représentées par des termes d’une ou plusieurs langues naturelles et les relations entre notions par des signes conventionnels. [1] Association française de normalisation, Vocabulaire de la documentation . - Afnor, 1987 . - (Les Dossiers de la normalisation) ISBN 2-12-484221-8 [2] Un thésaurus est une liste d’autorité organisée de descripteurs et de non descripteurs obéissant à des règles terminologiques propres et reliés entre eux par des relations sémantiques (hiérarchiques, associatives ou d’équivalence). Cette liste sert à traduire en un langage artificiel dépourvu d’ambiguïté des notions exprimées en langage naturel. [2] Association française de normalisation NF Z 47-100, décembre 1981. Règles d'établissement des thésaurus monolingues .In : Documentation. Tome 1 : présentation des publications, traitement documentaire et gestion de bibliothèques . - 6e édition . Paris-La-Défense : Afnor, 1996 . - p. 478-480 : 8. Vocabulaire ISBN 2-12-234461-X Évolutions du thésaurus Version du thésaurus Nombre de termes Dont, nombre de descripteurs Nombre de non descripteurs Nombre de microthésaurus Motbis Motbis 2.0 1.0 (1989) (1992) 10781 10668 9270 8114 Motbis 3.0 (1997) 11390 7245 Motbis 3.1 (2000) 12534 7600 1511 2554 4145 4934 156 84 80 80 Motbis 2006(janvier 2006) 18040 9085 (dont 9054 hiérarchisés) 8995 Motbis 2007 69 69 18289 9114 9175 Depuis Motbis 2006 Le thésaurus Motbis fait l’objet d’évolutions annuelles. Ses versions successives comportent désormais un millésime correspondant à l’année civile en cours Le principe est de refléter le plus fidèlement possible l’évolution des connaissances dans un domaine, les intérêts et les besoins des usagers et de combler les lacunes conceptuelles et terminologiques qui peuvent subsister. Cette version comprend également la correction des erreurs typographiques ou autres qui se sont insérées dans la version précédente du thésaurus. La version 2007 ne propose pas, comme la version 2006, de nouveau subthésaurus spécialisé destiné à un public particulier. Mais l’articulation du noyau commun Motbis 2007 et du subthésaurus agricole Thesagri demeure. Motbis 2007 Ses modifications consistent donc en : l’ajout après examen, de nouveaux termes : descripteurs pour de nouveaux concepts nécessaires, non-descripteurs pour augmentation des entrées l’ajout de relations associatives la mise à jour des données concernant les identificateurs en liste annexe le traitement des intitulés de certains descripteurs ambigus la correction des erreurs résiduelles repérées (coquilles…) de la version 2006 Organisation actuelle Au sein de la division Ingénierie éducative et documentaire, le groupe de projet Motbis assure : l’organisation et la programmation de la maintenance pour chaque nouvelle version la rédaction des documents de travail et des documents de synthèse soumis aux différents intervenants du projet l’intégrité et la cohésion du produit final la coordination technique de la mise en production de la nouvelle version la gestion et la mise à jour du site www.motbis.fr l’actualisation de l’interface de consultation en ligne de Motbis Un comité d’orientation et des groupes de travail Le comité d’orientation MOTBIS a un rôle scientifique de validation des objectifs et du contenu conceptuel et terminologique des versions du thésaurus Il se réunit 2 fois par an : pour validation des objectifs de la nouvelle version pour relecture et validation finale du contenu Il est composé de personnes – ressources utilisateurs potentiels de la nouvelle version en développement. Les membres représentants du réseau SCEREN ont une voix participative (décisionnelle) en tant que copropriétaires du thésaurus : Représentant de l’Interacadémique d’Ile-de-France : Marie- France Brézault Représentant de l’Interacadémique du Nord Est : Isabelle Berteloot Représentant de l’Interacadémique d’Outre-Mer : Claudette Braconne (éventuellement remplacée par Frédérique Péaud) Représentant de l’Interacadémique de l’Ouest : Marie-Hélène Grisaud (éventuellement remplacée par Michèle Briziou ou par Séverine Autret) Représentant de l’Interacadémique du Sud Ouest : Dominique Tascher Représentant de l’Interacadémique du Sud Est : Claudine Vidal (éventuellement remplacée par Anne Bernardini ou Carmela RIGOUT) Membres de la Direction des Ressources et des Technologies : Jérôme Bertonèche (Directeur-Adjoint) Térésa Brémand (Groupe de projet) François Feyler (Groupe de projet) Sandrine Jambert (Groupe de projet) Les membres suivants ont une voix consultative : Expert : Sylvie Dalbin (Assistance & Techniques documentaires) Représentant de l’ENESAD-CNERTA : Katell Collet Représentant du CNED : Marie-Claire Gravey Représentant de l’ESEN : Nicole Siebert-Taabni Représentant IUFM : Anne Lehmans (IUFM d’Aquitaine) Représentant CDI Collège : Sabine Dosière (Collège Pablo Neruda – Wattrelos) Représentant CDI Lycée : Jean-Marc Rochette (LEGT – LEP Jacob Holtzer – Firminy) DRT : Sylvie Moussaoui Chaque membre du comité d’orientation a en charge de : lire tous les documents préparatoires aux réunions et faire part de ses commentaires éventuels donner son avis sur les objectifs proposés pour la nouvelle version, notamment par rapport aux attentes des usagers potentiels quant au contenu du thésaurus donner son avis sur les propositions pour la nouvelle version émanant du groupe de projet valider les modifications apportées à la nouvelle version rédiger des propositions alternatives le cas échéant avant la production finale du thésaurus relire et vérifier l’orthographe, la forme des termes, l’intégrité des termes Quelques orientations: En continuité avec les objectifs de la version 2006 de Motbis, le travail de désambiguïsation des descripteurs doit être poursuivi. Pour lever l’ambiguïté de deux homonymes, il semble essentiel d’ajouter un qualificatif à chacun des termes homonymes. L’absence de qualificatif à l’un des termes laisse toute l’ambiguïté à ce concept pour un utilisateur ne connaissant pas (ou ne songeant pas à) l’existant du 2ème homonyme. Sur le choix du terme préférentiel, la notion de terme précis est apparue dans le sens de terme le plus juste. Ce terme peut être le terme scientifique, le terme courant ou vernaculaire. Le choix du concept le plus usité et du terme le plus usuel semble le plus opportun. En 2007 Ajout de relations associatives pour Motbis 2007 l’ajout de relations associatives concerne plus particulièrement les champs sémantiques suivants : 1135 phénomènes naturels et physiques 1310 physique 1325 éléments et composés chimiques 1535 accidents et maladies 3335 machines et éléments de machines 3505 technologie Les candidats descripteurs proposés pour la version 2007 sont le résultat de la collecte du champ mots-clés libres des bases internes au réseau SCEREN : BNPR, Callimaque, Educasources, @doc, … des propositions issues du travail de conception d’OTAREN des suggestions reçues via le site motbis.fr des suggestions reçues via les listes de diffusion Quelques critères : Seuls les termes qui représentent nécessairement de nouvelles notions peuvent être ajoutés. Les termes nouveaux exprimant des notions déjà présentes dans le thésaurus doivent figurer en non descripteur. Les termes nouveaux qui expriment des notions plus spécifiques doivent figurer également en non descripteurs (tout au moins pour le noyau commun) Toutefois si la liste de non descripteurs grossit considérablement, on peut envisager après réflexion, l’ajout de descripteurs plus spécifiques. Les types de modification possibles : la modification simple d’un descripteur, sans implication pour la structure conceptuelle du thésaurus : le nouveau descripteur représente la même notion que l’ancien la transformation d’un descripteur en non descripteur : il est nécessaire d’analyser les relations sémantiques établies pour l’ancien descripteur, pour évaluer leur pertinence en rapport avec le nouveau descripteur. Mais lorsqu’un nouveau terme est ajouté au lexique, on doit immédiatement apporter les corrections nécessaires à tous les descripteurs auquel il est relié sémantiquement ( liens d’équivalence (EP/EM), hiérarchique (TG/TS) ou associatif (A TA de B, B TA de A) La suppression totale d’un descripteur n’est possible que lorsqu’il est certain que ce descripteur n’est utilisé ni pour l’indexation ni pour la recherche. On doit s’assurer auparavant que la non utilisation du terme n’est pas due à un défaut structural du thésaurus (un descripteur orphelin utile peut-être oublié), un problème de niveau d’indexation, ou de lien sémantique mal construit. Si un descripteur est superflu, il est recommandé de le transformer en non descripteur La sélection des descripteurs et des nondescripteurs se fait en fonction des critères suivants : Caution bibliographique : la fréquence d'utilisation du terme dans la littérature ; les documents à traiter. Caution de l’utilisateur : la fréquence d’utilisation du terme dans les questions. Caractère univoque de la représentation du concept : un descripteur ne doit représenter qu’un seul concept et réciproquement un concept ne doit être représenté que par un descripteur unique. Il faut éviter les termes ambigus ou polysémiques. Compatibilité structurelle : la facilité d'intégration du terme dans la structure existante (réseaux sémantiques, forme du terme…). Utilisation courante : le terme choisi doit être de préférence d'usage courant si il est précis et non ambigu. Cohérence : utiliser toujours le même type de terme pour représenter les concepts et privilégier le même niveau de langage. Indépendance contextuelle : la capacité d'un terme pour représenter une réalité sans l'aide d'un contexte La forme des termes à sélectionner doit respecter les règles suivantes Nature grammaticale : substantif (éducation) ou groupe de mots (effet de serre). Langue : français ou termes d’emprunt à usage courant (camping) si un terme d’emprunt est plus en usage que sa traduction française, il peut-être utilisé comme descripteur et son équivalent français comme non descripteur (arte povera EP art pauvre, CD-ROM EP Disque Optique Compact). Si les formes française et étrangère sont toutes deux d’usage, on utilise la forme française en descripteur et la forme d’emprunt en non descripteur (coentreprise EP joint venture, stationnement EP parking). Genre : de manière générale, les descripteurs sont au masculin, mais la forme féminine peut-être utilisée pour certaines catégories de termes désignant notamment les professions, les occupations, les activités (sage-femme). Nombre : de manière générale, les descripteurs sont au singulier (adopter la forme d’entrée proposée par les dictionnaires). Utiliser le pluriel lorsque le terme n’existe qu’au pluriel dans les dictionnaires ou que son sens diffère s’il est au pluriel (arts martiaux, travaux publics, beaux arts, fouilles archéologiques). Orthographe : utiliser la forme la plus communément admise, renvoyer l’autre en non descripteur (paiement EP payement). Niveau de langue : on choisit de préférence la forme d’un terme qui correspond au niveau de langue commun aux usagers. Il faut éviter les formes trop familières, l’argot et le jargon. Abréviations et acronymes : l’abréviation et l’acronyme sont acceptés comme descripteur s’ils sont universellement connus et utilisés. Un renvoi est établi systématiquement vers le nom complet (ADN EP acide désoxyribonucléique, SIDA EP syndrome de l’immunodéficience acquise, UNESCO EP United Nations Educational, Scientific and Cultural Organization). Ponctuation : apostrophe et traits d’union sont conservés (main-d’œuvre, non-violence). On élimine le trait d’union dès qu’une source reconnue en donne l’autorisation. Il faut alors prévoir l'autre forme en non descripteur Homographie et polysémie : homographie et polysémie doivent être différenciées par l’ajout d’un qualificatif (cousin : parent, cousin : insecte). Le différentiel 2006-2007 MOTBIS 2006 MOTBIS 2007 accélération accélération : mécanique Aillaud, Gilles : 1928angle Aillaud, Gilles : 1928-2005 angle géométrique aquiculture Arman : 1928- aquaculture Arman : 1928-2005 articulation attention articulation du corps attention : psychologie audition avantage audition : physiologie démarche d'évaluation Buffet, Bernard : 1928circulation Buffet, Bernard : 1928-1999 circulation : transport Constant, Marius : 1925cours Constant, Marius : 1925-2004 cours d'enseignement CPE Dietman, Erik : 1937- conseiller principal d'éducation Dietman, Erik : 1937-2002 droit des nouvelles technologies éclairage droit des technologies de la communication éclairage : technique évaluation fécondation artificielle démarche d'évaluation reproduction assistée Ferrari, Luc : 1929Galbraith, John Kenneth : 1908- Ferrari, Luc : 1929-2005 Galbraith, John Kenneth : 1908-2006 Grosz, Georges : 1893-1959 guerre Grosz, George : 1893-1959 conflit armé inconvénient innovation démarche d'évaluation évolution scientifique et technique inscription insémination Kinshasa : Zaïre libéralisme inscription commémorative reproduction assistée Kinshasa : République démocratique du Congo libéralisme politique Ligeti, Gyorgy : 1923Mahfouz, Naguib : 1912- Ligeti, Gyorgy : 1923-2006 Mahfouz, Naguib : 1912-2006 maladie sexuellement transmissible Menotti, Gian Carlo : 1911- infection sexuellement transmissible Menotti, Gian Carlo : 1911-1993 mesure méthode d'évaluation mesure : métrologie démarche d'évaluation Newman, Barnet : 1905-1970 nouveau pauvre Newman, Barnett : 1905-1970 personne pauvre Paganini, Niccola : 1782-1840 polarisation Paganini, Niccolo : 1782-1840 polarisation : physique presse à l'école programme de recherche éducation aux médias politique de la recherche progrès scientifique évolution scientifique et technique quart monde personne pauvre rapport reproduction rapport : document reproduction : biologie Riopelle, Jean-Paul : 1923Rotella, Mimmo : 1918- Riopelle, Jean-Paul : 1923-2002 Rotella, Mimmo : 1918-2006 serveur service électronique d'information serveur informatique système électronique d'information site web site Internet Les nouveaux descripteurs 2007 Nouveaux concepts Microthésaurus Nouveau descripteur - Environnement sémantique 1010 activité scientifique 1010 évolution scientifique et technique EP innovation invention progrès scientifique TS découverte scientifique TA brevet d'invention culture scientifique et technique innovation technologique scientisme veille économique 1505 biologie 1505 identification génétique EP empreinte ADN empreinte génétique FNAEG. Fichier National Automatisé des Empreintes Génétiques preuve par empreintes génétiques test ADN TG information génétique TA ADN police scientifique 1505 reproduction assistée EP bébé éprouvette fécondation artificielle fécondation in vitro FIVETE implantation d'embryons insémination mère porteuse nouvelles technologies de la reproduction PMA. Procréation médicalement assistée procréation artificielle reproduction artificielle reproduction in vitro transfert d'embryons TG reproduction : biologie TA clonage humain clone culture in vitro droit de la famille éthique médicale fécondation stérilité 1510 animaux 1510 anoploure Les nouveaux non descripteurs empreinte génétique EM identification génétique inscription architecturale EM inscription commémorative inscription funéraire EM inscription commémorative inscription lapidaire EM inscription commémorative plaque commémorative EM inscription commémorative stèle commémorative EM monument commémoratif électron polarisé EM polarisation : physique neutron polarisé EM polarisation : physique polarisation de la lumière EM polarisation : physique polarisation des ondes électromagnétiques EM polarisation : physique polarisation électrique EM polarisation : physique épaule EM articulation du corps hanche EM articulation du corps coude EM articulation du corps genou EM articulation du corps poignet EM articulation du corps mâchoires EM articulation du corps Les nouvelles relations associatives Microthésaurus / Descripteurs - Environnement sémantique 1010 activité scientifique histoire des religions EP étude comparative des religions TG historiographie TA éducation religieuse religion 1110 géographie - géologie géologie historique TG géologie TS ère géologique paléontologie stratigraphie TA préhistoire géomorphologie TG géographie physique TA glaciation phénomène géomorphologique télédétection 1115 milieux géographiques milieu polaire EP cercle polaire Grand Nord pôle TG zone climatique TA Antarctique océan Arctique Victor, Paul-Emile : 1907-1995 désert TG paysage végétal TS oasis TA dune milieu désertique zone climatique EP géographie zonale milieu climatique TG milieu géographique TS milieu désertique milieu intertropical milieu polaire milieu tempéré TA phénomène climatique variation climatique milieu désertique http://www.motbis.fr Créer une communauté d’utilisateurs Proposer des services d’accompagnement Offrir une modalité de consultation Communiquer avec le groupe projet Rendre visible l’activité de conception et de maintenance Participer à la création du thésaurus Quelques pistes de réflexion Illusion de l’exhaustivité d’un thésaurus (« encyclopédique ») généraliste des contenus de l’enseignement général … Illusion de l’objectivité, un thesaurus est toujours une représentation du monde La difficulté de réactivité, de consensus sur les termes Les écarts entre prescriptions et usages réels Entre la continuité et la mutation Connaître les usages réels Améliorer sans révolutionner Trouver de nouvelles formes de collaboration pour le suivi et les ajouts Analyser l’existant, expérimenter et réfléchir à l’ avenir Se placer dans une perspective d’interopérabilité terminologique Expérimentations pour Motbis 2008 Trois orientations possibles à experimenter: Orientation 1- Outils de recherche adaptés, distincts de l’outil d’indexation Certains publics de Motbis n’utilisent pas de thésaurus pour trouver des documents. Il conviendrait donc de développer, à partir du même réservoir terminologique et sémantique, des outils de recherche adaptés pour leur permettre d’atteindre leur but : trouver les documents les plus pertinents. Orientation 2 – Des langages spécialisés adossés à Motbis En tant que « langage spécialisé dans le domaine éducatif et représentatif des sciences de l'éducation et des contenus de l'enseignement général français », Motbis n’intègre pas l’ensemble des concepts spécialisés, utiles à tous ses publics, au degré de précision voulu. De plus, sa structure globale (la liste des champs sémantiques) constitue une table de matières difficile voire impossible à utiliser dans des secteurs spécialisés et/ou professionnels, à la recherche documentaire mais également à l’indexation. Orientation 3 – Un langage polyhiérarchique Un thésaurus polyhiérarchique semble plus efficient qu’un thésaurus monohiérarchique. Un thésaurus monohiérarchique en obligeant l’utilisateur à aller consulter plusieurs domaines en parallèle, semble complexifier sa tâche. Hypothèse 1.Langage d’indexation/ langage d’interrogation Une recherche documentaire est plus performante (efficiente) lorsqu’elle est conduite avec un outil de recherche adapté à l’interrogateur (non-indexeur) qui effectue l’interrogation, en lieu et place de l’outil d’indexation. Il ne s’agit pas ici de monter une expérimentation pour chacun des différents publics de Motbis, ni de définir précisément ce que serait un tel outil pour chacun des publics, mais de démontrer la pertinence du principe même de développement d’un outil d’interrogation distinct de l’outil d’indexation. L’expérimentation aura lieu en « laboratoire ». Cette expérimentation doit prendre appui sur deux cas de figure précis : Cas1. Interrogation d’une base constituée de notices provenant de plusieurs sources, indexées avec des langages distincts Cas2. Interrogation simultanée de bases documentaires indexées par des langages différents (interrogation multisources) Un travail parallèle OTAREN Hypothèse 2 : des langages spécialisés adossés à Motbis L’indexation et la recherche documentaires dans un environnement spécialisé (agriculture, informatique, santé…) sont d’autant plus efficaces que le langage d’indexation et/ou d’interrogation est spécialisé. – Si cette hypothèse était validée, il resterait à étudier, la solution technique à retenir pour construire ces langages spécialisés à partir de Motbis. – Dans la situation actuelle, il est possible de conduire un retour d’expérience de l’utilisation de Thésagri (langage spécialisé dans le domaine de l’agriculture construit à partir de Motbis et en cours de déploiement dans les centres documentaires du réseau Renadoc). Cette enquête doit nous permettre d’évaluer la pertinence d’une telle solution à partir de Motbis. Enquête : Travail sur le domaine de l’informatique Cette expérimentation vise à évaluer la pertinence d’un langage spécialisé suivant une autre solution technique. Nous partons de l’hypothèse qu’il est possible de construire une version de Motbis remodelée de façon que : son « visage » (structure) soit accepté par un plus grand nombre d’utilisateurs les sub-thésaurus spécialisés (ou branches spécialisées) qui resteraient à construire soient plus simples à développer. Publics-cibles d’un langage spécialisé en informatique et télécommunications (Technologies de l’information), et publics-cibles non spécialistes, utilisateur d’un langage contrôlé issu du même domaine Construire un « langage spécialisé » en informatique et télécommunications (technologies de l’information) Hypothèse 3 Un langage polyhiérarchique Cette hypothèse d’évolution est alimentée par les résultats des différentes enquêtes liées aux Orientations 1 et 2 : Intérêt de la polyhiérarchie pour construire et exploiter des Motbis spécialisés (plus / moins facile) Intérêt de la polyhiérarchie pour construire et exploiter des Otaren (plus / moins facile) Pour ne pas conclure… Evoluer pour correspondre aux mutations des connaissances des usages des systèmes d’information