Transcript Motbis

Motbis
Paris, le 30 janvier 2007
Un langage documentaire
 Au service de l’Education Nationale depuis
1989.
 Elaboré et maintenu par le SCEREN avec la
collaboration d’enseignants, d’experts et de
documentalistes.
Histoire et collaborations…
 Motbis a été élaboré à partir de langages existants dans le système
éducatif français - Thélyce, Mémobase - mais aussi à partir du
vocabulaire Eudised (devenu depuis « Thésaurus Européen de
l’Éducation ») ou les vedettes matières RAMEAU.
 Motbis est le résultat d’un travail collectif du réseau SCEREN [CNDPCRDP], relayé par des documentalistes de lycées et de collèges, mené
également, lors de ses différentes versions, en collaboration étroite
avec des partenaires extérieurs tels que le Centre national d’Études et
de Formation de l’Enfance Inadaptée, l’Institut National de Recherche
Pédagogique, le Centre National d’Études et de Ressources en
Technologie Avancée, l’Ecole Supérieure de l’Education Nationale (exDPATE-D) le Réseau National de Ressources en Sciences MédicoSociales, en liaison avec le Bureau Van Dijk et le cabinet Assistance et
Techniques Documentaires
Rappel de définitions…
Thésaurus
 [1] Langage documentaire fondé sur une structuration hiérarchisée
d’un ou plusieurs domaines de la connaissance et dans lequel les
notions sont représentées par des termes d’une ou plusieurs langues
naturelles et les relations entre notions par des signes conventionnels.
[1] Association française de normalisation, Vocabulaire de la documentation . - Afnor, 1987 . - (Les Dossiers de la normalisation)
ISBN 2-12-484221-8
 [2] Un thésaurus est une liste d’autorité organisée de descripteurs et
de non descripteurs obéissant à des règles terminologiques propres
et reliés entre eux par des relations sémantiques (hiérarchiques,
associatives ou d’équivalence). Cette liste sert à traduire en un
langage artificiel dépourvu d’ambiguïté des notions exprimées en
langage naturel.
[2] Association française de normalisation NF Z 47-100, décembre 1981. Règles d'établissement des thésaurus monolingues .In :
Documentation. Tome 1 : présentation des publications, traitement documentaire et gestion de bibliothèques . - 6e édition . Paris-La-Défense : Afnor, 1996 . - p. 478-480 : 8. Vocabulaire ISBN 2-12-234461-X
Évolutions du thésaurus
Version du thésaurus
Nombre de termes
Dont, nombre de
descripteurs
Nombre de non descripteurs
Nombre de
microthésaurus
Motbis
Motbis 2.0
1.0 (1989) (1992)
10781
10668
9270
8114
Motbis 3.0
(1997)
11390
7245
Motbis 3.1
(2000)
12534
7600
1511
2554
4145
4934
156
84
80
80
Motbis 2006(janvier 2006)
18040
9085 (dont 9054
hiérarchisés)
8995
Motbis 2007
69
69
18289
9114
9175
Depuis Motbis 2006
 Le thésaurus Motbis fait l’objet d’évolutions annuelles. Ses versions
successives comportent désormais un millésime correspondant à
l’année civile en cours
 Le principe est de refléter le plus fidèlement possible l’évolution des
connaissances dans un domaine, les intérêts et les besoins des
usagers et de combler les lacunes conceptuelles et terminologiques
qui peuvent subsister.
 Cette version comprend également la correction des erreurs
typographiques ou autres qui se sont insérées dans la version
précédente du thésaurus.
 La version 2007 ne propose pas, comme la version 2006, de nouveau
subthésaurus spécialisé destiné à un public particulier. Mais
l’articulation du noyau commun Motbis 2007 et du subthésaurus
agricole Thesagri demeure.
Motbis 2007
Ses modifications consistent donc en :
 l’ajout après examen, de nouveaux termes : descripteurs
pour de nouveaux concepts nécessaires, non-descripteurs
pour augmentation des entrées
 l’ajout de relations associatives
 la mise à jour des données concernant les identificateurs
en liste annexe
 le traitement des intitulés de certains descripteurs ambigus
 la correction des erreurs résiduelles repérées (coquilles…)
de la version 2006
Organisation actuelle
Au sein de la division Ingénierie éducative et documentaire,
le groupe de projet Motbis assure :
 l’organisation et la programmation de la maintenance pour
chaque nouvelle version
 la rédaction des documents de travail et des documents de
synthèse soumis aux différents intervenants du projet
 l’intégrité et la cohésion du produit final
 la coordination technique de la mise en production de la
nouvelle version
 la gestion et la mise à jour du site www.motbis.fr
 l’actualisation de l’interface de consultation en ligne de
Motbis
Un comité d’orientation et
des groupes de travail


























Le comité d’orientation MOTBIS a un rôle scientifique de validation des objectifs et du contenu conceptuel et terminologique des versions du
thésaurus
Il se réunit 2 fois par an :
pour validation des objectifs de la nouvelle version
pour relecture et validation finale du contenu
Il est composé de personnes – ressources utilisateurs potentiels de la nouvelle version en développement.
Les membres représentants du réseau SCEREN ont une voix participative (décisionnelle) en tant que copropriétaires du thésaurus :
Représentant de l’Interacadémique d’Ile-de-France : Marie- France Brézault
Représentant de l’Interacadémique du Nord Est : Isabelle Berteloot
Représentant de l’Interacadémique d’Outre-Mer : Claudette Braconne (éventuellement remplacée par Frédérique Péaud)
Représentant de l’Interacadémique de l’Ouest : Marie-Hélène Grisaud (éventuellement remplacée par Michèle Briziou ou par Séverine Autret)
Représentant de l’Interacadémique du Sud Ouest : Dominique Tascher
Représentant de l’Interacadémique du Sud Est : Claudine Vidal (éventuellement remplacée par Anne Bernardini ou Carmela RIGOUT)
Membres de la Direction des Ressources et des Technologies :
Jérôme Bertonèche (Directeur-Adjoint)
Térésa Brémand (Groupe de projet)
François Feyler (Groupe de projet)
Sandrine Jambert (Groupe de projet)
Les membres suivants ont une voix consultative :
Expert : Sylvie Dalbin (Assistance & Techniques documentaires)
Représentant de l’ENESAD-CNERTA : Katell Collet
Représentant du CNED : Marie-Claire Gravey
Représentant de l’ESEN : Nicole Siebert-Taabni
Représentant IUFM : Anne Lehmans (IUFM d’Aquitaine)
Représentant CDI Collège : Sabine Dosière (Collège Pablo Neruda – Wattrelos)
Représentant CDI Lycée : Jean-Marc Rochette (LEGT – LEP Jacob Holtzer – Firminy)
DRT : Sylvie Moussaoui
Chaque membre du comité d’orientation a en
charge de :
 lire tous les documents préparatoires aux réunions et faire
part de ses commentaires éventuels
 donner son avis sur les objectifs proposés pour la nouvelle
version, notamment par rapport aux attentes des usagers
potentiels quant au contenu du thésaurus
 donner son avis sur les propositions pour la nouvelle
version émanant du groupe de projet
 valider les modifications apportées à la nouvelle version
 rédiger des propositions alternatives le cas échéant
 avant la production finale du thésaurus relire et vérifier
l’orthographe, la forme des termes, l’intégrité des termes
Quelques orientations:
 En continuité avec les objectifs de la version 2006 de
Motbis, le travail de désambiguïsation des descripteurs doit
être poursuivi.
 Pour lever l’ambiguïté de deux homonymes, il semble
essentiel d’ajouter un qualificatif à chacun des termes
homonymes. L’absence de qualificatif à l’un des termes
laisse toute l’ambiguïté à ce concept pour un utilisateur ne
connaissant pas (ou ne songeant pas à) l’existant du 2ème
homonyme.
 Sur le choix du terme préférentiel, la notion de terme précis
est apparue dans le sens de terme le plus juste. Ce terme
peut être le terme scientifique, le terme courant ou
vernaculaire. Le choix du concept le plus usité et du terme
le plus usuel semble le plus opportun.
En 2007
Ajout de relations associatives pour Motbis 2007
l’ajout de relations associatives concerne plus
particulièrement les champs sémantiques suivants :
 1135 phénomènes naturels et physiques
 1310 physique
 1325 éléments et composés chimiques
 1535 accidents et maladies
 3335 machines et éléments de machines
 3505 technologie
Les candidats descripteurs proposés pour la
version 2007 sont le résultat de la collecte
 du champ mots-clés libres des bases
internes au réseau SCEREN : BNPR,
Callimaque, Educasources, @doc, …
 des propositions issues du travail de
conception d’OTAREN
 des suggestions reçues via le site motbis.fr
 des suggestions reçues via les listes de
diffusion
Quelques critères :
 Seuls les termes qui représentent nécessairement de
nouvelles notions peuvent être ajoutés.
 Les termes nouveaux exprimant des notions déjà
présentes dans le thésaurus doivent figurer en non
descripteur.
 Les termes nouveaux qui expriment des notions plus
spécifiques doivent figurer également en non descripteurs
(tout au moins pour le noyau commun)
 Toutefois si la liste de non descripteurs grossit
considérablement, on peut envisager après réflexion,
l’ajout de descripteurs plus spécifiques.
Les types de modification possibles :

la modification simple d’un descripteur, sans implication pour la structure conceptuelle du
thésaurus : le nouveau descripteur représente la même notion que l’ancien

la transformation d’un descripteur en non descripteur : il est nécessaire d’analyser les
relations sémantiques établies pour l’ancien descripteur, pour évaluer leur pertinence en
rapport avec le nouveau descripteur.

Mais lorsqu’un nouveau terme est ajouté au lexique, on doit immédiatement apporter les
corrections nécessaires à tous les descripteurs auquel il est relié sémantiquement ( liens
d’équivalence (EP/EM), hiérarchique (TG/TS) ou associatif (A TA de B, B TA de A)

La suppression totale d’un descripteur n’est possible que lorsqu’il est certain que ce
descripteur n’est utilisé ni pour l’indexation ni pour la recherche. On doit s’assurer
auparavant que la non utilisation du terme n’est pas due à un défaut structural du
thésaurus (un descripteur orphelin utile peut-être oublié), un problème de niveau
d’indexation, ou de lien sémantique mal construit. Si un descripteur est superflu, il est
recommandé de le transformer en non descripteur
La sélection des descripteurs et des nondescripteurs
se fait en fonction des critères suivants :
 Caution bibliographique : la fréquence d'utilisation du terme dans la
littérature ; les documents à traiter.
 Caution de l’utilisateur : la fréquence d’utilisation du terme dans les
questions.
 Caractère univoque de la représentation du concept : un
descripteur ne doit représenter qu’un seul concept et réciproquement
un concept ne doit être représenté que par un descripteur unique. Il
faut éviter les termes ambigus ou polysémiques.
 Compatibilité structurelle : la facilité d'intégration du terme dans la
structure existante (réseaux sémantiques, forme du terme…).
 Utilisation courante : le terme choisi doit être de préférence d'usage
courant si il est précis et non ambigu.
 Cohérence : utiliser toujours le même type de terme pour représenter
les concepts et privilégier le même niveau de langage.
 Indépendance contextuelle : la capacité d'un terme pour représenter
une réalité sans l'aide d'un contexte
La forme des termes à sélectionner doit
respecter les règles suivantes









Nature grammaticale : substantif (éducation) ou groupe de mots (effet de serre).
Langue : français ou termes d’emprunt à usage courant (camping) si un terme d’emprunt est plus en usage que sa
traduction française, il peut-être utilisé comme descripteur et son équivalent français comme non descripteur (arte
povera EP art pauvre, CD-ROM EP Disque Optique Compact). Si les formes française et étrangère sont toutes deux
d’usage, on utilise la forme française en descripteur et la forme d’emprunt en non descripteur (coentreprise EP joint
venture, stationnement EP parking).
Genre : de manière générale, les descripteurs sont au masculin, mais la forme féminine peut-être utilisée pour
certaines catégories de termes désignant notamment les professions, les occupations, les activités (sage-femme).
Nombre : de manière générale, les descripteurs sont au singulier (adopter la forme d’entrée proposée par les
dictionnaires). Utiliser le pluriel lorsque le terme n’existe qu’au pluriel dans les dictionnaires ou que son sens diffère s’il
est au pluriel (arts martiaux, travaux publics, beaux arts, fouilles archéologiques).
Orthographe : utiliser la forme la plus communément admise, renvoyer l’autre en non descripteur (paiement EP
payement).
Niveau de langue : on choisit de préférence la forme d’un terme qui correspond au niveau de langue commun aux
usagers. Il faut éviter les formes trop familières, l’argot et le jargon.
Abréviations et acronymes : l’abréviation et l’acronyme sont acceptés comme descripteur s’ils sont universellement
connus et utilisés. Un renvoi est établi systématiquement vers le nom complet (ADN EP acide désoxyribonucléique,
SIDA EP syndrome de l’immunodéficience acquise, UNESCO EP United Nations Educational, Scientific and Cultural
Organization).
Ponctuation : apostrophe et traits d’union sont conservés (main-d’œuvre, non-violence). On élimine le trait d’union
dès qu’une source reconnue en donne l’autorisation. Il faut alors prévoir l'autre forme en non descripteur
Homographie et polysémie : homographie et polysémie doivent être différenciées par l’ajout d’un qualificatif (cousin :
parent, cousin : insecte).
Le différentiel 2006-2007
MOTBIS 2006
MOTBIS 2007
accélération
accélération : mécanique
Aillaud, Gilles : 1928angle
Aillaud, Gilles : 1928-2005
angle géométrique
aquiculture
Arman : 1928-
aquaculture
Arman : 1928-2005
articulation
attention
articulation du corps
attention : psychologie
audition
avantage
audition : physiologie
démarche d'évaluation
Buffet, Bernard : 1928circulation
Buffet, Bernard : 1928-1999
circulation : transport
Constant, Marius : 1925cours
Constant, Marius : 1925-2004
cours d'enseignement
CPE
Dietman, Erik : 1937-
conseiller principal d'éducation
Dietman, Erik : 1937-2002
droit des nouvelles technologies
éclairage
droit des technologies de la communication
éclairage : technique
évaluation
fécondation artificielle
démarche d'évaluation
reproduction assistée
Ferrari, Luc : 1929Galbraith, John Kenneth : 1908-
Ferrari, Luc : 1929-2005
Galbraith, John Kenneth : 1908-2006
Grosz, Georges : 1893-1959
guerre
Grosz, George : 1893-1959
conflit armé
inconvénient
innovation
démarche d'évaluation
évolution scientifique et technique
inscription
insémination
Kinshasa : Zaïre
libéralisme
inscription commémorative
reproduction assistée
Kinshasa : République démocratique du
Congo
libéralisme politique
Ligeti, Gyorgy : 1923Mahfouz, Naguib : 1912-
Ligeti, Gyorgy : 1923-2006
Mahfouz, Naguib : 1912-2006
maladie sexuellement transmissible
Menotti, Gian Carlo : 1911-
infection sexuellement transmissible
Menotti, Gian Carlo : 1911-1993
mesure
méthode d'évaluation
mesure : métrologie
démarche d'évaluation
Newman, Barnet : 1905-1970
nouveau pauvre
Newman, Barnett : 1905-1970
personne pauvre
Paganini, Niccola : 1782-1840
polarisation
Paganini, Niccolo : 1782-1840
polarisation : physique
presse à l'école
programme de recherche
éducation aux médias
politique de la recherche
progrès scientifique
évolution scientifique et technique
quart monde
personne pauvre
rapport
reproduction
rapport : document
reproduction : biologie
Riopelle, Jean-Paul : 1923Rotella, Mimmo : 1918-
Riopelle, Jean-Paul : 1923-2002
Rotella, Mimmo : 1918-2006
serveur
service électronique d'information
serveur informatique
système électronique d'information
site web
site Internet
Les nouveaux descripteurs
2007
Nouveaux concepts
Microthésaurus
Nouveau descripteur - Environnement sémantique
1010 activité scientifique
1010
évolution scientifique et technique
EP innovation
invention
progrès scientifique
TS découverte scientifique
TA brevet d'invention
culture scientifique et technique
innovation technologique
scientisme
veille économique
1505 biologie
1505
identification génétique
EP empreinte ADN
empreinte génétique
FNAEG. Fichier National Automatisé des Empreintes
Génétiques
preuve par empreintes génétiques
test ADN
TG information génétique
TA ADN
police scientifique
1505
reproduction assistée
EP bébé éprouvette
fécondation artificielle
fécondation in vitro
FIVETE
implantation d'embryons
insémination
mère porteuse
nouvelles technologies de la reproduction
PMA. Procréation médicalement assistée
procréation artificielle
reproduction artificielle
reproduction in vitro
transfert d'embryons
TG reproduction : biologie
TA clonage humain
clone
culture in vitro
droit de la famille
éthique médicale
fécondation
stérilité
1510 animaux
1510
anoploure
Les nouveaux non descripteurs
empreinte génétique
EM identification génétique
inscription architecturale
EM inscription commémorative
inscription funéraire
EM inscription commémorative
inscription lapidaire
EM inscription commémorative
plaque commémorative
EM inscription commémorative
stèle commémorative
EM monument commémoratif
électron polarisé
EM polarisation : physique
neutron polarisé
EM polarisation : physique
polarisation de la lumière
EM polarisation : physique
polarisation des ondes électromagnétiques
EM polarisation : physique
polarisation électrique
EM polarisation : physique
épaule
EM articulation du corps
hanche
EM articulation du corps
coude
EM articulation du corps
genou
EM articulation du corps
poignet
EM articulation du corps
mâchoires
EM articulation du corps
Les nouvelles relations associatives
Microthésaurus / Descripteurs - Environnement sémantique
1010 activité scientifique
histoire des religions
EP étude comparative des religions
TG historiographie
TA éducation religieuse
religion
1110 géographie - géologie
géologie historique
TG géologie
TS ère géologique
paléontologie
stratigraphie
TA préhistoire
géomorphologie
TG géographie physique
TA glaciation
phénomène géomorphologique
télédétection
1115 milieux géographiques
milieu polaire
EP cercle polaire
Grand Nord
pôle
TG zone climatique
TA Antarctique
océan Arctique
Victor, Paul-Emile : 1907-1995
désert
TG paysage végétal
TS oasis
TA dune
milieu désertique
zone climatique
EP géographie zonale
milieu climatique
TG milieu géographique
TS milieu désertique
milieu intertropical
milieu polaire
milieu tempéré
TA phénomène climatique
variation climatique
milieu désertique
http://www.motbis.fr






Créer une communauté d’utilisateurs
Proposer des services d’accompagnement
Offrir une modalité de consultation
Communiquer avec le groupe projet
Rendre visible l’activité de conception et de maintenance
Participer à la création du thésaurus
Quelques pistes de réflexion
 Illusion de l’exhaustivité d’un thésaurus
(« encyclopédique ») généraliste des
contenus de l’enseignement général …
 Illusion de l’objectivité, un thesaurus est
toujours une représentation du monde
 La difficulté de réactivité, de consensus sur
les termes
 Les écarts entre prescriptions et usages
réels
Entre la continuité et la
mutation
 Connaître les usages réels
 Améliorer sans révolutionner
 Trouver de nouvelles formes de
collaboration pour le suivi et les ajouts
 Analyser l’existant, expérimenter et réfléchir
à l’ avenir
 Se placer dans une perspective
d’interopérabilité terminologique
Expérimentations pour
Motbis 2008

Trois orientations possibles à experimenter:

Orientation 1- Outils de recherche adaptés, distincts de l’outil d’indexation
Certains publics de Motbis n’utilisent pas de thésaurus pour trouver des documents. Il
conviendrait donc de développer, à partir du même réservoir terminologique et sémantique, des outils
de recherche adaptés pour leur permettre d’atteindre leur but : trouver les documents les plus
pertinents.

Orientation 2 – Des langages spécialisés adossés à Motbis
En tant que « langage spécialisé dans le domaine éducatif et représentatif des sciences de
l'éducation et des contenus de l'enseignement général français », Motbis n’intègre pas l’ensemble des
concepts spécialisés, utiles à tous ses publics, au degré de précision voulu. De plus, sa structure
globale (la liste des champs sémantiques) constitue une table de matières difficile voire impossible à
utiliser dans des secteurs spécialisés et/ou professionnels, à la recherche documentaire mais
également à l’indexation.

Orientation 3 – Un langage polyhiérarchique
Un thésaurus polyhiérarchique semble plus efficient qu’un thésaurus monohiérarchique. Un
thésaurus monohiérarchique en obligeant l’utilisateur à aller consulter plusieurs domaines en
parallèle, semble complexifier sa tâche.
Hypothèse 1.Langage d’indexation/ langage d’interrogation
 Une recherche documentaire est plus performante (efficiente)
lorsqu’elle est conduite avec un outil de recherche adapté à
l’interrogateur (non-indexeur) qui effectue l’interrogation, en lieu
et place de l’outil d’indexation.
Il ne s’agit pas ici de monter une expérimentation pour chacun des
différents publics de Motbis, ni de définir précisément ce que serait un tel outil pour
chacun des publics, mais de démontrer la pertinence du principe même de
développement d’un outil d’interrogation distinct de l’outil d’indexation.
L’expérimentation aura lieu en « laboratoire ». Cette expérimentation doit prendre appui sur deux cas de
figure précis :
Cas1. Interrogation d’une base constituée de notices provenant de plusieurs sources, indexées avec des
langages distincts
Cas2. Interrogation simultanée de bases documentaires indexées par des langages différents
(interrogation multisources)
 Un travail parallèle OTAREN
Hypothèse 2 : des langages spécialisés adossés à Motbis
 L’indexation et la recherche documentaires dans un
environnement spécialisé (agriculture, informatique, santé…) sont
d’autant plus efficaces que le langage d’indexation et/ou
d’interrogation est spécialisé.
– Si cette hypothèse était validée, il resterait à étudier, la
solution technique à retenir pour construire ces langages
spécialisés à partir de Motbis.
– Dans la situation actuelle, il est possible de conduire un retour
d’expérience de l’utilisation de Thésagri (langage spécialisé
dans le domaine de l’agriculture construit à partir de Motbis et
en cours de déploiement dans les centres documentaires du
réseau Renadoc). Cette enquête doit nous permettre d’évaluer
la pertinence d’une telle solution à partir de Motbis.
Enquête : Travail sur le domaine de l’informatique
Cette expérimentation vise à évaluer la pertinence d’un langage spécialisé suivant
une autre solution technique. Nous partons de l’hypothèse qu’il est possible de
construire une version de Motbis remodelée de façon que :
 son « visage » (structure) soit accepté par un plus grand nombre d’utilisateurs
 les sub-thésaurus spécialisés (ou branches spécialisées) qui resteraient à
construire soient plus simples à développer.


Publics-cibles d’un langage spécialisé en informatique et télécommunications
(Technologies de l’information), et publics-cibles non spécialistes, utilisateur
d’un langage contrôlé issu du même domaine
Construire un « langage spécialisé » en informatique et télécommunications
(technologies de l’information)
Hypothèse 3 Un langage polyhiérarchique



Cette hypothèse d’évolution est alimentée par les résultats des différentes
enquêtes liées aux Orientations 1 et 2 :
Intérêt de la polyhiérarchie pour construire et exploiter des Motbis spécialisés
(plus / moins facile)
Intérêt de la polyhiérarchie pour construire et exploiter des Otaren (plus / moins
facile)
Pour ne pas conclure…
Evoluer pour correspondre aux mutations
des connaissances
des usages
des systèmes d’information