La communauté comme indexeur .Olivier Ertzscheid. Maître de Conférences. .IUT La Roche sur Yon.

Download Report

Transcript La communauté comme indexeur .Olivier Ertzscheid. Maître de Conférences. .IUT La Roche sur Yon.

La communauté comme indexeur
.Olivier Ertzscheid. Maître de Conférences.
.IUT La Roche sur Yon. Université de Nantes.
.Laboratoire DOCSI.
http://www.affordance.info
Définition
• « Folksonomies désignent
– un processus de classification collaborative
– par des mots-clés librement choisis
– Ou le résultat de cette classification. » (Wikipédia)
≠ thesaurus
•
« vocabulaire normalisé sur la base de termes génériques et de termes spécifiques à
un domaine »
≠ ontologie
•
•
•
« ensemble structuré de concepts. (…)
organisés dans un graphe (…)
relations sémantiques et de composition ou d'héritage. »
Folksonomie ≠ thesaurus ≠ ontologie
• « Folksonomies désignent
– un processus de classification collaborative
– par des mots-clés librement choisis
– Ou le résultat de cette classification. »
•
•
•
•
Vocabulaire non-normalisé,
non-structuré,
non-spécifique à un domaine,
sans relations sémantiques ou hiérarchiques.
5 étapes d’indexation Web
Standardisation
GOOGLE
PageRank
« Indexeurs
sans le savoir »
<META>
Communauté
de pratique
?
Web
Sémantique
DUBLIN-CORE
OAI-PMH
Communauté
Métier / Ressources
FOLKSONOMIES
Communauté
D’usage
?
Linguistique
de corpus
ONTOLOGIES
Communauté
compétences
(Outils + métier)
Dél.icie.uses folksonomies
Qui indexe ?
Usagers,
Consommateurs,
Producteurs,
Auteurs,
Novices,
Experts.
A la volée
En surface
En profondeur (deep tagging)
En connaissance de cause
Au hasard
Pour moi (tags privés)
Pour les autres (tags publics)
Comment ?
Quoi ?
Textes
Docs de travail
Articles scientifiques
Billets de blogs
Photos
Vidéos
A moi
Aux autres
Organiser,
Partager,
Chercher,
Retrouver
Associer,
« Participer »
Pourquoi ?
? Avantages = Inconvénients ?
•
•
•
•
•
Indexation humaine, à la volée, instantanée, cumulative, simple, rapide,
gratuite
Intérêt d’un filtrage collaboratif
gain de temps, gain d’échelle, économie d’expertise (masse critique des indexeurs)
…
Couverture documentaire totale (documents, livres, photos, couriels, cartes
géographiques …)
Conforme aux usages (onebox, oneword)
• Trop simple, trop peu d’expertise, trop d’hétérogénéité
• Confusion entretenue entre pertinence (autorité) et popularité
(photos les plus vues les plus tagguées et réciproquement)
• polysémie, synonymie, lemmatisation, orthographe, langue,
redondance, univers de référence (« peinture » et/ou « louvre », etc.)
• = Méta-bruit
? Avantages = Inconvénients ?
• « Folksonomist are confusing cataloging structure with personal
opinions (…). These are not the same thing and they need to be
separated. »
• Non. Ils se servent (à dessein) de leurs opinions personnels
comme d’une structure d’indexation.
• Sur le processus de classification : oui, sont plus floues, plus
polysémiques, plus imprécises.
• Mais sur les objets ?
– Qui va se lancer dans une entreprise de classification
aristotélicienne des photos de vacances de 100 000
personnes sur FlickR ?
– Doit-on décider qu’elles sont inclassables ??
Les raisons du succès
1.
2.
3.
4.
5.
6.
Temporalité réunifiée entre interface et indexation
La fonction symbolique plutôt que la vocation analytique.
Sagesse des foules
Auto-régulation
Faible coût cognitif
(enfin une) Indexation orientée-tâche
1
2
3
4
5
6
Folksonom’IST & Bibliothèques
• http://www.librarything.com
– Indexation « standard » : notice au format MARC, indexation
DEWEY, LC "subjects headings »,
– + indexation sociale : des tags associés, des fiches de
lecture et revues de la communauté, système de
recommandation
• Bibliothèque & Catalogue http://tags.library.upenn.edu/
• Intégration dans SIGB
– (open source ou propriétaires)
• Bibliothéconomie « de masse » ?
Folksonom’IST & Bases de données
• Meilleur des deux mondes ?
Folksonom’IST &
communautés scientifiques
• Postgenomic.com
• Repérage de signets
IST (CiteUlike)
• Folksonomies
présentes partout
– (accès, repérage,
commentaire des
ressources IST)
Folksonom’IST & Moteurs
• Plusiers « écoles »
– Moteurs dédiés (technorati.com)
– Fonctionalité intégrée (MyYahoo)
– Illusion folksonomique (cloud.clusty.com)
Vers des modèles hybrides ?
• Amazon : «
Collaborative structured
tagging » = Amapedia
• Tags factuels
– TagFactuel : valeur1, Valeur2,
Valeur3 ...
•
Tags catégoriels
– Relation « is a »
– Relation « like … »
– Relation « partage des attributs
essentiels »
Vers des modèles hybrides
• FlickR (& bientôt) Del.icio.us : « Machine Tags »
•
•
•
•
•
flickr:user=straup
flora:tree=coniferous
medium:paint=oil
geo:cartier="plateau mont royal"
geo:neighbourhood=geo:cartier
• Nom : attribut = valeur.
Intérêt « fusionnel »
• Exporter …
• Vers un site collaboratif
communautaire (del.icio.us)
• Des (méta)données
documentaires (HubMed)
http://hublog.hubmed.org/
Problématiques ouvertes
• « indexabilité » de l’actuelle masse documentaire
(dans laquelle tout est document, y compris …
nous)
• Bibliothéconomie de masse
• Horizon de l’indexation :
– Question n’est plus celle de l’autorité (qui a autorité
pour indexer)
– ni même de l’expertise (qui a compétence pour
indexer),
– mais celle de l’usage (qui a besoin d’indexer).
Conclusion …
• «It is neither Pandora’s box not panacea. Social
tagging highlights the interstices of authorship,
intertextuality, and context in indexing, and asks us to
fill in the gaps. It is a catalyst for improvement and
innovation in indexing. »
– Joseph T. Tennis. Social tagging and the next stpe for
indexing. 17th SIG/CR Classification Research Workshop,
Novembre 4, 2006.
• La communauté comme indexeur a son rôle à jouer.
• Pour aller vers un juste milieu entre folksonomie
débridée et rigidité taxonomique
Deep tagging