La communauté comme indexeur .Olivier Ertzscheid. Maître de Conférences. .IUT La Roche sur Yon.
Download ReportTranscript La communauté comme indexeur .Olivier Ertzscheid. Maître de Conférences. .IUT La Roche sur Yon.
La communauté comme indexeur .Olivier Ertzscheid. Maître de Conférences. .IUT La Roche sur Yon. Université de Nantes. .Laboratoire DOCSI. http://www.affordance.info Définition • « Folksonomies désignent – un processus de classification collaborative – par des mots-clés librement choisis – Ou le résultat de cette classification. » (Wikipédia) ≠ thesaurus • « vocabulaire normalisé sur la base de termes génériques et de termes spécifiques à un domaine » ≠ ontologie • • • « ensemble structuré de concepts. (…) organisés dans un graphe (…) relations sémantiques et de composition ou d'héritage. » Folksonomie ≠ thesaurus ≠ ontologie • « Folksonomies désignent – un processus de classification collaborative – par des mots-clés librement choisis – Ou le résultat de cette classification. » • • • • Vocabulaire non-normalisé, non-structuré, non-spécifique à un domaine, sans relations sémantiques ou hiérarchiques. 5 étapes d’indexation Web Standardisation GOOGLE PageRank « Indexeurs sans le savoir » <META> Communauté de pratique ? Web Sémantique DUBLIN-CORE OAI-PMH Communauté Métier / Ressources FOLKSONOMIES Communauté D’usage ? Linguistique de corpus ONTOLOGIES Communauté compétences (Outils + métier) Dél.icie.uses folksonomies Qui indexe ? Usagers, Consommateurs, Producteurs, Auteurs, Novices, Experts. A la volée En surface En profondeur (deep tagging) En connaissance de cause Au hasard Pour moi (tags privés) Pour les autres (tags publics) Comment ? Quoi ? Textes Docs de travail Articles scientifiques Billets de blogs Photos Vidéos A moi Aux autres Organiser, Partager, Chercher, Retrouver Associer, « Participer » Pourquoi ? ? Avantages = Inconvénients ? • • • • • Indexation humaine, à la volée, instantanée, cumulative, simple, rapide, gratuite Intérêt d’un filtrage collaboratif gain de temps, gain d’échelle, économie d’expertise (masse critique des indexeurs) … Couverture documentaire totale (documents, livres, photos, couriels, cartes géographiques …) Conforme aux usages (onebox, oneword) • Trop simple, trop peu d’expertise, trop d’hétérogénéité • Confusion entretenue entre pertinence (autorité) et popularité (photos les plus vues les plus tagguées et réciproquement) • polysémie, synonymie, lemmatisation, orthographe, langue, redondance, univers de référence (« peinture » et/ou « louvre », etc.) • = Méta-bruit ? Avantages = Inconvénients ? • « Folksonomist are confusing cataloging structure with personal opinions (…). These are not the same thing and they need to be separated. » • Non. Ils se servent (à dessein) de leurs opinions personnels comme d’une structure d’indexation. • Sur le processus de classification : oui, sont plus floues, plus polysémiques, plus imprécises. • Mais sur les objets ? – Qui va se lancer dans une entreprise de classification aristotélicienne des photos de vacances de 100 000 personnes sur FlickR ? – Doit-on décider qu’elles sont inclassables ?? Les raisons du succès 1. 2. 3. 4. 5. 6. Temporalité réunifiée entre interface et indexation La fonction symbolique plutôt que la vocation analytique. Sagesse des foules Auto-régulation Faible coût cognitif (enfin une) Indexation orientée-tâche 1 2 3 4 5 6 Folksonom’IST & Bibliothèques • http://www.librarything.com – Indexation « standard » : notice au format MARC, indexation DEWEY, LC "subjects headings », – + indexation sociale : des tags associés, des fiches de lecture et revues de la communauté, système de recommandation • Bibliothèque & Catalogue http://tags.library.upenn.edu/ • Intégration dans SIGB – (open source ou propriétaires) • Bibliothéconomie « de masse » ? Folksonom’IST & Bases de données • Meilleur des deux mondes ? Folksonom’IST & communautés scientifiques • Postgenomic.com • Repérage de signets IST (CiteUlike) • Folksonomies présentes partout – (accès, repérage, commentaire des ressources IST) Folksonom’IST & Moteurs • Plusiers « écoles » – Moteurs dédiés (technorati.com) – Fonctionalité intégrée (MyYahoo) – Illusion folksonomique (cloud.clusty.com) Vers des modèles hybrides ? • Amazon : « Collaborative structured tagging » = Amapedia • Tags factuels – TagFactuel : valeur1, Valeur2, Valeur3 ... • Tags catégoriels – Relation « is a » – Relation « like … » – Relation « partage des attributs essentiels » Vers des modèles hybrides • FlickR (& bientôt) Del.icio.us : « Machine Tags » • • • • • flickr:user=straup flora:tree=coniferous medium:paint=oil geo:cartier="plateau mont royal" geo:neighbourhood=geo:cartier • Nom : attribut = valeur. Intérêt « fusionnel » • Exporter … • Vers un site collaboratif communautaire (del.icio.us) • Des (méta)données documentaires (HubMed) http://hublog.hubmed.org/ Problématiques ouvertes • « indexabilité » de l’actuelle masse documentaire (dans laquelle tout est document, y compris … nous) • Bibliothéconomie de masse • Horizon de l’indexation : – Question n’est plus celle de l’autorité (qui a autorité pour indexer) – ni même de l’expertise (qui a compétence pour indexer), – mais celle de l’usage (qui a besoin d’indexer). Conclusion … • «It is neither Pandora’s box not panacea. Social tagging highlights the interstices of authorship, intertextuality, and context in indexing, and asks us to fill in the gaps. It is a catalyst for improvement and innovation in indexing. » – Joseph T. Tennis. Social tagging and the next stpe for indexing. 17th SIG/CR Classification Research Workshop, Novembre 4, 2006. • La communauté comme indexeur a son rôle à jouer. • Pour aller vers un juste milieu entre folksonomie débridée et rigidité taxonomique Deep tagging