Document 7325809

Download Report

Transcript Document 7325809

Recherche d’information
(panorama des outils)
Gabriel Gallezot
Université de Nice Sophia Antipolis
URFIST
Plan

Contexte de la recherche d’information

Panorama des outils en Bu et sur le web
Gabriel Gallezot - Urfist PacaC
2
Imaginez la situation suivante :
Intro
En vue de la réalisation d'un prochain projet sur le développement
durable le responsable du projet vous demande :
-
-
-
-
-
De produire une bibliographie sur de le thème de
l'anthropocène
De lui fournir sur la base de la bibliographie réalisée une
dizaine de documents significatifs afin de mieux cerner ce
thème.
De surveiller un certain nombre de sites sur ce même thème.
De lui proposer un moyen simple de partager des références
(liens sur textes ou sites) avec les autres membres du projet de
recherche qui travaillent sur d'autres thèmes connexes.
Quelles sont vos pratiques informationnelles ????
Gabriel Gallezot - Urfist PacaC
3
Base Bibliographiques
Banques de données
Vue usagers
de l’info
Revues, ouvrages
Colloques
Archives Ouvertes
Editeurs,
agrégateurs
Site web, page perso, blog
Liste de
discussion
Bibliothèques
…
Resssources
Typologie Accès aux
documents
de l’info
Gabriel Gallezot - Urfist PacaC
Usage de l’information
4
Appréhension de l’info
La RI en contexte
- différentes sources
- différents outils
- différents contextes
Source : Info@vis
Gabriel Gallezot - Urfist PacaC
5
Appropriation des outils
Introducing the book
The Machine is Us/ing Us
Gabriel Gallezot - Urfist PacaC
6
La Recherche d’Information
- Bien appréhender votre question (mind mapping)
- Bien appréhender ce que vous cherchez et où vous le
cherchez (connaître les types de doc, d’info et les ressources)
- Comprendre l’envers du “décor” (indexation, aspects
commerciaux, stratégie des différents outils, …)
- Bien gérer ses requêtes (fonctionnalités des outils et
méthodes)
- S’interroger sur la validiter de l’info (paratexte, contenu, …)
Gabriel Gallezot - Urfist PacaC
7
Nommer les différents types de ressources
En BU
Les catalogues
Les bases de données
Les périodiques
Les encyclopédies et dictionnaires
Les livres électroniques
Les cédéroms
-------------------------
Sur le web
les sites web, les blogs, les wiki (autres CMS)
les portails
les archives ouvertes et les revues en ligne (Open Access)
les sites de « partage » : web 2.0
les répertoires de liens
Gabriel Gallezot - Urfist PacaC
8
Types de documents

Articles scientifiques

Brevets

Documents numérisés

Thèses et HDR

Rapports et études

Cours

Données primaires et adjuvants à la recherche

Ouvrages

Notices bibliographiques

Documents multimédias (audio, vidéo, ..)

…
> Def du document ?
> Notion d’unité documentaire
?PacaC
Gabriel Gallezot - Urfist
9
Quelques questions
Quels documents sont d'intérêt pour moi (ma question) ?

Est-ce que d'autres documents assez proches de mon intérêt
peuvent être également considérés ?

Les titres d'autres documents pourraient-ils déclencher des idées
valables pour ma recherche d'information ?

Comment mes mots-clés sont-ils réellement distribués dans un
des document ?

....
Trois notions à considérer :

Relevance (correspondance a ma question)

Pertinence (ce qui m'intéresse vraiment !)

Serendipity (quelle chose que je ne recherchais pas mais qui
pourrait également m'intéresser)

Gabriel Gallezot - Urfist PacaC
10
Chercher une aiguille dans une botte de foin
c’est :



Aiguille(s) et
botte(s) de foin


trouver une aiguille connue dans une botte de
foin connue
trouver une aiguille connue dans une botte de
foin inconnue
trouver une aiguille inconnue dans une botte
de foin inconnue
trouver n'importe quelle aiguille dans une
botte de foin
trouver […] [Koll, 00]
=> 3 façons de recherche l’information
• « chercher de l'information sur un objet bien défini ;
• chercher de l'information sur un objet incomplètement décrit
mais qui sera reconnaissable dès qu'un le rencontrera ;
• trouver de l'information de manière fortuite. » (Toms)
Gabriel Gallezot - Urfist PacaC
11
Où chercher ?
• Information contenue sur les
ordinateurs individuels
P2P
• plusieurs millions d’ordinateurs
inter-connectés
• bases de données spécialisées
• Contenu dynamique
Web invisible
• Index partiel des sites
• Interdiction d’indexation
Web visible
et Web 2.0
•10 Milliards de
Pages web
•Forum de
discussion
Gabriel Gallezot - Urfist PacaC
• Contenu indexable,
• contenu taggé
12
À partir de source : Eric Boutin
La notion d’indexation
(une notion transversale et centrale)

Indexer/classer pour retrouver (mots clés/répertoire, …)

Les métadonnées (entête)

La structuration du document (corps)

Classification :

Index

Thésaurus

Taxonomie

Facette

Ontologie
Gabriel Gallezot - Urfist PacaC
13
Gestion du bruit et du silence
Documents
relevants
Documents
non relevants
Corpus
Bien gérer VOS REQUETES !
Gabriel Gallezot - Urfist PacaC
14
Documents non retrouvés
Bien gérer
VOS
REQUETES !
Documents
retrouvés
relevants
Relevants
(silence)
non
relevants
(bruit)
non
relevants
Documents
retrouvés
Document
non retrouvés
Optimiser sa recherche d'information
Gabriel Gallezot - Urfist PacaC
15
Les opérateurs booléens

Exemple

OR
Ensemble A



AND

AND NOT
cours
tutorial
Ensemble B


cours ou
tutorial
Cours
tutorial et
gratuit
tutorial
tutorial
gratuit
Ensemble C

Tutorial
gratuit
Protection
cours
Payant
payant
cours sauf
payant
Les booléens sur GIRI : http://www.bibl.ulaval.ca/vitrine/giri/mod3/booleen.htm
Gabriel Gallezot - Urfist PacaC
16
Opérateurs (ex. google)









L'opérateur « link:site.com » (sans les guillemets) permet d'afficher les pages extérieures qui
pointent sur l'URL spécifiée
l'opérateur « site: » (sans les guillemets). Pour limiter la recherche à un site ou à un domaine
spécifique, utilisez la syntaxe « site:site_ou_domaine.com » dans le champ de recherche de
Google. OU encore recenser TOUTES les pages d'un site
Sélectionner toutes les pages contenant le mot dans l'URL et n'importe où dans la page :
inurl:motrecherché
Sélectionner toutes les pages contenant le mot dans l'URL seulement : allinurl:mot recherché
Sélectionner toutes les pages contenant le mot dans le titre et n'importe où dans la page :
intitle:mot recherché
Sélectionner toutes les pages contenant le mot dans le titre seulement : allintitle:motrecherché
Rechercher un mot contenu dans un format de document en particulier : filetype:pdf mot
recherché
Contrôler l'orthographe d'un mot ou d'une requête : spell:mot ou requête
Pour obtenir la définition d'un mot ou d'une expression, il vous suffit d'entrer define: suivi d'un
espace et des mots concernés
Gabriel Gallezot - Urfist PacaC
17
Stratégie de requête (exemple)
Google
Inurl:durand intitle « durand
pierre »
Site: durand
inurl:durand
intitle: « durand pierre »
« durand pierre »
Gabriel Gallezot - Urfist PacaC
Durand pierre
18
Source : Eric boutin
Les types de recherche




La recherche lexicale (+morphologique) : la recherche d'un mot ou d'un groupe de mots,
notamment par le biais de requêtes booléennes (et, ou, etc.). Une fonction à laquelle
s'ajoutent des opérateurs d'adjacence et de proximité. Tous des moteurs proposent en général
ce type de possibilités.
La recherche syntaxique : elle permet de retrouver un terme quelle que soit sa déclinaison
(plurielle, conjuguée, etc.), et d'étendre la recherche aux mots synonymes ou de même racine
étymologique. Cette recherche offre également des modules de recherche floue ou de
phonétisation.
La recherche statistique : lorsque la recherche s'effectue sur les mots, une analyse
statistique permet de calculer la pertinence de ces mots par rapport au référentiel
documentaire.
La recherche sémantique : l'opération s'effectue à partir d'une analyse du sens de la requête,
c'est-à-dire en recherchant les mots sémantiquement proches de ceux qu'elle utilise. La
recherche s'appuie alors sur un dictionnaire sémantique qui, à chaque mot de la langue,
associe leurs différents sens.
La combinaison des recherches sémantique, syntaxique, lexicale et statistique permet aux éditeurs de proposer des fonctions avancées : résumé de documents,
classement et sélection optimisés des réponses, jusqu'aux assistants de requêtes (conçus pour permettre à l'utilisateur d'affiner sa demande en lui proposant des
requêtes connexes ou enrichies)
Gabriel Gallezot - Urfist PacaC
19
Exemples d’outils
(panorama)
•En Bibliothèque (ex de l’UNS)
•Sur le Web
Gabriel Gallezot - Urfist PacaC
20
Ressources en BU
Gabriel Gallezot - Urfist PacaC
21
Les catalogues
(chercher des références)



à la BU
http://134.59.6.53/clientbookline/home.asp
Le Sudoc, une fédération de catalogues
nationaux : http://www.sudoc.abes.fr et le portail
: http://www.portail-sudoc.abes.fr/
Worldcat, une fédération de catalogues
internationaux : http://www.worldcat.org/
Gabriel Gallezot - Urfist PacaC
22
Les bases de données
(chercher des références et éventuellement des textes)




A L’université (BIPe – base d’interrogation des
périodiques et abonnements electro + papier
http://bibliotheque.unice.fr/jahia/Jahia/pid/4532)
Pour un éditeurs : ScienceDirect, Wiley-InterScience
(rubrique « périodique electro ») voir aussi la notion de
portail selon fonctionnalité.
Réaliser par des organismes spécialisés : l’INIST
(francis, ArticleInist )
http://services.inist.fr/public/fre/conslt.htm
Spécialisée : ex : Factiva
Gabriel Gallezot - Urfist PacaC
23
Dico and Co
(débuter une recherche)

Encyclopédie : http://www.universalis-edu.com/ (sur univ)
Gabriel Gallezot - Urfist PacaC
24
Les répertoires

Les signets de la BNF
http://signets.bnf.fr/html/categories/c_011presse.html
Les livres electroniques
•Numilog (Numilog est une bibliothèque numérique permettant
"d'emprunter" (télécharger pour une durée de temps limité) des ouvrages
numériques en format PDF. Numilog contient près de 500 titres en
Sciences économiques, humaines et sociales, et peut être consulté
depuis tous les postes de l'université mais aussi depuis l'extérieur avec
vos identifiants de messagerie.
Gabriel Gallezot - Urfist PacaC
25
EXOS Avec les outils de la
bibliothèque
(démo)



je cherche si l'ouvrage : La cité aromatique : pour le travail des matières
odorantes à Grasse - Rasse, Paul - Serre, 1987 …. Est-il disponible dans
une BU de l'univ de Nice...comment faire ?
Dans quelle(s) autre(s) BU en France l'ouvrage est-il disponible ? ...
comment faire ?
je souhaite lire l'ouvrage « Changer de société. Refaire de la sociologie, de
Bruno Latour ? » comment faire ? Conseillez-moi.
Gabriel Gallezot - Urfist PacaC
26



je cherche à savoir ce qu'est le "Dreaming" pour les Aborigènes d’Australie ...
comment faire ?
je cherche un article du Courrier International intitulé : Le livre à l'ère du
numérique; Attention, le livre électronique décolle !... comment faire ?
savez-vous si je peux consulter les articles (full-text) des revues "Journal of
the American Society for Information Science and Technology" ? et "Journal
of Documentation »
Gabriel Gallezot - Urfist PacaC
27
Ressources sur le web
Gabriel Gallezot - Urfist PacaC
28
Les bases de données

Worldcat : (catalogues http://worldcat.org/

Article Inist : (catalogues : http://services.inist.fr/public/fre/conslt.htm

Images : http://cartelfr.louvre.fr, http://openclipart.org/ ou http://www.freefoto.com

Sons : L’encyclopedie Sonore,

Librairies en ligne (Amazon, chapitre.com, …)
http://e-sonore.u-paris10.fr/esonore/main.php?daj=search_small&sid=&ref=CAE92LEG08
Gabriel Gallezot - Urfist PacaC
29
Dico and Co




Wikipedia : http://fr.wikipedia.org/wiki/Accueil
Les dictionnaires : http://www.dictionnaire-mediadico.com/
http://www.les-dictionnaires.com/
TermScience (lexiques, dictionnaires, thesaurus) :
http://www.termsciences.fr
CNRTL : Centre National de Ressources Textuelles et (Morphologies,
Lexicographie, Etymologie, Synonymie, Antonymie, Proxémie,
Concordance) http://www.cnrtl.fr/lexicographie/
Gabriel Gallezot - Urfist PacaC
30
OA & Co

HAL : http://hal.archives-ouvertes.fr/

Revues.org : http://www.revues.org/

OAIster : http://www.oaister.org/

OpenDOAR : http://www.opendoar.org/

Scientific commons http://www.scientificcommons.org/
Gabriel Gallezot - Urfist PacaC
31
Les outils de recherche du web
(quelques exemples)


















Google scholar : http://scholar.google.com
Scirus : http://www.scirus.com
Scientificcommons : http://www.scientificcommons.org/
Google book : http://books.google.com/
Esp@cenet : http://www.espacenet.com
Google patent : http://www.google.com/patents
Lecdi : http://www.lecdi.net/
In extenso : http://www.in-extenso.org/
Exalead http://www.exalead.fr
Cuil : http://www.cuil.com/
Hakia : http://www.hakia.com/
Kvisu : http://beta.kvisu.com/ [HS remplacer par Grokker]
Ixquick http://www.eu.ixquick.com/fra/
Wayback machine http://www.archive.org/
Wikio (blogs) : http://www.wikio.fr/blogs
Yahoo (Mindset) : http://mindset.research.yahoo.com/ [HS]
Open directory project http://www.dmoz.org/
Gabriel Gallezot - Urfist PacaC
Intute : http://www.intute.ac.uk/about.html
32
Exos

Reprendre les questions des diapos 26 et 27
avec les outils du web
Gabriel Gallezot - Urfist PacaC
33
Moteurs (remarques)

Interfaçage : http://www.touchgraph.com/TGGoogleBrowser.html

[HS] Searchmash : http://www.searchmash.com/

Comprendre la relation entre les moteurs : http://www.search-
this.com/search-engine-decoder/
Gabriel Gallezot - Urfist PacaC
34
Outils du web2.0
(fonction recherche uniquement
cf. dia outils de veille)




Signets : Del.ici.ous (http://delicious.com ), digg
(http://www.digg.com/ ), … :
Ref biblio : CiteUlike (http://www.citeulike.org/ ),
Bibsonomy (http://www.bibsonomy.org/ ), …
illustrations : Flickr (http://www.flickr.com/ ), youtube
(http://www.youtube.com/ ), … :
Présentations (PPT : http://www.slideshare.net )
Gabriel Gallezot - Urfist PacaC
35
Les répertoires




Répertoire de Bases de données en SHS, CALAME :
http://calame.ish-lyon.cnrs.fr/
Répertoire de revues Open Access, DOAJ : http://www.doaj.org/
Répertoire d'Archive Ouverte, OpenDOAR :
http://www.opendoar.org/
Répertoire du patrimoine numérique :
http://www.numerique.culture.fr/mpf/pub-fr/index.html

Répertoire de ressources « academiques » : Bubl ,
http://bubl.ac.uk/

Répertoire de BdD gratuites (Dadi) : http://dadi.enssib.fr/

Répertoire web2.0 : http://www.go2web20.net/

Search engines watch :
http://searchenginewatch.com/showPage.html?page=links
Gabriel Gallezot - Urfist PacaC
36
« Mon environnement de travail »
(démo)
Quelques exemples

Mes extensions FF (“mes moteurs”, zotero,…)

Mon moteur de recherche (co-op, ex : LeMien)

Mon portail : Ning, netvibe, Igoogle, facebook, …

…
Gabriel Gallezot - Urfist PacaC
37
Veille et alerte

C4U

ChangeDetecte

Wysigot

Google Alert

…
Gabriel Gallezot - Urfist PacaC
38
RSS

Contexte (cms…)

Pourquoi faire ?

Outils (local, en ligne)

En pratiques (OPML, …)
QuickTi me™ et un
décom presseur T IFF (non compressé)
sont requis pour visi onner cett e i mage.
Gabriel Gallezot - Urfist PacaC
39
Mashup

Pour faire quoi ?

Quels outils


Xfruits

yahooPipe

…
Diffusion ?
Gabriel Gallezot - Urfist PacaC
40
Cartographie

Pourquoi faire ?

Quels outils

Issue crawler

Navicrawler

…
Gabriel Gallezot - Urfist PacaC
41
Vos questions
?
Gabriel Gallezot - Urfist PacaC
42