Techniques de recherche d`information - Catherine Kosma

Download Report

Transcript Techniques de recherche d`information - Catherine Kosma

Techniques de recherche
d’information
BTS CI
Catherine Kosma-Lacroze
Chapitre 2:
La recherche d’informations
Introduction
Recherche d'informations
Externes
Internes
Intranet
Internet
Base de données: extranet
Informatio
ns brutes
Sites librement accessibles
Sites à acces
restreint
Payantes
Sites
Gratuites
(ex.bibliothèques)
Moteurs de recherche
Gratuit
Payant
Section 1:
La recherche sur Internet
Notions de base
 Internet: (angl. Internetwork) réseau international
d’ordinateurs communiquant entre eux grâce à des
protocoles d’échanges de données standard.
Tout n’est pas libre de droits d’auteur et de droits de
diffusion. Facteurs limitatifs de la diffusion gratuite:
absence de profits, droits d’auteur, sécurité ou
confidentialité, absence d’accès à un ordinateur serveur,
coûts de création, de maintien et de mise à jour.
Avantage: circulation de l’information instantanée et
internationale.
Inconvénients: les sites sont éphémères; difficulté
d’établir l’authenticité de l’information.
(suite)
 FAI: Fournisseur d’Accès Internet. Société vendant de la
bande passante connectée directement à Internet.
 Adresse IP: Toutes les machines connectées à Internet ont
une adresse composée de quatre nombres séparés par un
point. Ex. système des catalogues en ligne des bibliothèques
du réseau de l’université du Québec: www.manitou.uqam.ca
132.
208.
219.
9
Institution d’éducation au Canada
Université Québec
Réseau local
Serveur
C’est le serveur DNS (Domain Name Server) qui établit
la correspondance entre IP et URL. Obligatoire pour
accéder à un serveur et naviguer sur le réseau.
(suite)
 Navigateur: logiciel permettant à l’utilisateur de
« naviguer »/ « surfer » sur le Web. Les plus connus sont:
Internet Explorer, Netscape Navigator, Mozilla Firefox.
 Serveur: Ordinateur connecté au réseau et qui met à
disposition de ses utilisateurs un ensemble de fichiers et
d’applications.
 Portail: site Web qui offre une portée d’entrée unique sur
un large panel de ressources et de services (ex. messagerie,
forums, espaces de publication, moteur de recherche, etc.)
centrés sur un domaine d’activité ou une communauté.
 Banque de données: Ensemble d’informations organisées et
traitées informatiquement et accessibles sur un réseau.
Types de recherche: recherche
par adresse URL://
 Définition: Chaîne de caractères normalisés servant
à identifier et à localiser des ressources consultables
sur Internet et à y accéder à l’aide d’un navigateur.
1. Protocole d’accès
 WWW (World Wide Web): le plus fréquent. Il
utilise le protocole HTTP (Hypertext Transfert
Protocol) pour l’échanger d’information entre le
navigateur et le serveur.
http://hôte/répertoire/sous-répertoire/fichier.html
 Autres: protocole FTP (File Transfert Protocol). Il
permet à un usager d’accéder aux disques durs
montés sur un serveur:
ftp://hôte/répertoire/sous-répertoire/fichier
2. L’extension de nom de
domaine
 L’extension par type d’activité (gTLD): (generic
top level domain name) Exemples: .com, .net, .gov,
etc.
 L’extension par zone géographique :Il s’agit des
ccTLD (codes pays). Ils correspondent aux deux
lettres internationales désignant le pays. Ex.: .fr, .uk,
.us, etc.
 En France, les noms de domaine sont gérés par
l’Afnic (Association Française pour le Nommage
Internet en Coopération).
3.Formats des fichiers
 Documents textuels: (les principaux)
1.
2.
3.
4.
5.
.doc, .rtf
.html, .htm
.pdf
.ppt, .pps
.txt
 Images:(les principaux)
1. .gif
2. .jpeg, .jpg
3. .tiff, .tif
(suite)
 Audio:
1.
2.
3.
4.
.aiff, .aif
.mid
.mp3
.ra, .ram
 Vidéo:
1.
2.
3.
4.
.avi
.mov, .qt
.mpeg, .mpg
.ra
 Compression, archivage: .exe, .rar,.zip, etc
4. Liste des sites utiles dans le
domaine du commerce international
Voir liste indicative
Types de recherche: recherche
par répertoire
 Définition: Site Web se présentant comme un
inventaire, spécialisé dans un domaine ou
non, dans lequel les sites référencés sont
classés par catégorie et accessibles au moyen
de liens hypertexte.
(suite)
(suite)
Avantages
 Sujets généraux faciles
à localiser;
 Ressources de
meilleure qualité.




Limites
Moins de ressources
couvertes;
Sujets spécifiques
difficiles à localiser;
Recherche moins à
jour;
Recherche par motsclés moins efficace.
Types de recherche: les
moteurs de recherche
Les moteurs de recherche (search engine) sont des logiciels:
 Qui permettent de consulter d’immenses bases de données
constituées par des robots balayant automatiquement le
Web;
 Qui indexent en partie son contenu et enregistrent les
données des pages repérées
 Qui permettent de faire des recherches plus ou moins
complexes en utilisant différentes clés d’accès dont les
mots-clés;
 Qui permettent d’accéder à l’information trouvée.
(suite)
Quand utiliser un moteur de recherche?
 Pour avoir des informations précises, telles que des
informations sur une personne, une organisation, un
produit, etc.;
 Pour repérer des documents spécifiques (ex. Accord de
libre échange nord-américain);
 Pour repérer des sites très récents, sui n’auraient pas
encore été inscrits dans un répertoire;
 Faire des recherches plus complexes en combinant des
mots clés.
(suite)




Avantages
Beaucoup
d’informations;
Informations précises;
Pertinence des
résultats;
Recherches complexes
possibles
Limites
 Contrôle des
informations plus ou
moins adéquat (ex.
adresses URL
périmées);
 Interrogation
complexe;
 Résultats parfois
décevants.
(suite)
 Les métamoteurs de recherche sont des logiciels
qui « lancent » la requête sur plusieurs moteurs de
recherche à la fois à partir d’une même demande de
recherche.
 Avantages: recherche rapide; recherche exhaustive.
 Limites: temps de réponse plus long; redondance.
 Exemples: Copernic, Dogpile,MetaCrawler, etc.
La recherche par mots clés (1):
la recherche simple
 Il est préférable d’inscrire une expression de
recherche ou d’établir des liens entre les termes
cherchés pour éviter les fausses combinaisons et
obtenir de meilleurs résultats.
 Si on utilise une expression de recherche, tous les
mots doivent être retrouvés dans l’ordre précis où
ils sont inscrits. En général, l’expression de
recherche doit être mise entre guillemets (“”).
(suite)
 ET : exige que tous les termes ou les expressions
inscrits soient présents dans la page trouvée.
 OU : exige que l’un ou l’autre des termes ou des
expressions y apparaissent.
 SAUF: exige que les pages ayant l’expression ou le
terme inscrit soient exclues des résutats.
 ADJ ou NEAR : les termes inscrits doivent être voisins
ou adjacents l’un de l’autre. Ce type de recherche peut
être utile, entre autres lorsqu’on cherche des
informations sur un individu dont le nom peut être
inscrit de différentes façons.
(suite)
Obtenir des ressources francophones
(suite) Obtenir des ressources par pays
La recherche par mots clés (2):
la recherche avancée
Créer des ensembles et limiter la recherche
Section 2:
Recherche sur catalogue électronique
Notions de base
 Thesaurus: Index de termes organisés.
Ensemble hiérarchique de termes/notions
clés représentant des concepts d’un domaine
particulier. Il sont organisés en thèmes et
possèdent des liens sémantiques entre eux
(synonyme, équivalent, terme spécifique ou
générique, etc.)