1. Cómo buscar información

Download Report

Transcript 1. Cómo buscar información

Título
1er Taller:
Dónde y cómo encontrar
información científica : una
introducción
1
Título
¿Dónde se busca información?
GOOGLE (Buscadores)
CATALOGO (de Biblioteca)
Información
desestructurada
Poca aplicabilidad de
técnicas de búsqueda
Información estructurada
Cierta aplicabilidad de
técnicas de búsqueda
Por el contrario: permite
buscar en el contenido
del texto del documento
No permite buscar en el
texto del documento
(información referencial)
2
Título
CATALOGOS
Realmente pensados para localizar documentos en una
colección “física” adquiere en la actualidad algunas
potencialidades nuevas al poder accederse a él por la
Red y a su vez poder acceder desde él a determinados
documentos en red.
La gran solución se denomina “Resolutores de enlaces”
PERO ¡OJO!: “enlazar al texto” no es “buscar en el texto”
3
Título
GOOGLE
 ¿Cuál es su gran ventaja?
Realmente no está en cómo busca: lo hace igual que cualquier base de datos:
palabras presentes en el documento.
Su gran aportación está en
CÓMO ORDENA LOS RESULTADOS DE BÚSQUEDA
“Page Rank”
Google utiliza el número de enlaces de una página concreta como medida para
evaluar su calidad informativa. De este modo, cada vínculo de una página a otra
funciona como un voto a favor de la página receptora. Pero Google no valora todos
los votos por igual: valen más aquellos vínculos, o votos, que provengan de páginas
que a su vez reciban más enlaces de otras páginas. Mediante este
"democrático" sistema el buscador Google ordena la lista de los
resultados mediante un escrutinio de votos que sitúa en los primeros lugares de la
lista a las webs que más enlaces reciben.
4
Título
¿Y su desventaja?
Información de todo tipo: científica y
divulgativa, sin filtrar, sin criterios de
calidad que nos ayuden a discernir.
No todo está en Internet ni en la WWW ni
Google controla todo lo que hay en ella.
No todo es “accesible” : Internet Invisible,
Internet de pago
5
Título
Buscadores especializados e Índices
 Fiabilidad y precisión: el método de indización "humano" de los Indices es
mejor que la indización automática de los Buscadores
 Cobertura de sedes: la indización automática de los Buscadores llega a
más sedes que la indización manual de los Índices
 Profundidad del análisis de las sedes: la indización automática de los
buscadores llega a mayor profundidad en el análisis de cada sede
Los BUSCADORES son más útiles para localizar datos concretos
Los INDICES son recomendables para búsquedas genéricas de lo más
importante
¿Cómo los localizo?
• Searchenginewatch: (http://www.searchenginewatch.com/links)
• Buscopio (http://www.buscopio.net)
• Guía de Yahoo (http://dir.yahoo.com/Computers...)
6
Título
Recursos científicos “multidisciplinares”
 Google Scholar (o Google Académico, en español),
– Algunos más especializados: Google Patents, Google Finance
 Scirus
 Scitopia
 Scientific Commons
7
Título
¿Pero dónde está la información científica?
 La mayor parte se encuentra en ARTICULOS DE REVISTAS, y en….
–
en trabajos de investigación,
• en publicaciones pendientes de revisión,
– tesis doctorales, y
» en ponencias o comunicaciones de congresos…
todos ellos en ARCHIVOS ELECTRONICOS
Gestionados por bbdd… son parte de la Internet Invisible.
 No siempre se encontrarán a través de Google Search o de otros
buscadores genéricos. Una gran parte de la información científica sólo es
localizable a través de
–
bases de datos científicas,
• portales académicos comerciales y
– depósitos científicos institucionales.
 La novedades y noticias, o ciertos temas muy concretos se suelen plantear
a través de listas de listas de distribución como las de RedIRIS, y de wikis
como, por ejemplo, Citizendium.
8
Título
Recursos “científicos”
Revistas científicas y Bibliografías
Archivos
científicas
electrónicos
(bases de datos)
(repositorios)
Sumarios:
Información estructurada
Aplicabilidad de técnicas de búsqueda
Búsqueda en el texto del documento (y
acceso directo)
Información estructurada
Total aplicabilidad de las técnicas de
búsqueda
NO garantiza el acceso al texto completo
¿Cuál es entonces su ventaja?...
DE AHÍ SU ÉXITO!!!!!!!!
9
Título
1. EXHAUSTIVIDAD
 Los depósitos de revistas y archivos electrónicos sólo incluyen aquellos que
la editorial/institución edita/controla.
–
Solución: federaciones. Pero aún es un proceso.
 Sólo las Bibliografías científicas nos garantizan el conocimiento de la casi
totalidad de lo publicado en un área de conocimiento.
 ¿Casi? La exhaustividad total es imposible… siempre existen limitaciones
basadas en :
•
•
•
•
•
Prejuicios culturales
Calidad científica
Tipos documentales
Obsolescencia de los documentos
La propia estructura de la ciencia: estudios locales
10
Título
2. ANÁLISIS Y RECUPERACION DEL CONTENIDO DE
LOS DOCUMENTOS
 Google (y la mayoría de los buscadores): ningún tipo de análisis…
delegan la labor en los “metadatos”
 Directorios: sistema de clasificación a veces excesivamente
genérico (mejor cuanto más especializado sea el directorio)
 Catálogo (de Biblioteca) y todos los catálogos: MATERIAS muy
genéricas (mejor también cuanto más especializado…)
11
Título
 Revistas electrónicas (con sus sumarios!). PALABRAS CLAVE:
suponen una profundización en el análisis de los contenidos de los
documentos mejorando su recuperación.
Forman un “lenguaje documental”* pero poco estructurado
 Bibliografías científicas (bases de datos). DESCRIPTORES. Las
palabras clave forman parte de un lenguaje documental
perfectamente organizado.
Puede estar en forma de
» Simple INDICE
» TESAURO
» ONTOLOGIA
Veamos un ejemplo en la base de datos INSPEC…
* Nota. lenguaje documental: relación de terminología científica que identifica los contenidos de los documentos
analizados, organizados de alguna manera lógica para guiar al usuario en la localización de los términos
adecuados para plantear su búsqueda
12
Título
Abstracts, resúmenes y reseñas
 Su utilidad es doble:
–
–
Como elemento de recuperación: permite recuperar por palabras del “texto” cuando este no
es recuperable
Lo más importante: nos una imagen completa del contenido real del documento
 Podemos encontrar “resúmenes” en muchos recursos… las normas de
edición obligan a los autores a colocarlos en la cabecera del documento, y
son reaprovechadas en los sistemas de información (buscadores, revistas
electrónicas, catálogos)
Pero… !cuidado!
–
–
Un resumen de autor no es un resumen científico: el autor generalmente destaca lo que
quiere demostrar
Sólo las bibliografías científicas hacen resúmenes científicos: destacan lo que realmente el
autor consigue demostrar.
 Pero más útiles aún son las “reseñas”: análisis críticos de otros autores.
Dispersas por las revistas… son más fáciles de localizar en las bases de
datos
13
Título
Su última ventaja se basa en la distinta tipología de
“artículos”





Contribuciones
Notas y experiencias
Estados de la cuestión
Reseñas
Noticias
“Tratamiento del documento”
 Estudio teórico, conceptual, matemático
 Estudio de casos, experimental, prácitico
 Análisis económico o jurídico
 Recopilación bibliográfica
Sólo las bases de datos –y no todas- permiten discriminar por estos criterios.
14
Título
De las Bibliografías a los Portales científicos
 Las revistas científicas electrónicas se agrupan a través de portales y grandes
distribuidores comerciales (CSA, Ebsco, Elsevier, Thompson, etc.).
 Tal vez el portal científico más importante y elaborado es la Web of Knowledge, más
conocido como WOK. No es de uso gratuito pero es accesible en casi todas las
universidades españolas y en la mayoría de las instituciones científicas gracias a la
licencia de la FECYT. En el WOK están Journal Citation Reports que nos
proporcionan los famosos Indices de Impacto que tan locos vuelven a los
investigadores… y muchas más cosas. La utilización de este gran portal es algo
compleja, pero hay tutoriales, ayudas, guías y los bibliotecarios que siempre estamos
dispuestos a echar una mano.
15
Título
Comunidades científicas
Seis grados de separación
Los canales de comunicación científica no
documentales siempre han sido
esenciales para la transmisión
Breve introducción
Relación de redes sociales
16
Título
¿Y los libros?
El “libro” en un sentido genérico no es considerado
en ciencias aplicadas como un instrumento de
comunicación científica, sino, según se trate de:
– Manual: fines docentes
– Tratado: obra de consulta, conocimientos consolidados
– Monografía científica: conjugación de la obra científica de un
autor, generalmente al final de su vida. A veces con carácter
recopilatorio (artículos, correspondencia, etc.)
– Monografía colectiva: trabajos científicos independientes que se
junta en torno a un tema o evento… en ocasiones, un concreto,
seminario, encuentro, etc. Tiene el mismo valor científico que los
artículos… a veces los número de revistas son monográficos de
este tipo.
17
Título
¿Qué es eso de “Literatura gris”?
 Formas más dinámicas las encontramos en las llamadas "prepublicaciones" (Pre-print, Working papers, etc.): ediciones rápidas y en
precario que se difunden entre una comunidad de científicos interesados
en el tema.
 Tesis doctorales, informes de investigación o estudio (reports) y actas de
congresos (papers) son además vehículos de información fundamentales
para todas las ciencias.
Lo “no publicado” y lo “publicado por vías no convencionales”
Internet ha influido en ellos de una doble manera:
 Mejorando su difusión: formato y acceso electrónico
 Mejorando su accesibilidad: repositorios
 Sustituyéndolos como instrumentos de comunicación: comunidades
virtuales
18
Título
Repositorios
 Un repositorio, depósito o archivo es un sitio centralizado donde
se almacena y mantiene información digital, habitualmente bases
de datos o archivos informáticos.
 Los depósitos están preparados para distribuirse habitualmente
sirviéndose de una red informática como Internet o en un medio
físico como un disco compacto. Y pueden ser de acceso público, o
pueden estar protegidos y necesitar de una autentificación previa.
Los depósitos más conocidos son los de carácter académico y los
institucionales.
19
Título
Open Access y Repositorios científicos
 Gracias al movimiento Open Access se han ido desarrollando una serie de
Depósitos científicos “institucionales” que son de libre acceso y en los que
encontraremos una gran cantidad de información
Podemos buscar en varios de ellos a la vez a través de E- Ciencia
(Comunidad de Madrid) y RECERCAT (Cataluña).
 En el mundo internacional los Depósitos científicos más conocidos son
ArXiv (matemáticas y astrofísca) , CogPrint (neurociencia), Networked
Digital Library of Theses and Dissertations (NDLTD) (tesis), RePec
(economía), Open Vídeo Project (videos). Y como buscadores o directorios
internacionales de Open Acces están por ejemplo: CiteSeer (que, además,
proporciona información sobre citas), Citebase, OAIster , BASE (Bielefeld
Academic Search Engine) y el directorio del CERN Document Server
20
Título
¿A que accedemos desde la Universidad?
Búsqueda en Recursos electrónicos (listado A/Z):
Seleccionamos la
tipología del recurso en
el desplegable.
Podemos acotar también
por materias
21
Título
¿E Internet?
 La red es el medio donde se mueven los PORTALES CIENTIFICOS con sus …
–
–
–
bases de datos (Bibliografías)
Sus depósitos de documentos (Archivos electrónicos)
Y servicios de valor añadido (Acceso al documento, “Pregunte”, etc.)
 Y a la vez es una fuente de información en sí misma al almacenar multitud de
documentos e informaciones dispersos
 PERO HAY QUE SABER DÓNDE Y CÓMO BUSCAR
22
Título
Una cita, para terminar…
"Un día bastará con mover unas pequeñas agujas
sobre el cuadrante numerado de un mostrador,
para leer directamente las últimas informaciones
dadas por la Enciclopedia Mundial, dispuesta
como un centro de irradiación continua. Este
será el libro que, conteniendo todos los asuntos,
estará a disposición de todo el universo"
(Paul Otlet 1937)
23
Título
CONCLUYENDO: principales obstáculos
 Dispersión
Solución:
– Integración: SFX…. En el futuro METALIB.
– Cooperación: repositorios
– Control: sistematización personal o diferida
 Coste
Solución:
– Financiación
– acceso abierto (Open Access)
24