Las nuevas Tecnologías en la Gestión de la Información Científica y Técnica al servicio de la Investigación 06 de noviembre de 2015

Download Report

Transcript Las nuevas Tecnologías en la Gestión de la Información Científica y Técnica al servicio de la Investigación 06 de noviembre de 2015

Las nuevas Tecnologías en la Gestión de la
Información Científica y Técnica
al servicio de la Investigación
06 de noviembre de 2015
Agentes Inteligentes Aplicados
a la Gestión de la Información
para la Investigación
Directorios, Recolectores y Repositorios Científicos Institucionales
al servicio de la Investigación
Gestión y transferencia de resultados de la investigación
06 de noviembre de 2015
Objetivos
 Analizar las diferentes herramientas existentes
para la búsqueda y recuperación de contenidos en
Internet
 Ver las diferencias y semejanzas, ventajas e
inconvenientes de los índices temáticos/directorios,
motores de búsqueda y agentes inteligentes
 Destacar las características propias de los agentes
inteligentes y sus posibilidades en la gestión de
información científica y técnica
 Enunciar las tendencias futuras en el ámbito de las
herramientas para la búsqueda y recuperación de
información en Internet.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
3
El Desarrollo de los Motores de Búsqueda
 La aparición y posterior expansión de Internet y
las tecnologías asociadas nos ha ofrecido la
posibilidad de acceder a una ingente cantidad de
información.
 Esta situación ha obligado al diseño, creación y
utilización de herramientas para la búsqueda y
recuperación de la información pertinente de una
forma rápida y sencilla
 Entre estas herramientas destacan los índices
temáticos, los motores de búsqueda (buscadores)
y los agentes inteligentes
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
4
Directorio / Buscador / Agente Inteligente
 Indice temático o Directorio: página web donde se
organizan jerárquicamente un conjunto de recursos
web que han sido recopilados a partir de
búsquedas en la Red.
 Motor de búsqueda: programa
que tiene por
objetivo la estructura hipertextual de la web
para recoger e indexar de forma automática
los recursos disponibles en la Red, formando una
gran base de datos integrada por documentos html
 Agente inteligente: un agente inteligente es un
software que asiste al cliente y actúa en su nombre
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
5
Cómo funcionan los motores de búsqueda
 Un motor de búsqueda está formado por cuatro elementos
básicos:
 Un programa (también denominado robot, rastreador o
webcrawler) que recorre el WWW buscando recursos de
información y sus respectivas URLs
 Un sistema automático de análisis de contenidos e
indexación de los documentos localizados por el robot
 Un sistema de interrogación, generalmente basado en
la lógica booleana, que permite al usuario expresar su
necesidad de información
 Un programa que actúa de pasarela entre el servidor de
documentos html y la base de datos.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
6
Funcionamiento
 El motor de búsqueda recibe la consulta del
usuario (query), formada por uno o más términos,
realiza una consulta interna en la base de datos
que contiene los recursos web indexados y ofrece una
lista de aquellos recursos que cumplen una
parte o el total de los requisitos establecidos
en la consulta
 Generalmente, los resultados aparecen
ordenados según una puntuación (score) que
el programa asocia automáticamente a cada
recurso.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
7
Cómo realizar una consulta






Para realizar una consulta es necesario tener en cuenta un
conjunto de variables:
Lenguaje de interrogación, que debe ofrecer diferentes
tipos de operadores: lógicos, de comparación, de truncamiento, de
proximidad, de especificación de campo
Posibilidad de refinar (refine) una búsqueda inicial
Campos limitadores que nos permitan reducir la búsqueda:
dominios, lenguas, países, fecha de creación del recurso
Búsquedas alternativas: búsqueda simple, búsqueda
avanzada, búsquedas combinando operadores e índices temáticos, etc.
Opciones avanzadas: buscar diferentes recursos (texto, sonido,
imagen), guardar y reutilizar búsquedas, diferentes formatos en los
resultados de búsqueda (estándard, detallado, compacto, etc.),
búsqueda de conceptos relacionados (related topics), consulta
directa en bases de datos (infranets), etc.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
8
Los metabuscadores
 La gran cantidad de información y el notable aumento de
motores de búsqueda accesibles desemboca en la
necesidad de realizar consultas simultáneas en diferentes
motores de búsqueda y con una sola estrategia (query)
 De esta necesidad surgen los denominados "metabuscadores",
que ofrecen nuevas prestaciones y mejores y más
exhaustivos resultados de búsqueda
 Los metabuscadores permiten automatizar el proceso de
realizar una misma consulta en diversos motores de
búsqueda, lo cual no significa que sea totalmente
exhaustivo, puesto que el metabuscador envía la
consulta solamente a aquellos motores de búsqueda con los
que ha establecido un acuerdo previo.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
9
funcionamiento de los metabuscadores
 En el funcionamiento de los metabuscadores
cabe destacar algunas variables interesantes:
 Por una lado, la exhaustividad no está
garantizada
 Por otro, los tiempos de respuesta pueden ser
mucho más largos dada la necesidad de realizar
múltiples búsquedas simultáneas
 Además, la recuperación de recursos duplicados
suele ser muy elevada, por ello, algunos
metabuscadores ya han implementado la utilidad
que permite eliminar los duplicados.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
10
Algunos de los metabuscadores
 Algunos de los metabuscadores del mercado
son:
 Metacrawler http://www.metacrawler.com
 All-in-One Search Page
http://wwww.albany.net/allinone
 Search.Com http://www.search.com
 Mundo Latino
http://www.mundolatino.org/123/
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
11
Limitaciones de los Buscadores
 La escasa calidad de la información recuperada es
un inconveniente de los actuales motores de
búsqueda
 Los mecanismos para aumentar la precisión en
la búsqueda (refinamientos, búsquedas avanzadas,
acotación por dominios, etc.), a veces, no
funcionan como cabría esperar
 A ello, hay que añadir el mínimo valor de
algunos de los sitios web recuperados, el
porcentaje de recursos repetidos y el porcentaje
de recursos inactivos (que ya no existen físicamente
en la red aunque continúan indexados).
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
12
la concentración del conocimiento
 En este sentido se empieza a hablar de una
Internet para el gran público y una Internet de
los recursos científicos y técnicos
 La especialización de los motores de búsqueda
es una buena vía para conseguir mejores
servicios de información
 La especialización conduce a la concentración del
conocimiento en ciertos lugares donde los
usuarios pueden encontrar fácilmente los recursos
relacionados con su ámbito de conocimiento
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
13
Agentes inteligentes
para gestión de información
 En la última década los métodos para recuperar y
gestionar la información han variado notablemente
 La mayoría de herramientas disponibles en la
actualidad para la recuperación de la información en
Internet se centran más en la cantidad que en la calidad
 Resulta evidente, por tanto, la necesidad de una cierta
automatización del proceso de búsqueda y que a su vez permita
seleccionar el nivel de calidad de la información
 En este aspecto, los agentes inteligentes pueden asistir al
usuario en la búsqueda de información útil y relevante, a la
vez que recuperar, analizar, manipular e integrar
informaciones y datos de carácter heterogéneo.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
14
Las aplicaciones de los agentes inteligentes en el ámbito de la
recuperación y difusión de la información científica y técnica
 Las aplicaciones de los agentes inteligentes en el ámbito de la
recuperación y difusión de la información han venido a
solucionar uno de los mayores problemas de la actualidad: la
carencia de herramientas para la efectiva gestión de la
información, que ha conducido a lo que se denomina
"explosión de la información", "sobreabundancia de
información"
 A continuación se presentan unos ejemplos que
pretenden ilustrar la tecnología de agentes inteligentes
como una herramienta para explotar de forma eficiente las
posibilidades de Internet en la oferta de servicios de
información científica y técnica
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
15
Las utilidades de los agentes de información para el desarrollo de
servicios y productos de información científica y técnica





Actualmente, la tecnología de agentes inteligentes puede ser
utilizada para la prestación de diversos servicios:
Se puede utilizar el agente CiteSeer para establecer redes de citas
en un sector específico de conocimiento, conocer los autores que
más investigan, los centros de investigación que más actividad
presentan, cual es la evolución en una tendencia de investigación,
etc.
Podemos utilizar BullsEye para la realización de informes de
recursos electrónicos, para conocer los webs más representativos en
relación
con
un ámbito de conocimiento
hiperespecializado, para establecer que empresas, organismos
oficiales o centros de enseñanza están ligados a un
tecnología, etc.
Además, Webwatch reúne un conjunto de prestaciones para la oferta
de servicios de vigilancia tecnológica en un entorno cooperativo.
Las principales bibliotecas digitales están basadas tecnología de
agentes inteligentes
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
16
Universidad Complutense de Madrid




Colección Digital Complutense
Dioscórides
E-Prints
Portal de revistas científicas
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
17
http://www.ucm.es/BUCM/atencion/5761.php
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
18
La Colección Digital Complutense en acceso
abierto
Dioscórides
• 2.750 libros
• 40.000 grabados
OAI-PMH
E-Prints Complutense
• 4.000 tesis
• 163 artículos
• 85 capítulos de libros
• 45 ponencias de congresos
• 11 libros
Portal revistas UCM
• 21.600 artículos de 62
títulos de revistas
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
19
La Colección Digital Complutense en acceso
abierto. Acuerdo con Google
 En 12 años se han digitalizado 2.500 libros.
 En septiembre de 2006, la Biblioteca de la UCM se
suma al proyecto Google Book
 Digitalización de obras de dominio público
anteriores a 1866 que estarán en acceso abierto en
Internet.
 Se podrá buscar por los metadatos descriptivos de las
obras y por el texto completo.
 La Biblioteca de la UCM dispondrá de una copia
digital.
 Acceso a los libros desde Google y desde la Web de la
Biblioteca.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
20
Beneficios del acuerdo con Google
 Aumentará el uso de la colección
 El proyecto con Google es estratégico para la biblioteca
universitaria pública y su misión:
 ofrecer un sistema de información de calidad y
 conseguir que el conocimiento de la Universidad revierta en la
sociedad.
 Apoya significativamente las funciones de la Universidad al
mejorar la preservación, la difusión y el acceso al conocimiento
universal.
 Sitúa a la Biblioteca de la Universidad en una posición
estratégica de colaboración con algunas de las principales
bibliotecas del mundo
 Colaboración con Google, líder en el sector de la información.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
21
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
22
La comunicación científica través de los
e-print
 Se considera e-print a la versión electrónica de un
trabajo científico o cualquier documento de un
repositorio
 Históricamente la comunicación de los resultados de
la investigación científica en una publicación
arbitrada, daba el sello distintivo a la comunicación
científica
 no obstante dichos resultados también se han
comunicado en muchas otras formas
 recientemente, los modelos de la comunicación
científica han sido actualizados para incluir el acceso
a publicaciones en línea y acceso a documentos
electrónicos.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
23
e-print
 Son una forma de divulgar rápidamente los conocimientos de
los científicos e investigadores
 Y tomar conocimiento de los estudios e investigaciones de otros
 Contribuyen a disminuir el problema de la dificultad de
localización y acceso de los documentos de la literatura gris.
 Son un nuevo canal que ha propiciado la difusión y acceso
integral a los resultados de la investigación.
 Se han convertido en un circuito de información autónomo con
sus propias reglas de funcionamiento
 Son una fuente primaria de información y una herramienta de
trabajo inestimable.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
24
¿Qué pretende el Archivo Institucional
E-Prints Complutense?
 Recoger y gestionar colecciones dispersas que
conforman parte del capital intelectual de la
Universidad Complutense.
 Reducir barreras a la publicación
 Mantener los derechos de propiedad de los
autores, docentes e investigadores de la
Universidad.
 Incrementar la difusión, uso e impacto de la
investigación producida en la institución.
 Preservar este capital a largo plazo.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
25
Instalación del Archivo
 La Complutense comenzó trabajar en el
Archivo E-prints Complutense en el año 2004.
 En marzo de 2005 e-prints.org declara el
Archivo E-Prints Complutense conforme al
protocolo OAI-PMH. (Acceso abierto a la
información)
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
26
¿Cómo autoarchivar en el Archivo Institucional
E-Prints Complutense?
 Directamente: El autor deposita el documento
en el Archivo.
 Indirectamente: El autor entrega la obra en la
Biblioteca, que se encarga de depositar el
documento y asignar los metadatos.
 http://www.ucm.es/eprints
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
27
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
28
Estructura de la colección
 Índice de Facultades y Departamentos de la
Universidad Complutense.
 Índice de materias.
 Índice de autores.
 Índice de tipos documentales: tesis, artículos, libros,
capítulos de libros, ponencias …
 Distintas plantillas de metadatos para distintos tipos
de documentos.
 Campo para calificar los documentos que han sido
evaluados por pares.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
29
La Universidad Complutense en cifras





Profesores: 5.961
Facultades y Escuelas Universitarias: 26
Departamentos: 226
Dos grandes campus universitarios
Otras sedes (El Escorial, Aranjuez…)
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
30
Políticas institucionales
 La Comunidad de Madrid está impulsando y
financiando la puesta en marcha de
repositorios institucionales.
 La Conferencia de Rectores de la Comunidad
de Madrid (CRUMA) ha firmado la
Declaración de Berlín.
 Es imprescindible que estas buenas
intenciones vayan acompañadas de políticas
concretas e incentivos a los autores que
depositen sus trabajos en los repositorios.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
31
Inquietudes de los autores que publican en
E-prints
 ¿Cómo va a repercutir en su carrera
académica?
 ¿Las agencias de evaluación van a tener en
cuenta los documentos depositados en el
Archivo?
 ¿Las descargas de los documentos podrán
llegar a ser un indicador?
 Inquietud ante la posibilidad de plagio.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
32
Propiedad intelectual
 Contrato de los doctores con la Universidad,
una vez leída la tesis:
El INVESTIGADOR y la UNIVERSIDAD COMPLUTENSE
consideran que el objetivo fundamental del acuerdo es la
divulgación de la investigación original en que consiste la
Tesis Doctoral, para lo cual la UCM pone los medios técnicos
y editoriales necesarios. El INVESTIGADOR cede a la UCM
los derechos de reproducción, distribución y venta en
formato electrónico, de la obra denominada ...
El INVESTIGADOR, en este acto, efectúa una cesión no
exclusiva de la obra, que podrá hacerse accesible al público a
través de Internet y editarse en soporte CD-ROM o
compatibles...
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
33
Universidad Complutense de Madrid




Colección Digital Complutense
Dioscórides
E-Prints
Portal de revistas científicas
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
34
Portal de revistas científicas complutenses
 Objetivos
 Apoyar la edición electrónica
 De las revistas científicas de la UCM (las editadas por el
Servicio de Publicaciones) y sometidas a criterios de revisión (+
de 50 títulos)
 De otras revistas académicas editadas por los Departamentos
UCM.
 Difundir la investigación producida en el seno de la UCM
 Servicios:
 Acceso abierto a los contenidos
 Búsqueda por múltiples entradas: Texto completo, título,
autor, etc.
 Preservación
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
35
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
36
Recolectores y Repositorios
Institucionales
 Podíamos definir los repositorios como "Archivos
digitales de productos intelectuales de carácter
académico accesible a los usuarios con pocas o
ninguna barrera e interoperables
 La categoría "repositorios" recoge archivos digitales,
que contienen documentos a texto completo,
fundamentalmente creados por investigadores o
autores pertenecientes al ámbito académico.
 Además, están disponibles sin trabas para los propios
miembros de la comunidad y en muchos casos para
usuarios externos.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
37
Directorios, Recolectores y Repositorios
 En España existe un "harvester" o recolector
que realiza búsquedas en todos los repositorios
existentes en el país: ROAI
http://roai.mcu.es/es/inicio/inicio.cmd
 Además, permite saber qué instituciones tienen
este tipo de recurso:
http://roai.mcu.es/es/comunidades/registros.cmd
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
38
Directorio y Recolector mcu.es
 Con estas dos aplicaciones el Ministerio de Cultura y
las Comunidades Autónomas ponen a disposición de
los investigadores dos conjuntos de información.
 Por un lado, información básica sobre los proyectos e
iniciativas de digitalización existentes en España.
 Por otro, los documentos digitalizados, reunidos a
partir de esas bases de datos, a los que se puede
acceder de forma conjunta, utilizando técnicas de
recolección de metadatos.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
39
http://roai.mcu.es/es/inicio/inicio.cmd
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
40
Otros recolectores importantes
 Dialnet (recolector multidisciplinar)
 TDX o TDR (tesis españolas)
 RECOLECTA (recolector de Rebiun y la
FECYT fundación española de ciencia y tecnología)
 Google Scholar
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
41
http://dialnet.unirioja.es/








Qué es Dialnet
Dialnet (Difusión de Alertas en la Red) es una plataforma de recursos y servicios documentales,
cuyo objetivo fundamental se centra en mejorar la visibilidad y el acceso a la literatura científica
hispana a través de Internet.
Es un servicio de alertas bibliográficas que difunde, de una manera actualizada, los contenidos de
las revistas científicas hispanas
Es una hemeroteca virtual hispana de carácter interdisciplinar, aunque con un predominio de las
revistas de Ciencias sociales y de Humanidades
Es una base de datos de contenidos científicos hispanos muy exhaustiva y actualizada. Al haberse
ido añadiendo a la hemeroteca inicial otro tipo de contenidos (documentos de trabajo, partes de libros
colectivos, tesis doctorales, referencias de libros), hoy en día es probablemente la mayor base de
datos de su género accesible de modo gratuito.
Es un depósito o repositorio de acceso a la literatura científica hispana a texto completo, con una
clara apuesta por el acceso libre y gratuito a la misma, sumándose al movimiento Open Access.
El proyecto inició su andadura en el año 2.001 como un servicio de la Biblioteca de la Universidad
de La Rioja, y todos los desarrollos se han venido haciendo desde entonces en el Servicio
Informático de esta Universidad. En la actualidad el Proyecto se elabora gracias a la colaboración
activa de varias bibliotecas. Dicha cooperación bibliotecaria está abierta a la participación de
cualquier biblioteca que quiera comprometerse en el proyecto.
Ofrece recursos y servicios de utilidad tanto para Investigadores y usuarios en general, como para
Editores de publicaciones y para Bibliotecarios.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
42
http://dialnet.unirioja.es/
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
43
.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
44
http://www.recolecta.net/buscador/
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
45
http://www.oaister.org
University of Michigan
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
46
RiuNet
 .
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
47
Consejo Superior de Investigaciones
Científicas
 IEDCYT http://www.cindoc.csic.es/
 De acuerdo con el Plan Estratégico aprobado por el
CSIC, se constituye el Instituto de Estudios
Documentales sobre Ciencia y Tecnología
(IEDCYT) a partir del antiguo Centro de Información
y Documentación Científica (CINDOC).
 El Instituto de Estudios Documentales sobre
Ciencia y Tecnología (IEDCYT) es un organismo del
Consejo Superior de Investigaciones Científicas
(CSIC), cuya principal línea de actuación es analizar,
recopilar, difundir y potenciar la información
científica en todas las áreas del conocimiento.
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
48
http://www.cindoc.csic.es/
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
49
http://bddoc.csic.es:8080/index.jsp
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
50
RepCSIC
 .
https://repcsic.iata.csic.es/dspace/
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
51
Biblioteca Digital
Digital Libraries Initiative
 El concepto de biblioteca digital no es sólo el
equivalente de colecciones digitalizadas con
herramientas de gestión de la información
 Es un entorno donde se juntan colecciones,
servicios, y personal que dan apoyo al ciclo
completo de la creación, diseminación, uso y
preservación de los datos, la información y el
conocimiento
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
52
Algunas Bibliotecas Digitales







Biblioteca Digital de la Biblioteca Nacional
Biblioteca Digital de la UCM
Biblioteca Virtual Cervantes
Project Gutenberg
Biblioteca Digital ULPGC
Biblioteca Digital de Catalunya
Otros proyectos
Directorios, Recolectores y Repositorios científicos institucionales al servicio de la investigación
53
Muchas gracias
por su atención
www.educa.tk
[email protected]
06 de noviembre de 2015