tecnologías, estándares y plataformas - Remedios

Download Report

Transcript tecnologías, estándares y plataformas - Remedios

Publicaciones Científicas y Repositorios de Acceso Abierto
Bogotá, Colombia, 9-11 de noviembre de 2010
Módulo 9 – Repositorios de Acceso Abierto: tecnologías,
estándares y plataformas
Remedios Melero, (CSIC, España)
[email protected]
Alicia López Medina (UNED, España)
[email protected]
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
“Con el fin de hacer realidad la visión de una representación
global y accesible del conocimiento, la futura Web tiene que
ser sostenible, interactiva y transparente. El contenido y las
herramientas de software deben ser libremente accesibles y
compatibles”
“Una versión completa del trabajo […] se deposita […] en por
lo menos un repositorio online, que utilice estándares
técnicos adecuados […] que busque la implementación del
acceso abierto […] interoperabilidad […]”
Declaración de Berlín, 2003
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
La promesa de que los repositorios institucionales servirán
de soporte a la realización del “Open Access” y mejorarán la
comunicación científica depende de su capacidad para
exponer sus contenidos de manera que sea posible crear
servicios a escala global sobre esos contenidos.
Si se logra que el movimiento universal de acceso abierto
se asiente sobre el sólido cimiento de una infraestructura de
la información interconectada en una red internacional de
repositorios, existen posibilidades reales de consolidar una
nueva estructura de comunicación científica.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
La infraestructura global de redes de repositorios de acceso abierto
como soporte a la investigación y la comunicación científica en el
mundo digital
¿Cómo la construimos?
No es sólo cuestión de tecnología, es también cuestión política,
económica, social
Ahora, hablamos de tecnología
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Repositorio de Acceso Abierto
(se refiere a una propiedad de sus
contenidos)
Repositorio abierto (interoperable)
(se refiere a una propiedad del propio
sistema)
‘sus contenidos están
accesibles libremente, sin
restricciones y de forma
permanente a través de
Internet para ser usados”
“… que puede intercambiar
procesos, servicios o datos
con otros sistemas de manera
que puedan trabajar juntos de
forma eficiente”
Un primer nivel de
interoperabilidad
R1
R2
?
Problema: difícil saber qué
publicaciones tienen los repositorios
de acceso abierto. Las islas de
información contrarrestan el objetivo de
acceso abierto de mejorar la visibilidad y
difusión de los resultados de la
investigación científica.
R3
R4
Islas de información
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Open Archive Initiative (OAI)
 La interoperabilidad de los repositorios recibe un fuerte impulso con la
Open Archive Initiative.
 Sus orígenes están ligados al movimiento de Acceso Abierto . Uno de
sus objetivos es desarrollar e impulsar estándares de interoperabilidad que
faciliten una eficiente búsqueda y visibilidad de las publicaciones científicas
distribuidas en diferentes repositorios, tanto institucionales como temáticos.
 Es independiente de cualquier aplicación
 La Open Archive Initiative ha creado un protocolo fundamental para
conseguir un nivel básico de interoperabilidad entre los repositorios: el
protocolo OAI-PMH
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
El protocolo OAI-PMH
(Open Archive Initiative-Protocol for Metadata Harvesting)
Es un protocolo que permite a los repositorios exponer sus metadatos de manera
que otros sistemas puedan recolectarlos y agregarlos para construir nuevos y más
eficientes y útiles servicios que los que podría ofrecer cada repositorio
individualmente.
Proporciona funcionalidades que son esenciales para las propuestas del
movimiento por el Acceso Abierto a las publicaciones científicas
Si un repositorio es conforme con el protocolo, será un repositorio abierto, es
decir, capaz de responder a las peticiones de sus metadatos que le hace otra
máquina.
La interoperabilidad se produce en el nivel de los metadatos, no de los
contenidos. De hecho, un archivo puede ser “abierto” en términos OAI y, sin
embargo, no permitir el acceso libre al texto completo del documento.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
El modelo del protocolo OAI-PMH
Proveedor de datos: sistema (por ejemplo, un archivo digital) que ha
implementado este protocolo, es decir, es capaz de responder a las
peticiones de los metadatos de sus documentos por otra máquina.
Proveedores de servicios: organización que solicita y almacena en su
base de datos los metadatos recolectados y ofrece servicios de valor
añadido sobre esos metadatos: búsqueda, estadísticas, citas, etc.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Cómo funciona el protocolo OAI-PMH
Ya hemos creado un nivel básico de red repositorios
de acceso abierto
Capa de servicio
R1
R2
Usuario
R3
Servicios
R4
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Servicios soportados por el OAI-PMH
 Portales nacionales de acceso abierto a la producción científica: RCAAP,
RECOLECTA, NARCIS, BDCOL en Colombia…
Portales internacionales: DRIVER, el proyecto CoLaBoRa, de red
federada de repositorios latinoamericanos…
 Motores de búsqueda científicos en la web: Google Scholar, Scientific
Commons, OAISTER, BASE….
 Revistas “overlay”
 Portales especializados: el portal europeo de tesis DART
 Colecciones temáticas virtuales
 Servicios de citas: Citebase
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Pero para que se puedan crear servicios de calidad y
útiles, no basta con ser conformes con el protocolo OAIPMH
Los servicios requieren convenciones, que los
repositorios acuerden cómo van a implementar el
protocolo según los servicios que se pretenden crear.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Dublin Core – Elementos
Dublin Core es un pequeño y simple lenguaje –rudimentario- para encontrar
recursos en Internet a través de diferentes dominios.
–
–
–
–
–
–
–
Title
Subject
Description
Creator
Publisher
Contributor
Date
–
–
–
–
–
–
–
–
Type
Format
Identifier
Source
Language
Relation
Coverage
Rights
Gracias a Maurice Vanderfeesten
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Esto no sería un problema si nuestro
repositorio fuera el centro del universo...
Pero se convierte en un inconveniente
tremendo si lo que queremos es agregar
nuestros metadatos para crear servicios
útiles CON OTROS REPOSITORIOS
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Directrices DRIVER
Para guiar a los administradores de repositorios de forma que se garantice la
interoperabilidad y compatibilidad con los servicios DRIVER
Basadas en mejores prácticas: resultado de la colaboración a nivel europeo de
gestores de repositorios, proveedores de servicios y expertos en metadatos
Versión actual 2.0 (noviembre de 2008)
Traducidas al español, portugués y japonés; version en español:
http://www.driver-support.eu/documents/DRIVER_2_1_Guidelines_Spanish.pdf
 No son un estándar: se necesitan para normalizar las diferentes interpretaciones
de los estándares OAI-PMH y DC en las implementaciones locales
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Directrices DRIVER
-
Uso
Uso
Uso
Uso
Uso
Uso
Uso
Uso
Uso
de OAI-PMH
de los metadatos OAI_DC
de mejores prácticas para OAI_DC
del empaquetado de objetos compuestos
de vocabularios y semántica
de etiquetas de calidad
de identificadores persistentes
de Intercambio de Estadísticas
de los derechos de Propiedad Intelectual (IPR)
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Hacia la creación de una infraestructura
Nueva unidad de información, más compleja y heterogénea.
Necesidad de integrar nuestros servicios con otras aplicaciones (donde
ellos trabajan, llevan a cabo sus procesos, comparten….)
Ya no se trata sólo de poner cosas en el repositorio, ahora que
exponerlas en la web
Todo ello implica la aparición en nuestro mundo de repositorios de
nuevas tecnologías que tenemos que tener en cuenta.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Las publicaciones complejas o
“enriquecidas”
La evolución del paisaje de la comunicación científica en el mundo digital hace
posible que los investigadores depositen en los repositorios no sólo sus artículos
sino también los datos sobre los que han basado su investigación y otros materiales
complementarios, haciendo que los contenidos de los repositorios sean cada vez
más heterogéneos y más complejos.
El acceso a estas publicaciones complejas (que incluyen con frecuencia diferentes
ficheros de diferentes formatos, a veces archivados en diferentes lugares) es una
cuestión prioritaria en la agenda de los repositorios
Blogs
Artículos
relacionados
Comentarios
Presentaciones
Lab Books
Códigos
Modelos
Preprints
Algorithms
Podcasts
Metodos
Video
Modelos
Data
Planes
Resultados
intermedios
La revista
Gente
Thanks to Carole Goble
Gracias a Sandy Payette
Necesidad de ser capaces de expresar relaciones legibles por maquinas entre
los objetos en la web
No estamos solos en la web
Cada vez más importante relacionar la publicación con los datos
URI-10
Service-B
Graphite Overlay Fragment
TypeURI-3
URI-3
RI
eU
p
Ty
-2
I-1
eUR
Typ
TypeURI-4
URI-2
LANL
Re pository
URI-5
TypeURI-5
Ty
pe
UR
I-8
Typ
eUR
Cornell University and Los Alamos Nat’l Lab
http://www.infosci.cornell.edu/pathways
I-7
URI-8
Fedora
arXiv
Document
URI-9
URI-7
URI-6
URI-1
TypeURI-6
URI-4
Grid dataset
Web resource
Image Object
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
OAI-ORE: Open Archive Initiative-Open Reuse and
Exchange: http://www.openarchives.org/ore/
OAI-ORE es un nuevo esfuerzo de interoperabilidad de la OAI
 Su objetivo son los Objetos complejos (agregaciones) en la web
Su ámbito es más amplio que el ámbito de los repositorios
 Open Archives Initiative Object Reuse and Exchange (OAI-ORE) define
estándares para la descripciòn e intercambio de agregaciones de los recursos
en la web. El objetivo de estos estándares es exponer el contenido de estas
agregaciones a aplicaciones que soportan la creación, el depósito, intercambio
visualización, reutilización y preservación de contenidos digitales.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Identificadores persistentes
Un elemento esencial para apoyar la infraestructura global de
comunicación científica en Internet
Necesitamos una infraestructura global interoperable de identificadores persistentes
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Recursos
Persistent identifiers
https://repinf.pbworks.com/w/page/Persistent-identifiers
Author identification
https://repinf.pbworks.com/Author-identification
DRIVER Annex Use of Persistent Identifiers
http://wiki.surffoundation.nl/display/DRIVERguidelines/Annex+Use+of+Pers
istent+Identifiers
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Una organizacón sin ánimo de lucro cuyo objetivo es encontrar una solución
para el problema de la ambiguedad de los nombres de los autores en la
investigación científica.
Cómo:
Crear un registro central de identificadores persistentes para
investigadores individuales y un mecanismo abierto y transparente para
enlazar el registro ORCID con otros sistemas de Identificador Persistente
de Autor existentes.
Estos identificadores y las relaciones entre ellos se vincularían con los
resultados científicos del investigador de manera que se mejoraría el proceso
de descubrimiento científico y la eficiencia de la financiación de la investigación
así como la colaboración entre la comunidad científica.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
El depósito transparente
No existe una interfaz estándar para transferir objetos
digitales entre repositorios
No se puede depositar en más de un repositorio con un
único ‘click’
No se puede iniciar un proceso de depósito desde fuera
de un sistema de repositorio
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Sword -
Introducción
(Simple Web-services Offering Repository Deposit)
 Un protocolo para depositar objetos digitales en lugares
diferentes
 Proyecto financiado por JISC iniciado en 2007
 Creado por encima del protocolo Atom Publishing Protocol
(APP o ATOMPUB)
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Sword
– Implementaciones
 Interfaces SWORD en varios repositorios Dsapce, Eprints,
Fedora
Open Journal Systems Plugin: SWORD 1.2 Repository
Deposit
Microsoft Article Authoring Add-in for Word 2007
SWORD Widget - For Netvibes, Igoogle
Facebook client
ArXiv
Open Repository de Biomedcentral
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Sword
– Casos de uso
Depositar desde una herramienta de Escritorio en línea
Depósito múltiple: en un repositorio institucional, en un repositorio de
un financiador (mandato) y en un repositorio temático con una sola
acción
Depósito automáticao desde una máquina, por ejemplo desde una
máquina de laboratorio
Depositarlo en OJS y en el repositorio
Migración/transferencia, por ejemplo a un servicio de preservación
Depósito mediado, por ejemplo por un bibliotecario, a repositorios
adicionales.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Sword
– información y contacto
SWORD Website:
http://www.swordapp.org
Preguntas generales:
Adrian Stevenson
[email protected]
Preguntas técnicas:
Sword sourceforge list
[email protected]
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Actúa localmente
Piensa en internacional
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Miembros COAR en Latinoamérica:
Cooperación Latino Americana de Redes Avanzadas (CLARA)
Red Nacional Académica de Tecnología Avanzada (RENATA) (Colombia)
Ministerio de Ciencia, Tecnología e Innovación Productiva (MinCyT) (Argentina)
WG 2 “Interoperabilidad de los repositorios: facilitar la discusión
sobre interoperabilidad entre los repositorios y como parte de una
infraestructura más amplia
Evaluación de las Directrices DRIVER para su internalización en
Directrices COAR 1.0
Trabajar en la infraestructura global interoperable de
identificadores persistentes
....
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Las plataformas de repositorios
La decisión sobre qué plataforma vamos a escoger
para nuestro repositorio debe estar basada no sólo
en la naturaleza de nuestras colecciones y en las
capacidades técnicas y funcionales del sistema
sino también en determinar cuál encaja mejor con
la estrategia tecnológica de la organización y con
la disponibilidad del esfuerzo local de desarrollo
del software
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Opciones:
 Plataformas de código abierto
DSpace
Eprints
Fedora
 Plataformas gratuitas, pero no de código abierto
Zentity (Microsoft)
 Plataformas comerciales
 Plataformas como SAAS (Software as a service)
Eprints Services: http://www.eprints.org/services/
Open Repository: http://www.openrepository.com/
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
DuraSpace es una organización sin ánimo de lucro que nace como
resultado de la fusión de las dos organizaciones Dspace Foundation y
Fedora Commons. Su objetivo es sostener y mejorar ambas plataformas
que continúan su desarrollo respectivo aunque buscando sinergias y
alianzas que mejoren en el futuro sus funcionalidades.
http://www.duraspace.org/
DSpace
http://www.dspace.org/
Grupo de usuarios Dspace España GUDE
http://sod.upc.es/gude/index.php/Portada
Fedora Commons
http://fedora-commons.org/
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Cómo elegir una plataforma de software para nuestro
repositorio
 (2009) El RSP (Repository Support Project, JISC) realizó una
encuesta entre los proveedores de software para repositorios cuyos
resultados pueden verse en una tabla comparativa
(http://www.rsp.ac.uk/software/surveyresults2010) que analiza 50
funcionalidades con enlaces a hojas informativas para cada producto:
Contentdm, Digital Commons, Digitool, Dspace, EPrints, Equella,
FEDORA, IntraLibrary, Open Repository, VITAL, Zentity.
La última actualización incluye cuestiones adicionales que cubren
nuevas tecnologías como la web 2.0 así como mayor detalle en los
costes de los productos.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Development of a Digital Repository for NLM Digitized Collections and
Born-Digital Resources
http://www.nlm.nih.gov/digitalrepository/index.html
El Instituto Nacional de Salud (NIH) junto con la Biblioteca Nacional de
Medicina (NML), llevaron a cabo un proyecto para evaluar, examinar y
recomendar una plataforma para la gestión y preservación de las colecciones
y diversos objetos digitales de la NLM.
Código abierto
DAITSS
DSpace
Eprint
Fedora
Greenstone
Keystone DLS.
Comercial: ArchivalWare , CONTENTdm , DigiTool , VITAL.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
"Master Evaluation Criteria que elaboró el Grupo de Trabajo de la NML
Funcionalidad – Grado de satisfacción con los requerimientos enumerados en las
especificaciones de requerimientos funcionales definidos por la NML
Escalabilidad – Capacidad del repositorio de escalar para manejar grandes
colecciones de objetos digitales.
Extensibilidad – Capacidad para integrar herramientas externas para extender la
funcionalidad del repositorio, vía APIs o modificando el código base
Interoperabilidad – Capacidad del repositorio para interoperar con otros
repositorios (tanto dentro de la NML como externos) y con el sistema integrado de
bibliotecas de la NML
Fácil despliegue– Simplicidad de instalación y fácil integración con otros software
que se necesiten .
Seguridad del sistema– Capacidad del sistema de cumplir con los requisitios de
seguridad de NIH/NLM .
Rendimiento del sistema - El rendimiento global y el tiempo de respuesta
(realizada a través de pruebas de carga). Sistema de disponibilidad (24x7 tanto
interna como externamente).
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Apoyo de la plataforma – Sistema operativo y requerimientos de base de datos.
Conocimientos del persona para tratar con la infraestructura requerida.
Despliegues con éxito demostrados – Número relativo de usuarios y
organizaciones satisfechos.
Apoyo del sistema – Calidad de la documentación y respuesta y responsabilidad
del personal de mantenimiento o desarrolladores de la comunidad de usuarios
(código abierto) para asistir con los problemas.
Fuerza del desarrollo de la comunidad – Fiabilidad y constancia del apoyo de la
empresa proveedora del software, o el tamaño, la productividad y la cohesión de la
comunidad de código abierto de desarrollo.
Estabilidad del desarrollo de la organización – La viabilidad de la empresa
proveedora del software, o la estabilidad de las fuentes de financiación y
organizaciones que desarrollan software de código abierto.
Fuerza de la hoja de ruta tecnológica para el futuro– Hoja de ruta tecnológica
que defina la evoluTechnology roadmap que defina una ruta de evolución del
sistema que incorpore las innovaciones y las "prácticas siguiente" que puedan
aportar valor.
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
http://blogs.lib.purdue.edu/rep/
Módulo 9 – Repositorios de Acceso Abierto: tecnologías, estándares y plataformas
Muchas gracias por su atención
Reme Melero
Alicia López Medina
[email protected]
[email protected]
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs
2.5 License.