Diapositiva 1 - NECOBELAC Project Home Page

Download Report

Transcript Diapositiva 1 - NECOBELAC Project Home Page

De la publicación al acceso abierto a la producción
científica en el área de la salud
Curso de capacitación para formadores
Madrid, 28 de febrero a 2 de marzo
Repositorios: estándares, buenas prácticas y
evaluación
Eloy Rodrigues (Universidade do Minho) –
[email protected]
Introducción - Definiciones y tipos de repositorios
Situación de los repositorios en el mundo
 Estándares asociados a repositorios
Creación y desarrollo de repositorios: factores críticos de éxito
y buenas prácticas de repositorios
Evaluación de repositorios
Repositorio
Un sitio, o contenedor donde se pueden depositar y
almacenar objetos (para seguridad y preservación)
Repositorio digital
Un sistema para recoger, preservar y dar acceso a objetos
digitales
Repositorio de Acceso Abierto
Un repositorio digital que recoge, almacena y ofrece
acceso abierto a resultados (publicaciones y/o datos) de
investigación científica
Tipos de Repositorios de Acceso Abierto
Institucionales
Disciplinares o temáticos
Repositorios de datos
Repositorios “huérfanos”
Agregadores
Repositorios institucionales
 Almacenan, preservan, difunden y dan acceso a la producción
intelectual de los miembros de una institución (universidad, centro
de investigación, etc.).
 Pueden contener solamente la producción intelectual/científica
(artículos, tesis y disertaciones, working papers, datos, etc.) de las
instituciones,
o
reunir
también
colecciones
especiales
(constituyéndose como bibliotecas digitales), documentación
administrativa, etc.
Repositorios Disciplinares o Temáticos
 Reúnen, preservan y dan acceso a contenidos de una disciplina o
área temática.
 Pueden ser creados y mantenidos por instituciones académicas o
de investigación, o bien por organismos gubernamentales.
 Algunos de los repositorios mas conocidos son temáticos como o
PubMed en las ciencias de la salud, RePec en la área de la ciencias
económicas, o E-Lis en la área de las ciencias de la información.
Repositorios de datos científicos
 Repositorios que almacenan y preservan los datos científicos
generados en el proceso de investigación (y que pueden originar, o
no, publicaciones científicas)
 Existen como repositorios independientes pero también pueden
estar integrados en repositorios institucionales
Repositorios “huérfanos”
 Repositorios establecidos para el archivo de trabajo de autores
que no tienen acceso a otro repositorio (institucional o temático).
 En general, son establecidos a nivel nacional
 Ejemplos:
 DEPOT - http://opendepot.org/ (UK, pero ahora disponible para
cualquiera),
 Repositorio Comum - http://comum.rcaap.pt/ (Portugal),
 OpenAIRE Orphan Record Repository - http://openaire.cern.ch/
(sólo para publicaciones financiadas por el FP7)
Agregadores/Portales
 Agregadores o portales que recolectan sus contenidos de
repositorios institucionales o disciplinares.
 Las agregaciones pueden ser geográficas (regional o nacional),
área temática o tipo de documento (por ejemplo, tesis y
disertaciones).
La situación de los repositorios en el mundo
Datos extraídos de OpenDOAR Directory of Open Access Repositories
Los Repositorios en el mundo…
Repositorios por continente
Repositorios en Europa
Tipos de Repositorios
Softwares de los Repositorios
Tipos de contenidos de los Repositorios
Crecimiento del número de Repositorios
Crecimiento del número de Repositorios – América del Sur
Red de Repositorios en América Latina
http://www.iadb.org/es/proyectos/project-information-page,1303.html?id=RG-T1684
DRIVER European Information Space
http://search.driver.research-infrastructures.eu/
270
Repositorios
agregados
36
países
+2.700.000
documentos
+25
Idiomas
Estándares de repositorios
 Las Directrices DRIVER para proveedores
contenido
 El protocolo OAI-PMH
 Metadados Dublin Core
 La aplicación de las directrices DRIVER
de
 Guidelines to facilitate the exchange of usage statistics
Directrices DRIVER/DRIVER Guidelines
Desarrolladas en el ámbito del proyecto DRIVER – Digital
Repository Infrastructure Vision for European Research
Versión actual 2.0 (noviembre de 2008)
Traducidas en español, japonés e portugués
Serán la base para las Directrices COAR (Confederation of
Open Access Repostories)
Directrices DRIVER/DRIVER Guidelines
Directrices DRIVER 2.0
Directrices para proveedores de contenido Exposición de recursos textuales con el
protocolo OAI-PMH
¿Qué es el OAI-PMH?
The Open Archives Initiative Protocol for Metadata
Harvesting
Una forma de interrogar a un archivo sobre su contenido.
Permite la creación de servicios de búsqueda y otras
funcionalidades sobre los metadatos de varios archivos.
Versión estable (2.0) en 2002
OAI-PMH: dos componentes
Data Providers – Mantienen uno o más
repositorios (servidores Web) que soportan el
OAI-PMH como método de exponer los
metadatos
Service Providers – Envía peticiones OAI-PMH a
data providers y utiliza los metadatos colectados
como base para construir servicios de valor
añadido.
Modelo OAI-PMH
Data providers
exponen metadatos
Service providers
Recogen metadatos
y hacen algo útil
con ellos
Modelo OAI-PMH
OAI Rep
OAI Rep
OAI Rep
OAI Rep
Harvester /
Aggregator /
Data store
Pesquisa
Harvester
Novos registos
Tecnologías
Construido con tecnologías estándar
Protocolo de transporte HTTP
Metadatos codificados en XML
Formato de metadatos Dublin Core
¿Cómo Funciona?
OAI “VERBS”
Service Provider
Metadata Provider
Identify
ListMetadataFormats
ListSets
ListIdentifiers
ListRecords
GetRecord
H
HTTP Request
A
(OAI Verb)
R
V
E OAI
S
T
HTTP Response
E
(Valid XML)
R
R
E
P
O
OAI S
I
T
O
R
Y
Identificadores Únicos
Cada registro tiene que poseer un identificador
único
Identificadores tienen que ser URI’s válidos
Cada identificador debe apuntar para un único
registro y siempre para el mismo registro
No se puede reaprovechar identificadores de registros
Datestamps
Necesario en cada registro para permitir
harvesting’s incrementales
Debe ser actualizado en cada adición / alteración /
eliminación para garantizar que las alteraciones son
propagadas correctamente
Pueden ser en la forma YYYY-MM-DD o YYYY-MMDDThh:mm:ssZ (debe ser GMT timezone)
OAI-PMH: Resumen
 Protocolo basado en HTTP
 Argumentos de las peticiones - GET o POST
 Seis tipos de peticiones
 Respuestas codificadas en XML
 Permite cualquier formato de metadatos (requiere: Dublin
Core)
 Data Providers y Service Providers
 Recomendacones de Dublin Core Metadata Initiative
(DCMI):
 DCMES – Dublin Core Metadata Element Set
 Un conjunto de 15 elementos de metadatos cuyo objetivo es permitir y facilitar la recuperación de
recursos electrónicos. (Woodley, 2001)
 Norma ISO, ANSI/NISO,
 ISO Standard 15836-2003 (February 2003): http://www.niso.org/international/SC4/n515.pdf
 NISO Standard Z39.85-2007 (May 2007): http://www.niso.org/standards/resources/Z39-85-2007.pdf
 DCQ – Dublin Core Qualifiers
 Refinamiento de elemento - especifican con mas detalle el significado de un elemento
 Esquema de codificación – Un esquema que ayuda en la interpretación del valor de un elemento.
Incluyen vocabularios controlados y notaciones formales o reglas de parsing. (Woodley, 2001)
Dublin Core - Elementos
Contenido
Propiedad Intelectual
Title
Subject
Description
Type
Source
Relation
Coverage
Creator
Contributor
Publisher
Rights
Caso
(Instance)
Date
Format
Identifier
Language
Elementos de refinamento
 Otros términos asociados al elemento que
especifican con mas precisión su significado.
 Por ejemplo, el elemento Date tiene como
calificadores de refinamiento de elemento los
términos Issued, Created, Available, Modified e
Valid.
Directrices DRIVER/DRIVER Guidelines
Directrices DRIVER 2.0
Directrices para proveedores de contenido Exposición de recursos textuales con el
protocolo OAI-PMH
Directrices DRIVER
 ¿Por qué son necesarias las directrices?
 Para guiar a los administradores de repositorios a garantizar
interoperabilidad y compatibilidad con los servicios DRIVER;
 Para que los desarrolladores de plataformas de repositorios incorporen
nuevas funcionalidades en versiones futuras
Directrices DRIVER
 Recursos Textuales(Apartado A)
Directrices para Metadatos (Apartado B)
Directrices para OAI-PMH
Recursos Textuales (A)
• Comparar Apartado A con contenido del
Repositorio
• Si los contenidos estan de acordo com los
requisitos de las directrices, no hay que hacer
nada…
• Si no, implementar un Set DRIVER
Recursos Textuales (A)
• Comparar Apartado A con contenido del Repositorio
• Si los contenidos estan de acordo com los requisitos
de las directrices, no hay que hacer nada…
• Si no, implementar un Set DRIVER
Recursos Textuales (A) Obligatório
• El repositorio contiene recursos textuales digitales
– recurso textual = artículos científicos, tesis doctorales,
documentos de trabajo, libros electrónicos y documentos
similares resultado de la actividad de la investigación científica
• Los recursos textuales están en formatos ampliamente
utilizados y extendidos (PDF, TXT, RTF, DOC, TeX, etc.)
• Los recursos textuales están en acceso abierto, están
disponibles directamente en el repositorio para cualquier
usuario del mundo, y sin ninguna restricción, como
autorización o pago.
Recursos Textuales
Obligatório
• Los recursos textuales están descritos mediante registros de
metadatos
• Los recursos textuales y de metadatos se vinculan entre sí de
tal modo que un usuario final pueda acceder al recurso
textual mediante el identificador (normalmente una URL) del
registro de metadatos.
• La URL de un recurso codificada en el registro de metadatos
siempre se puede localizar y nunca se cambia ni se reasigna.
• Un identificador único identifica el registro de metadatos y el
recurso textual (no hay punteros a sistemas externos, como
un sistema bibliotecario nacional o un editor)
Recursos Textuales Recomendado
• Verificación transparente de la integridad de un
recurso textual.
• Medidas de control de calidad (del contenido
científico) de los recursos textuales expuestos para
limitarlos a, por ejemplo, los recursos textuales
incluidos en el informe científico anual (o equivalente).
• La URL de un recurso codificada en el registro de
metadatos se basa en un esquema de identificadores
persistentes, como DOI, URN, ARK, etc.
Passo 1 – Directrizes Gerais (A)
• Comparar Parte A com conteúdo do Repositório
• Si los contenidos estan de acordo com los requisitos
de las directrices, no hay que hacer nada…
Senão
• Si no, implementar un Set DRIVER
Passo 1 – Directrizes Gerais (A)
• Comparar Apartado A con contenido del Repositorio
• Si los contenidos estan de acordo com los requisitos
de las directrices, no hay que hacer nada…
• Si no, implementar un Set DRIVER
Implementar un set DRIVER
Una forma de seleccionar y filtrar los registros relevantes
para el set.
Cuando se implementa um set DRIVER?
Cuando el repositorio contiene documentos que no
corresponden a la definición de “recurso textual”:
- contenidos que no sean literatura científica
- Contenidos con acceso restricto, embargado o
controlado
- Contenidos en formatos no comunes
Directrices para metadatos
Las directrices han sido producidas para facilitar el
intercambio de metadados entre los proveedores de
contenidos y los servicios (DRIVER o otros).
Describen la conversión de los formatos internos para el
estándar Unqualified Dublin Core para facilitar la colecta
(harvesting).
.
Directrices para metadatosRequisitos minimos
Los metadatos se estructuran según la norma Dublin Core
no cualificado (ISO 15836:2003).
Los elementos individuales de DC se utilizan según lo
dispuesto las directrices del presente apéndice.
Es obligatorio utilizar codificación Unicode.
Directrices DRIVER – Uso de los elementos
El uso de elementos puede ser:
Obligatorio = el elemento siempre debe estar presente en el registro de
metadatos;
obligatorio si procede= si se puede obtener el elemento, debe
agregarse al registro de metadatos;
recomendado = se recomienda el uso del elemento
Optativo = el hecho de utilizar o no el elemento no tiene relevancia
Directrices DRIVER – Uso de los elementos
Directrizes DRIVER – Uso de los elementos
Directrices DRIVER – Directrices para OAI-PMH
 Seguir la versión 2.0 del protocolo.
 Registros eliminados: se deben declarar. Utilizar la opción “transient” o “persistent” (conservar
temporalmente o indefinidamente la información sobre el registro eliminado).
 RessumptionToken (testigos de reanudación) al menos conservados durante 24 h.
 Lotes de recolección entre 100 y 500 registros.
 Correo electrónico de administración disponible.
 Comunicar cambios en la URL base, sets, formatos de metadatos
 Set Driver
 Solo si es necesario.
 Agrupa los registros textuales y de acceso abierto.
 setName: Open Access DRIVERset; setSpec: driver
Directrices DRIVER – Recursos adicionales
Las Directrices – http://www.driversupport.eu/managers.html#guidelines
El registro de DRIVER - http://validator.driver.researchinfrastructures.eu/registerRepository.do?action=load
El validador - http://validator.driver.researchinfrastructures.eu/login.do?action=load
Guidelines to facilitate the exchange of usage
statistics
 Impulsadas por Knowledge Exchange http://www.knowledge-exchange.info
Convergencia de varios proyectos, iniciativas y expertos:
PIRUS2, Oastatistik, SURFsure, RePec y
NeeO
http://wiki.surffoundation.nl/display/standards/KE+Usage+St
atistics+Guidelines
Creación y desarrollo de repositorios: factores
críticos de suceso y buenas prácticas de
repositorios
Creación de repositorios institucionales
 Definir objetivos y obtener el respaldo institucional
 Seleccionar la solución tecnológica (infraestructura
propia o externa? Software del repositorio)
 Establecer e ejecutar una estrategia e un plan de
implementación y definir responsables por las diferentes
tareas
Implementación de repositorios institucionales
 Apoyo e implicación de la dirección de la institución y
de los investigadores
 Obtención de contenidos y promoción del archivo
(preferentemente auto-archivo)
 Definición de políticas de gestión de los repositorios
Implementación de repositorios institucionales
 Obtener el respaldo institucional
 Empezar proyectos de demostración o comunidades
piloto
 Promover y apoyar la utilización del repositorio y el
auto-archivo por los investigadores/autores
 Divulgar y promover el repositorio en el interior y el
exterior de la institución
Obtener el respaldo institucional
Explicar/ demostrar la ventajas de los repositorios:
Para la visibilidad, posicionamiento y prestigio de la
institución
Para la gestión de la información de la institución
Para garantizar la preservación de la producción
intelectual de la institución
Para la reforma del sistema de comunicación de ciencia
Empezar proyectos de demostración o
comunidades piloto
Recoger documentos de páginas de los autores o
dos departamentos;
Recoger documentos de repositorios de disciplina
(PubMedCentral, Arxiv, RePEc);
Establecer un programa con comunidades piloto
(depósito de documentos en lote, digitalización de
documentos, etc.)
Promover y apoyar la utilización del repositorio e el autoarchivo junto de los autores
Para que la participación sea voluntaria y efectiva es
necesario que:
 las ventajas de los repositorios y del Open Access sean
comunicadas (y se posible demostradas) de manera clara y
frecuente;
las objeciones y resistencias potenciales al repositorio
institucional deben ser anticipadas y comprendidas.
Número de visitantes/visitas até Dezembro de
2010
Origens dos downloads desde 2006
28%
1%
Portugal
2%
Brasil
4%
União Europeia
Estados Unidos
Índia
6%
43%
16%
China
Outros
Visão geral das origens de tráfego no último ano
8%
19%
1%
Mecanismos de pesquisa
Websites de referência
Tráfego directo
Outros
72%
Alguns testemunhos…
Gargouri Y, Hajjem C, Larivière V, Gingras Y, Carr L, et al. 2010 Self-Selected or Mandated, Open Access Increases
Citation Impact for Higher Quality Research. PLoS ONE 5(10): e13636. doi:10.1371/journal.pone.0013636
Gargouri Y, Hajjem C, Larivière V, Gingras Y, Carr L, et al. 2010 Self-Selected or Mandated, Open Access Increases
Citation Impact for Higher Quality Research. PLoS ONE 5(10): e13636. doi:10.1371/journal.pone.0013636
Módulo 10. Repositorios de acceso abierto, buenas
prácticas y estado actual en Europa y LAC
Promover y apoyar la utilización del repositorio e el autoarchivo junto de los autores
Crear guías y ayudas al proceso de depósito/archivo de
documentos.
Realizar presentaciones para los autores sobre el proceso
de auto-archivo.
Crear y ofrecer un servicio de apoyo y “esclarecimiento”
sobre los derechos de autor.
Crear y ofrecer servicios de valor añadido para los autores
(listados, reportes, estadísticas, etc.)
Promover y apoyar la utilización del repositorio e el autoarchivo junto de los autores
 Facilitar la interoperabilidad con otros sistemas
utilizado por los investigadores (sistemas de gestión de
currículos o CRIS, otros repositorios, revistas/editores)
 Permitir la integración del archivo en el repositorio
en su proprio workflow y ambiente de trabajo.
 Facilitar el cumplimiento de las politicas/mandatos
de los financiadores (como el UE – FP7 – OpenAIRE)
Como cumprir com as regras do Projecto-piloto
OA do 7.º PQ
Depositar o artigo no
RepositóriUM
Enviar o artigo
para o editor
SIM
Artigo final do
autor
Referência do artigo
disponível nos sites
OpenAIRE/CE, texto completo
disponível para todos
(imediatamente ou após
período de embargo) num
repositório
Repositório
institucional
ou disciplinar
disponível?
NÃO
Utilizar o repositório
orfão do OpenAIRE
Mais informação em:
www.openaire.eu
Divulgar y promover el repositorio
Crear documentos y materiales de presentación y divulgación del
repositorio
Presentar el repositorio en reuniones de facultad o departamento,
seminarios e conferencias, etc.
Publicar artículos y noticias sobre el repositorio en revistas,
boletines e otros medios de comunicación (sitios Web, etc.) de la
institución
 Identificar comunidades y personas “ejemplares”, líderes de
opinión y garantizar su adhesión.
 Divulgar “casos de suceso”
Políticas y gestión de repositorios
 Política de contenidos
 Políticas y procesos de depósito
 Licenciamiento y políticas de copyright
 Políticas de preservación
 Políticas y mandatos de auto-archivo
OpenDOAR Policies Tool http://www.opendoar.org/tools/en/policies.php
Políticas de contenido
Que contenidos pueden tener los repositorios?
Hay repositorios con políticas muy diferentes:
Literatura científica
Artículos de revistas (postprints,preprints)
Otros tipos de documentos (literatura gris)
Materiales de enseñanza
Trabajos de alumnos
Publicaciones institucionales
Definir que tipos de documentos pueden ser archivados
y eventuales restricciones o recomendaciones en cuanto
a los formatos
Políticas y procesos de depósito
 Quien puede archivar/depositar?
 Reglas del
obligatorio?)
depósito
(depósito
de
texto
completo
 Procesos de aceptación/moderación y control de cualidad
(los documentos depositados van a ser verificados antes de
se quedaren disponibles públicamente?)
 Los procesos y reglas de depósito pueden variar en el
mismo repositorio dependiendo de los tipos de documentos o
departamentos.
Licencias y políticas de copyright
 Licencias de depósito
Licencia a perpetuidad
Licencia no exclusiva para dar acceso y preservar
(incluyendo migrar el suporte/formato)
 Enbargos y restricciones de acceso
Política de copyright (quien es el responsable de su
cumplimiento?)
Sherpa/Romeo - http://www.sherpa.ac.uk/romeo/
Dulcinea - http://www.accesoabierto.net/dulcinea/
Licencias para los usuarios finales
Licencia Creative Commons – www.creativecommons.org
Políticas de preservación
 Período de retención
 Preservación funcional (migración de formatos, etc.)
 Preservación de los ficheros (backups, etc.)
 Política de retirada (en que condiciones pueden ser retirados los
ficheros)
 Control de las versiones (alteración de documentos, depósito de
varias versiones, etc.)
 Política de cierre (que pasará se el repositorio cierre?)
Evaluación de repositorios
Evaluación de repositorios
 La evaluación de puede ser útil desde diversos puntos
de vista:
 Evaluar la calidad del trabajo realizado en el repositorio
 Monitorizar el progreso/éxito
 Certificar la “calidad” de los repositorios
 Benchmarking o comparación entre repositorios
Evaluación de repositorios
 Varios métodos y herramientas de evaluación:
 Guías y directrices
 Certificados
 Rankings
Evaluación de repositorios
 Certificado DINI (Deutsche Initiative für Netzwerkinformation E.V.)
 Diseñado como una guía para la configuración general de un
repositorio con unos criterios mínimos, cuyo cumplimiento es, y unas
recomendaciones adicionales
 Examina si están en uso las normas técnicas (servidor, la interfaz,
formatos, metadatos, etc) y las mejores prácticas establecidas para los
servicios de apoyo (Política, ayuda a los autores, indexación, archivo,
etc.)
 Al otorgar un certificado, DINI efectúa un control de calidad sobre los
repositorios y constituye una herramienta de evaluación e inicio de
procesos de mejora.
Evaluación de repositorios
 Guía para la evaluación de repositorios institucionales de
investigación
http://www.recolecta.net/buscador/documentos/GuiaEvaluaci
onRecolectav1.0-1.pdf
 Elaborada por REBIUN-FECYT-RECOLECTA
 Basada en Proyectos y directrices de referencia (DINI,
DRIVER)
Guia para la evaluación de repositorios
 La Guía se estructura en un total de siete secciones que
definen en conjunto 31 criterios de evaluación
 Visibilidad
 Políticas
 Aspectos legales
 Metadatos
 Directrices DRIVER
 Logs y estadísticas
 Seguridad, autenticidad e integridad de los datos
Evaluación de repositorios
 Ranking Web of World Repositories
 Elaborado por lo Cybermetrics Lab del CSIC
 Metodologia:
 http://repositories.webometrics.info/index.html
Recursos adicionales
DINI Certificate - http://www.dini.de/english/dini-certificate/
DRIVER Support website - http://www.driver-support.eu/
Institutional Repository Bibliography - http://digital-scholarship.org/irb/irb.html
Projecto repositorio Científico de Acesso Aberto de Portugal http://projecto.rcaap.pt/
Ranking Web of World Repositories - http://repositories.webometrics.info/
Recolecta - http://www.recolecta.net
Repositories Case Studies - http://www.rsp.ac.uk/repos/cases
Repositories Support Project - http://www.rsp.ac.uk/
¿Preguntas?
Questões?
Eloy Rodrigues
[email protected]