Diapositiva 1 - NECOBELAC Project Home Page
Download
Report
Transcript Diapositiva 1 - NECOBELAC Project Home Page
De la publicación al acceso abierto a la producción
científica en el área de la salud
Curso de capacitación para formadores
Madrid, 28 de febrero a 2 de marzo
Repositorios: estándares, buenas prácticas y
evaluación
Eloy Rodrigues (Universidade do Minho) –
[email protected]
Introducción - Definiciones y tipos de repositorios
Situación de los repositorios en el mundo
Estándares asociados a repositorios
Creación y desarrollo de repositorios: factores críticos de éxito
y buenas prácticas de repositorios
Evaluación de repositorios
Repositorio
Un sitio, o contenedor donde se pueden depositar y
almacenar objetos (para seguridad y preservación)
Repositorio digital
Un sistema para recoger, preservar y dar acceso a objetos
digitales
Repositorio de Acceso Abierto
Un repositorio digital que recoge, almacena y ofrece
acceso abierto a resultados (publicaciones y/o datos) de
investigación científica
Tipos de Repositorios de Acceso Abierto
Institucionales
Disciplinares o temáticos
Repositorios de datos
Repositorios “huérfanos”
Agregadores
Repositorios institucionales
Almacenan, preservan, difunden y dan acceso a la producción
intelectual de los miembros de una institución (universidad, centro
de investigación, etc.).
Pueden contener solamente la producción intelectual/científica
(artículos, tesis y disertaciones, working papers, datos, etc.) de las
instituciones,
o
reunir
también
colecciones
especiales
(constituyéndose como bibliotecas digitales), documentación
administrativa, etc.
Repositorios Disciplinares o Temáticos
Reúnen, preservan y dan acceso a contenidos de una disciplina o
área temática.
Pueden ser creados y mantenidos por instituciones académicas o
de investigación, o bien por organismos gubernamentales.
Algunos de los repositorios mas conocidos son temáticos como o
PubMed en las ciencias de la salud, RePec en la área de la ciencias
económicas, o E-Lis en la área de las ciencias de la información.
Repositorios de datos científicos
Repositorios que almacenan y preservan los datos científicos
generados en el proceso de investigación (y que pueden originar, o
no, publicaciones científicas)
Existen como repositorios independientes pero también pueden
estar integrados en repositorios institucionales
Repositorios “huérfanos”
Repositorios establecidos para el archivo de trabajo de autores
que no tienen acceso a otro repositorio (institucional o temático).
En general, son establecidos a nivel nacional
Ejemplos:
DEPOT - http://opendepot.org/ (UK, pero ahora disponible para
cualquiera),
Repositorio Comum - http://comum.rcaap.pt/ (Portugal),
OpenAIRE Orphan Record Repository - http://openaire.cern.ch/
(sólo para publicaciones financiadas por el FP7)
Agregadores/Portales
Agregadores o portales que recolectan sus contenidos de
repositorios institucionales o disciplinares.
Las agregaciones pueden ser geográficas (regional o nacional),
área temática o tipo de documento (por ejemplo, tesis y
disertaciones).
La situación de los repositorios en el mundo
Datos extraídos de OpenDOAR Directory of Open Access Repositories
Los Repositorios en el mundo…
Repositorios por continente
Repositorios en Europa
Tipos de Repositorios
Softwares de los Repositorios
Tipos de contenidos de los Repositorios
Crecimiento del número de Repositorios
Crecimiento del número de Repositorios – América del Sur
Red de Repositorios en América Latina
http://www.iadb.org/es/proyectos/project-information-page,1303.html?id=RG-T1684
DRIVER European Information Space
http://search.driver.research-infrastructures.eu/
270
Repositorios
agregados
36
países
+2.700.000
documentos
+25
Idiomas
Estándares de repositorios
Las Directrices DRIVER para proveedores
contenido
El protocolo OAI-PMH
Metadados Dublin Core
La aplicación de las directrices DRIVER
de
Guidelines to facilitate the exchange of usage statistics
Directrices DRIVER/DRIVER Guidelines
Desarrolladas en el ámbito del proyecto DRIVER – Digital
Repository Infrastructure Vision for European Research
Versión actual 2.0 (noviembre de 2008)
Traducidas en español, japonés e portugués
Serán la base para las Directrices COAR (Confederation of
Open Access Repostories)
Directrices DRIVER/DRIVER Guidelines
Directrices DRIVER 2.0
Directrices para proveedores de contenido Exposición de recursos textuales con el
protocolo OAI-PMH
¿Qué es el OAI-PMH?
The Open Archives Initiative Protocol for Metadata
Harvesting
Una forma de interrogar a un archivo sobre su contenido.
Permite la creación de servicios de búsqueda y otras
funcionalidades sobre los metadatos de varios archivos.
Versión estable (2.0) en 2002
OAI-PMH: dos componentes
Data Providers – Mantienen uno o más
repositorios (servidores Web) que soportan el
OAI-PMH como método de exponer los
metadatos
Service Providers – Envía peticiones OAI-PMH a
data providers y utiliza los metadatos colectados
como base para construir servicios de valor
añadido.
Modelo OAI-PMH
Data providers
exponen metadatos
Service providers
Recogen metadatos
y hacen algo útil
con ellos
Modelo OAI-PMH
OAI Rep
OAI Rep
OAI Rep
OAI Rep
Harvester /
Aggregator /
Data store
Pesquisa
Harvester
Novos registos
Tecnologías
Construido con tecnologías estándar
Protocolo de transporte HTTP
Metadatos codificados en XML
Formato de metadatos Dublin Core
¿Cómo Funciona?
OAI “VERBS”
Service Provider
Metadata Provider
Identify
ListMetadataFormats
ListSets
ListIdentifiers
ListRecords
GetRecord
H
HTTP Request
A
(OAI Verb)
R
V
E OAI
S
T
HTTP Response
E
(Valid XML)
R
R
E
P
O
OAI S
I
T
O
R
Y
Identificadores Únicos
Cada registro tiene que poseer un identificador
único
Identificadores tienen que ser URI’s válidos
Cada identificador debe apuntar para un único
registro y siempre para el mismo registro
No se puede reaprovechar identificadores de registros
Datestamps
Necesario en cada registro para permitir
harvesting’s incrementales
Debe ser actualizado en cada adición / alteración /
eliminación para garantizar que las alteraciones son
propagadas correctamente
Pueden ser en la forma YYYY-MM-DD o YYYY-MMDDThh:mm:ssZ (debe ser GMT timezone)
OAI-PMH: Resumen
Protocolo basado en HTTP
Argumentos de las peticiones - GET o POST
Seis tipos de peticiones
Respuestas codificadas en XML
Permite cualquier formato de metadatos (requiere: Dublin
Core)
Data Providers y Service Providers
Recomendacones de Dublin Core Metadata Initiative
(DCMI):
DCMES – Dublin Core Metadata Element Set
Un conjunto de 15 elementos de metadatos cuyo objetivo es permitir y facilitar la recuperación de
recursos electrónicos. (Woodley, 2001)
Norma ISO, ANSI/NISO,
ISO Standard 15836-2003 (February 2003): http://www.niso.org/international/SC4/n515.pdf
NISO Standard Z39.85-2007 (May 2007): http://www.niso.org/standards/resources/Z39-85-2007.pdf
DCQ – Dublin Core Qualifiers
Refinamiento de elemento - especifican con mas detalle el significado de un elemento
Esquema de codificación – Un esquema que ayuda en la interpretación del valor de un elemento.
Incluyen vocabularios controlados y notaciones formales o reglas de parsing. (Woodley, 2001)
Dublin Core - Elementos
Contenido
Propiedad Intelectual
Title
Subject
Description
Type
Source
Relation
Coverage
Creator
Contributor
Publisher
Rights
Caso
(Instance)
Date
Format
Identifier
Language
Elementos de refinamento
Otros términos asociados al elemento que
especifican con mas precisión su significado.
Por ejemplo, el elemento Date tiene como
calificadores de refinamiento de elemento los
términos Issued, Created, Available, Modified e
Valid.
Directrices DRIVER/DRIVER Guidelines
Directrices DRIVER 2.0
Directrices para proveedores de contenido Exposición de recursos textuales con el
protocolo OAI-PMH
Directrices DRIVER
¿Por qué son necesarias las directrices?
Para guiar a los administradores de repositorios a garantizar
interoperabilidad y compatibilidad con los servicios DRIVER;
Para que los desarrolladores de plataformas de repositorios incorporen
nuevas funcionalidades en versiones futuras
Directrices DRIVER
Recursos Textuales(Apartado A)
Directrices para Metadatos (Apartado B)
Directrices para OAI-PMH
Recursos Textuales (A)
• Comparar Apartado A con contenido del
Repositorio
• Si los contenidos estan de acordo com los
requisitos de las directrices, no hay que hacer
nada…
• Si no, implementar un Set DRIVER
Recursos Textuales (A)
• Comparar Apartado A con contenido del Repositorio
• Si los contenidos estan de acordo com los requisitos
de las directrices, no hay que hacer nada…
• Si no, implementar un Set DRIVER
Recursos Textuales (A) Obligatório
• El repositorio contiene recursos textuales digitales
– recurso textual = artículos científicos, tesis doctorales,
documentos de trabajo, libros electrónicos y documentos
similares resultado de la actividad de la investigación científica
• Los recursos textuales están en formatos ampliamente
utilizados y extendidos (PDF, TXT, RTF, DOC, TeX, etc.)
• Los recursos textuales están en acceso abierto, están
disponibles directamente en el repositorio para cualquier
usuario del mundo, y sin ninguna restricción, como
autorización o pago.
Recursos Textuales
Obligatório
• Los recursos textuales están descritos mediante registros de
metadatos
• Los recursos textuales y de metadatos se vinculan entre sí de
tal modo que un usuario final pueda acceder al recurso
textual mediante el identificador (normalmente una URL) del
registro de metadatos.
• La URL de un recurso codificada en el registro de metadatos
siempre se puede localizar y nunca se cambia ni se reasigna.
• Un identificador único identifica el registro de metadatos y el
recurso textual (no hay punteros a sistemas externos, como
un sistema bibliotecario nacional o un editor)
Recursos Textuales Recomendado
• Verificación transparente de la integridad de un
recurso textual.
• Medidas de control de calidad (del contenido
científico) de los recursos textuales expuestos para
limitarlos a, por ejemplo, los recursos textuales
incluidos en el informe científico anual (o equivalente).
• La URL de un recurso codificada en el registro de
metadatos se basa en un esquema de identificadores
persistentes, como DOI, URN, ARK, etc.
Passo 1 – Directrizes Gerais (A)
• Comparar Parte A com conteúdo do Repositório
• Si los contenidos estan de acordo com los requisitos
de las directrices, no hay que hacer nada…
Senão
• Si no, implementar un Set DRIVER
Passo 1 – Directrizes Gerais (A)
• Comparar Apartado A con contenido del Repositorio
• Si los contenidos estan de acordo com los requisitos
de las directrices, no hay que hacer nada…
• Si no, implementar un Set DRIVER
Implementar un set DRIVER
Una forma de seleccionar y filtrar los registros relevantes
para el set.
Cuando se implementa um set DRIVER?
Cuando el repositorio contiene documentos que no
corresponden a la definición de “recurso textual”:
- contenidos que no sean literatura científica
- Contenidos con acceso restricto, embargado o
controlado
- Contenidos en formatos no comunes
Directrices para metadatos
Las directrices han sido producidas para facilitar el
intercambio de metadados entre los proveedores de
contenidos y los servicios (DRIVER o otros).
Describen la conversión de los formatos internos para el
estándar Unqualified Dublin Core para facilitar la colecta
(harvesting).
.
Directrices para metadatosRequisitos minimos
Los metadatos se estructuran según la norma Dublin Core
no cualificado (ISO 15836:2003).
Los elementos individuales de DC se utilizan según lo
dispuesto las directrices del presente apéndice.
Es obligatorio utilizar codificación Unicode.
Directrices DRIVER – Uso de los elementos
El uso de elementos puede ser:
Obligatorio = el elemento siempre debe estar presente en el registro de
metadatos;
obligatorio si procede= si se puede obtener el elemento, debe
agregarse al registro de metadatos;
recomendado = se recomienda el uso del elemento
Optativo = el hecho de utilizar o no el elemento no tiene relevancia
Directrices DRIVER – Uso de los elementos
Directrizes DRIVER – Uso de los elementos
Directrices DRIVER – Directrices para OAI-PMH
Seguir la versión 2.0 del protocolo.
Registros eliminados: se deben declarar. Utilizar la opción “transient” o “persistent” (conservar
temporalmente o indefinidamente la información sobre el registro eliminado).
RessumptionToken (testigos de reanudación) al menos conservados durante 24 h.
Lotes de recolección entre 100 y 500 registros.
Correo electrónico de administración disponible.
Comunicar cambios en la URL base, sets, formatos de metadatos
Set Driver
Solo si es necesario.
Agrupa los registros textuales y de acceso abierto.
setName: Open Access DRIVERset; setSpec: driver
Directrices DRIVER – Recursos adicionales
Las Directrices – http://www.driversupport.eu/managers.html#guidelines
El registro de DRIVER - http://validator.driver.researchinfrastructures.eu/registerRepository.do?action=load
El validador - http://validator.driver.researchinfrastructures.eu/login.do?action=load
Guidelines to facilitate the exchange of usage
statistics
Impulsadas por Knowledge Exchange http://www.knowledge-exchange.info
Convergencia de varios proyectos, iniciativas y expertos:
PIRUS2, Oastatistik, SURFsure, RePec y
NeeO
http://wiki.surffoundation.nl/display/standards/KE+Usage+St
atistics+Guidelines
Creación y desarrollo de repositorios: factores
críticos de suceso y buenas prácticas de
repositorios
Creación de repositorios institucionales
Definir objetivos y obtener el respaldo institucional
Seleccionar la solución tecnológica (infraestructura
propia o externa? Software del repositorio)
Establecer e ejecutar una estrategia e un plan de
implementación y definir responsables por las diferentes
tareas
Implementación de repositorios institucionales
Apoyo e implicación de la dirección de la institución y
de los investigadores
Obtención de contenidos y promoción del archivo
(preferentemente auto-archivo)
Definición de políticas de gestión de los repositorios
Implementación de repositorios institucionales
Obtener el respaldo institucional
Empezar proyectos de demostración o comunidades
piloto
Promover y apoyar la utilización del repositorio y el
auto-archivo por los investigadores/autores
Divulgar y promover el repositorio en el interior y el
exterior de la institución
Obtener el respaldo institucional
Explicar/ demostrar la ventajas de los repositorios:
Para la visibilidad, posicionamiento y prestigio de la
institución
Para la gestión de la información de la institución
Para garantizar la preservación de la producción
intelectual de la institución
Para la reforma del sistema de comunicación de ciencia
Empezar proyectos de demostración o
comunidades piloto
Recoger documentos de páginas de los autores o
dos departamentos;
Recoger documentos de repositorios de disciplina
(PubMedCentral, Arxiv, RePEc);
Establecer un programa con comunidades piloto
(depósito de documentos en lote, digitalización de
documentos, etc.)
Promover y apoyar la utilización del repositorio e el autoarchivo junto de los autores
Para que la participación sea voluntaria y efectiva es
necesario que:
las ventajas de los repositorios y del Open Access sean
comunicadas (y se posible demostradas) de manera clara y
frecuente;
las objeciones y resistencias potenciales al repositorio
institucional deben ser anticipadas y comprendidas.
Número de visitantes/visitas até Dezembro de
2010
Origens dos downloads desde 2006
28%
1%
Portugal
2%
Brasil
4%
União Europeia
Estados Unidos
Índia
6%
43%
16%
China
Outros
Visão geral das origens de tráfego no último ano
8%
19%
1%
Mecanismos de pesquisa
Websites de referência
Tráfego directo
Outros
72%
Alguns testemunhos…
Gargouri Y, Hajjem C, Larivière V, Gingras Y, Carr L, et al. 2010 Self-Selected or Mandated, Open Access Increases
Citation Impact for Higher Quality Research. PLoS ONE 5(10): e13636. doi:10.1371/journal.pone.0013636
Gargouri Y, Hajjem C, Larivière V, Gingras Y, Carr L, et al. 2010 Self-Selected or Mandated, Open Access Increases
Citation Impact for Higher Quality Research. PLoS ONE 5(10): e13636. doi:10.1371/journal.pone.0013636
Módulo 10. Repositorios de acceso abierto, buenas
prácticas y estado actual en Europa y LAC
Promover y apoyar la utilización del repositorio e el autoarchivo junto de los autores
Crear guías y ayudas al proceso de depósito/archivo de
documentos.
Realizar presentaciones para los autores sobre el proceso
de auto-archivo.
Crear y ofrecer un servicio de apoyo y “esclarecimiento”
sobre los derechos de autor.
Crear y ofrecer servicios de valor añadido para los autores
(listados, reportes, estadísticas, etc.)
Promover y apoyar la utilización del repositorio e el autoarchivo junto de los autores
Facilitar la interoperabilidad con otros sistemas
utilizado por los investigadores (sistemas de gestión de
currículos o CRIS, otros repositorios, revistas/editores)
Permitir la integración del archivo en el repositorio
en su proprio workflow y ambiente de trabajo.
Facilitar el cumplimiento de las politicas/mandatos
de los financiadores (como el UE – FP7 – OpenAIRE)
Como cumprir com as regras do Projecto-piloto
OA do 7.º PQ
Depositar o artigo no
RepositóriUM
Enviar o artigo
para o editor
SIM
Artigo final do
autor
Referência do artigo
disponível nos sites
OpenAIRE/CE, texto completo
disponível para todos
(imediatamente ou após
período de embargo) num
repositório
Repositório
institucional
ou disciplinar
disponível?
NÃO
Utilizar o repositório
orfão do OpenAIRE
Mais informação em:
www.openaire.eu
Divulgar y promover el repositorio
Crear documentos y materiales de presentación y divulgación del
repositorio
Presentar el repositorio en reuniones de facultad o departamento,
seminarios e conferencias, etc.
Publicar artículos y noticias sobre el repositorio en revistas,
boletines e otros medios de comunicación (sitios Web, etc.) de la
institución
Identificar comunidades y personas “ejemplares”, líderes de
opinión y garantizar su adhesión.
Divulgar “casos de suceso”
Políticas y gestión de repositorios
Política de contenidos
Políticas y procesos de depósito
Licenciamiento y políticas de copyright
Políticas de preservación
Políticas y mandatos de auto-archivo
OpenDOAR Policies Tool http://www.opendoar.org/tools/en/policies.php
Políticas de contenido
Que contenidos pueden tener los repositorios?
Hay repositorios con políticas muy diferentes:
Literatura científica
Artículos de revistas (postprints,preprints)
Otros tipos de documentos (literatura gris)
Materiales de enseñanza
Trabajos de alumnos
Publicaciones institucionales
Definir que tipos de documentos pueden ser archivados
y eventuales restricciones o recomendaciones en cuanto
a los formatos
Políticas y procesos de depósito
Quien puede archivar/depositar?
Reglas del
obligatorio?)
depósito
(depósito
de
texto
completo
Procesos de aceptación/moderación y control de cualidad
(los documentos depositados van a ser verificados antes de
se quedaren disponibles públicamente?)
Los procesos y reglas de depósito pueden variar en el
mismo repositorio dependiendo de los tipos de documentos o
departamentos.
Licencias y políticas de copyright
Licencias de depósito
Licencia a perpetuidad
Licencia no exclusiva para dar acceso y preservar
(incluyendo migrar el suporte/formato)
Enbargos y restricciones de acceso
Política de copyright (quien es el responsable de su
cumplimiento?)
Sherpa/Romeo - http://www.sherpa.ac.uk/romeo/
Dulcinea - http://www.accesoabierto.net/dulcinea/
Licencias para los usuarios finales
Licencia Creative Commons – www.creativecommons.org
Políticas de preservación
Período de retención
Preservación funcional (migración de formatos, etc.)
Preservación de los ficheros (backups, etc.)
Política de retirada (en que condiciones pueden ser retirados los
ficheros)
Control de las versiones (alteración de documentos, depósito de
varias versiones, etc.)
Política de cierre (que pasará se el repositorio cierre?)
Evaluación de repositorios
Evaluación de repositorios
La evaluación de puede ser útil desde diversos puntos
de vista:
Evaluar la calidad del trabajo realizado en el repositorio
Monitorizar el progreso/éxito
Certificar la “calidad” de los repositorios
Benchmarking o comparación entre repositorios
Evaluación de repositorios
Varios métodos y herramientas de evaluación:
Guías y directrices
Certificados
Rankings
Evaluación de repositorios
Certificado DINI (Deutsche Initiative für Netzwerkinformation E.V.)
Diseñado como una guía para la configuración general de un
repositorio con unos criterios mínimos, cuyo cumplimiento es, y unas
recomendaciones adicionales
Examina si están en uso las normas técnicas (servidor, la interfaz,
formatos, metadatos, etc) y las mejores prácticas establecidas para los
servicios de apoyo (Política, ayuda a los autores, indexación, archivo,
etc.)
Al otorgar un certificado, DINI efectúa un control de calidad sobre los
repositorios y constituye una herramienta de evaluación e inicio de
procesos de mejora.
Evaluación de repositorios
Guía para la evaluación de repositorios institucionales de
investigación
http://www.recolecta.net/buscador/documentos/GuiaEvaluaci
onRecolectav1.0-1.pdf
Elaborada por REBIUN-FECYT-RECOLECTA
Basada en Proyectos y directrices de referencia (DINI,
DRIVER)
Guia para la evaluación de repositorios
La Guía se estructura en un total de siete secciones que
definen en conjunto 31 criterios de evaluación
Visibilidad
Políticas
Aspectos legales
Metadatos
Directrices DRIVER
Logs y estadísticas
Seguridad, autenticidad e integridad de los datos
Evaluación de repositorios
Ranking Web of World Repositories
Elaborado por lo Cybermetrics Lab del CSIC
Metodologia:
http://repositories.webometrics.info/index.html
Recursos adicionales
DINI Certificate - http://www.dini.de/english/dini-certificate/
DRIVER Support website - http://www.driver-support.eu/
Institutional Repository Bibliography - http://digital-scholarship.org/irb/irb.html
Projecto repositorio Científico de Acesso Aberto de Portugal http://projecto.rcaap.pt/
Ranking Web of World Repositories - http://repositories.webometrics.info/
Recolecta - http://www.recolecta.net
Repositories Case Studies - http://www.rsp.ac.uk/repos/cases
Repositories Support Project - http://www.rsp.ac.uk/
¿Preguntas?
Questões?
Eloy Rodrigues
[email protected]