Flujos de trabajo en la gestión de un repositorio

Download Report

Transcript Flujos de trabajo en la gestión de un repositorio

Flujos de trabajo en la gestión de
un repositorio institucional
Antonio Juan Prieto Jiménez
Jordi Serrano-Muñoz
Universitat Politècnica de Catalunya
¿Quiénes somos?
Sumario
•
•
•
•
•
•
•
•
•
•
•
Razón de ser
¿Biblioteca?
Agentes
¿Empezamos?
Check-list
Como organizarlo
Interoperabilidad e
integración
Sostenibilidad
Soporte
Infraestructura TIC
Mas tareas
• La UPC en cifras
• Repositorios en la UPC
Repositorios: Razón de ser (I)
• Ofrecer a nuestra comunidad una herramienta o
aplicación para publicar sus trabajos académicos,
en acceso abierto y en texto completo en Internet
• Garantizar el acceso perpetuo a los trabajos
archivados mediante su almacenamiento en
servidores seguros mantenidos y gestionados por
la ¿Biblioteca?
• Mejorar la visibilidad de la organización y sus
autores en la red.
Repositorios: Razón de ser (II)
• ¿De verdad necesitamos crear, gestionar y
mantener un repositorio?
• Analicemos las implicaciones:
• ¿Está la organización madura?
• Dimensiones
• Capacidades
• Recursos: personas, infraestructura,
económicos, ….
Repositorios: Razón de ser (y III)
• No lo necesitamos:
• Esperamos la oportunidad
• Creamos las condiciones
• Preparamos el terreno
• No hacemos nada
• Si lo necesitamos
• ¿Podemos hacerlo?
• Lo tenemos claro
• Alianzas / Colaboraciones
Repositorios: ¿Biblioteca? (I)
• La implementación, gestión,
organización no es solo una
responsabilidad de la biblioteca
• Es de toda la institución
• Requiere un compromiso institucional
• Si no hay compromiso…. ¿Para que
queremos un repositorio?
Repositorios: ¿Biblioteca? (y II)
La institución debe comprometerse
con el control y la protección de su
producción intelectual en soporte
digital
Alicia López Medina (UNED)
Repositorios: Agentes (I)
• Implicación a diferentes niveles:
• Órganos de gobierno
• Gestores / administradores
• Docentes / investigadores, …
• Oficina de apoyo a la investigación y
transferencia de tecnología
• Sistemas de información
• …..
Y también biblioteca
Repositorios: Agentes (y II)
• Necesitamos la complicidad y el
compromiso de nuestro entorno
• No debemos “lanzarnos a la piscina”
solos, en ese caso lo mas probable es que
fracasemos
• Cada uno de los agentes tiene su
responsabilidad, su tarea y
evidentemente diferentes niveles de
implicación
Repositorios: ¿Empezamos?
• Habrá que hacer pasillos y “cafés”
• Crear complicidades
• Explicar cuales son los beneficios para el
investigador / docente y para la organización
 también para la sociedad
• Implicará un cambio cultural
• Pensemos en la lista de tareas e implicaciones
• Y naturalmente en asignarle un presupuesto
Atención: ¡esto no es un proyecto!
Repositorios: Check-list (I)
/
• Visión, misión, objetivo del repositorio
• ¿Qué representa el repositorio para la
organización?
• ¿Qué contenidos?
• ¿Hemos identificado a los agentes?
• ¿La organización tiene una política sobre la
propiedad intelectual?
• ¿Se han analizado los riesgos?
Repositorios: Check-list (II)
• ¿No habrá ya por ahí algún repositorio?
• ¿Tenemos el soporte institucional? ¿Está la
institución “madura”?
• La organización y los agentes, ¿Están
preparados? ¿Están capacitados?
• ¿Tenemos algún “champion” como cómplice?
• ¿Hemos definido roles, responsabilidades,
etc.. para el desarrollo del repositorio?
Repositorios: Check-list (y III)
• ¿Hay financiación?
• ¿Qué estadísticas, datos e informes
facilitaremos del repositorio?
• ¿Y el ROI?
Fuente:
JISC: Planning Checklist - Before You Start
Repositories Support Project
Repositorios: Como organizarlo (I)
• Identificar comunidades, usuarios,
contenidos,…
• Quien deposita o almacena
• Procedimientos:
• Flujos y roles: aceptación,
moderador/validador, revisor
• Mandato
• Licencias
Repositorios: Como organizarlo (II)
• Metadatos, normalización, …
• Políticas de preservación 
migración de formatos
• Dominio, hosting, backup/copias de
seguridad, actualizaciones,
migraciones …
No estamos solos en esto
Repositorios: Como organizarlo (III)
• Diferentes implicaciones = diferentes
niveles:
• “Políticos”
• Tecnológicos
• Gestión
• Se trata de una carrera de fondo:
¿Empezamos por un “piloto”? …. pero ….
• ….. ¿De verdad que necesitamos el
repositorio?
Repositorios: Como organizarlo (IV)
• Modelo centralizado  único repositorio para
todos los contenidos
• Modelo diversificado:
• Ajustar los modelos de metadatos.
• Adaptarse a la naturaleza de los contenidos.
• Trabajar las particularidades de los documentos.
• Facilitar su integración con otros sistemas de
información.
• Adaptarlos a la organización de la biblioteca
• Desarrollo tecnológico mas flexible
Repositorios: Como organizarlo (y V)
• Modelo centralizado:
• Fácil de gestionar
• Incidencias con las "excepciones"
• Modelo diversificado:
• Incremento en los costes de
mantenimiento.
• Dispersión de contenidos y posible
confusión en la comunidad de usuarios
Conocer la organización  la decisión es
de todas las partes
Interoperabilidad e integración (I)
• Con otros sistemas de información:
• De la organización
• Externos
• Podemos compartir / reusar información
• Se pueden generar nuevas aplicaciones /
utilidades
• Mejoramos tareas / flujos de trabajo
• Todos ponen / Todos ganan
• Disponemos de estándares
No inventemos la rueda
Interoperabilidad e integración (y II)
•
•
•
•
•
•
•
OAI-PMH
Dublin Core
SWORD
SOA
IMS
SCORM
….incluso el MARC
Sostenibilidad
• Estamos preparados respecto a:
• Crecimiento de repositorio
• Infraestructura TIC
• Presupuesto asignado
• Personal y su gestión
• Updates / Migraciones
• Preservación
Calculemos a medio / largo plazo
Soporte
•
•
•
•
•
•
•
Legal, TIC, Gestión …..
Modelo(s) de metadatos
Plataforma(s)
Políticas de colecciones y de acceso
Gestión usuarios → roles, flujos …
Interacción con los agentes
Capacidad de respuesta (compromiso)
Infraestructura TIC
•
•
•
•
•
In house / externalizado
Cloud
Compartido
Atención a los SLA (la letra pequeña)
Backup
Evaluar costes…….
Más tareas
•
•
•
•
•
•
Mandato  ¿Work in progress?
Autores  ¿Están dispuestos a colaborar?
Algún tipo de incentivo
Difusión interna / externa
Alta directorios / Google Scholar
......
¿de verdad que necesitamos un
repositorio? 
La UPC en cifras 2010-2011 (I)
Comunidad
• 44.221 estudiantes
• 2.780 personal docente e
investigador
• 1.694 personal de
administración y
servicios
Distribuida en
• 11 campus y centros
territoriales
• 23 escuelas y facultades
13 bibliotecas
+/-100 personas
Titulaciones
• 69 titulaciones de grado
• 19 dobles titulaciones
• 85 convenios
internacionales de doble
titulación
• 61 programas de máster
• 46 programas de
doctorado
• 363 programas de
formación continua
(másteres UPC y cursos
de posgrado)
La UPC en cifras 2010-2011 (II)
Departamentos, institutos y
centros de investigación
•
•
•
•
Investigación
• 64.164.414 € Ingresos por
proyectos I+D+i y transferencia
tecnológica
• 101 Distinciones científicotécnicas recibidas
• 843 nuevos convenios y
proyectos de investigación
• 2.070 artículos publicados en
revistas científicas
• 78 patentes
42 departamentos
6 institutos de investigación
183 grupos de investigación
17 centros específicos de
investigación
• 19 Centros de investigación
en la red TECNIO
• 19 Centros de investigación
vinculados
Universidad y Empresa
• 2.680 empresas y entidades con convenio de colaboración
• 14 empresas creadas y participadas (Programa Innova y Innova 31)
• 21 cátedras y aulas de empresa
La UPC en cifras 2010-2011 (y III)
•
•
•
•
•
•
•
•
13 bibliotecas
+/-120 personas
Modelo diversificado
2 TB. Contenidos
+/-64.000 documentos
Desde CRIS 9.700 documentos revisados / año
47% personal implicado en estas tareas
En algunos casos representa el 25% de su
tarea
Repositorios en la UPC
• Modelo diversificado:
•
•
•
•
•
•
•
•
2001: TDX
2002: Archivo Gráfico de la ETSAB
2003: Videoteca Digital de la UPC
2004: Trabajos académicos
2005: Revistas y congresos
2006: E-prints
2007: OCW Materiales docentes
2010: Fondo histórico bibliotecas UPC
• 2011: Nuevo OCW
• 2012: Depósito de exámenes
Integración
• Recuperar la información donde se genera o
introduce por primera vez
• Evitar duplicar tareas
• Actualizaciones => Estándares (SWORD, OAI,
RSS, etc.)
• Importancia en el crecimiento repositorio
Estándares: extraer información
• OAI-PMH
– Nuevos formatos de metadatos añadidos
– Módulo OAIExtended: sets específicos (driver,
OpenAIRE, etc.)
• RSS
– Ampliado para casos específicos (ItunesU,
Universia, etc.)
Estándares: Carga de datos
Simple Web-services Offering Repository Deposit
Un protocolo para depositar en repositorios entre aplicaciones
 Proyecto financiado por JISC iniciado en 2007
 Implementado para diversas plataformas (DSpace, Eprints, Fedora,
IntraLibrary)
 Creado por encima del protocolo Atom Publishing Protocol (APP o ATOMPUB)
 Dos operaciones básicas
 Servicedocument
 Deposit

SWORD: formato METS (I)
•
Llamada HTTP en la que se envía un archivo ZIP comprimido en formato estándar
METS que contiene:
- Archivo xml con las datos del recurso (archivo mets.xml)
- Documentos propios del recurso
Mets.xml
(datos del recurso:
-Autor
-Tutor
-Titulo
-Fechas
-Palabras clave… )
Memoria.pdf
Annex.pdf
…
…
SWORD: formato METS (II)
Cabecera
Metadatos descriptivos en formato MODS/SWAP/etc.
Licencia Creative Commons
Lista archivos
Mapa estructural
---
SWORD – Llamada deposit
HTTP POST
Cliente
POST /deposit/123456789/18 HTTP/1.1
Host:eprints.upc.es/pfc-sword
Content-Type: application/zip
Authorization: Basic ZGFmZnk6c2VjZJldA==
Content-length: nnn
Content-MD5: md5-digest
Content-Disposition: filename=mydeposit.zip
X-Format-Namespace: METS
RESP HTTP 201 CREATED
<?xmlversion="1.0" encoding="UTF-8"?>
<atom:entryxmlns:atom="http://www.w3.org/2005/At
om"xmlns:sword="http://purl.org/net/sword/">
<atom:id>info:something:1</atom:id>
…
</atom:entry>
Servidor
SWORD
UPCommons
Puesta en marcha
• Pasos iníciales
– Ver las necesidades de datos a enviar
– Explicación del protocolo y formato
• Preparar un entorno de desarrollo
• Creación de un wiki con información
sobre:
– Datos necesarios para el envío del recurso
– Como se mapean estas datos dentro del
formato METS
– Como se envían (SWORD)
– Enlaces a librerías en diferentes formatos de
programación
Otras
• No siempre existen los estándares adecuados
• Debemos hacer cambios específicos para
casos concretos (solo “si no hay más
remedio”)
• Exportación de bases de datos, cargas
manuales, etc.
• Cambios bien documentados
Portal producción
científica
BD EXPORT
DRAC
Visión General
Doctorat
Catálogo
GD Escuelas
GD Escuelas
Atenea
SWORD
BD EXPORT
PRISMA
ITunesU
GD Escuelas
MediaTIC
OJS
MDC
E-prints UPC
• Integración con DRAC (CRIS de la UPC)
• Portal producción científica UPC
• Driver / OpenAIRE
Integración DRAC
DRAC, el Descriptor de la Recerca i l’Activitat
Acadèmica de la UPC: http://drac.upc.edu/info
 Sistema que registra la actividad académica de la UPC
 Generación CVN
 Intervención del SBD en la definición del proyecto y
posterior participación en los workflows de revisión de
datos
 Integrado con UPCommons
 “Política institucional de acceso abierto: acceso, visibilidad,
impacto y preservación de la producción académica de la
UPC en Internet”
Modelo de integración
 Integración en dos fases:
1. Envío:
• Introducción metadatos básicos en DRAC
• Obligatoriedad de introducir enlace o archivo
• Si se introduce archivo, se conecta a UPCommons
2. Revisión:
• Revisión de metadatos básicos en DRAC
• Revisión de metadatos propios de UPCommons, validación de
las condiciones de acceso y publicación final
 Autenticación simultánea en ambas aplicaciones
mediante CAS
Integración DRAC: Pasos
Integración DRAC: Pasos
PASO 1: Carga archivo
PASO 2: Aceptación licencia
Integración DRAC: Pasos
Integración DRAC: Pasos
Integración DRAC: Pasos
Portal Producción científica
Portal de la Producción científica de la UPC
http://bibliotecnica.upc.edu/producciocientifica
Portal Producción científica
Evolución E-prints UPC
10000
9000
8000
Antes de DRAC
2262 reg. (4 años)
7000
6000
Con DRAC
5000
4214 reg. en abierto (2 años)
4000
2804 reg. acceso restringido (2
años)
3000
2000
Drac restringido
Drac abierto
Envío directo
1000
201
1-09
201
1-05
201
1-01
201
0-09
201
0-05
201
0-01
200
9-09
200
9-05
200
9-01
200
8-09
200
8-05
200
8-01
200
7-09
200
7-05
200
7-01
200
6-09
200
6-04
200
5-11
0
Trabajos académicos UPC
• Envío de los PFC/TFC desde las aplicaciones de
gestión de las escuelas
• Proceso de carga de registros al catálogo
Envío de PFC/TFC
• Diferentes escuelas disponen de aplicaciones
para la gestión de las lectura de PFC/TFC
• Recogen los archivos del proyecto y metadatos
necesarios
• Nos envían a través de SWORD
• De momento 4 escuelas => en proyecto
hacerlo con todas a través de la Eadministración
Envío de registro al catálogo
• Evitar catalogar los trabajos dos veces
• Carga semanal de registros del repositorio al
catálogo
• Exportación de registro MARCXML mediante
OAI
• ¡Más en el Pecha Kucha de mañana!
Revistas y Congresos UPC
• Envío de números de revistas desde OJS
• Exportación/importación con RACO (Revistes
Catalanes amb Acces Obert)
OJS (I)
• Proyecto de IDP: Servició de publicaciones de
la UPC
• Soporte al sistema de revisión de revistas
editadas en la UPC
• Gestión y asignación de DOI
OJS (II)
OJS
SWORD
SWAP
OAI-PMH
PAM MESSAGE
R
E
G
I
S
T
R
O
Resolución DOI
DOI
UPCommons
Revistas y Congresos
Videoteca UPC
• Mediatic
• ItunesU
Mediatic
• Proyecto de colaboración entre Servicio
informáticos del Campus de Terrassa y la
Biblioteca del Campus de Terrassa
• Envío a través de SWORD
ItunesU UPC
• Videoteca UPC posible
fuente de contenido
• Adaptación del RSS para
hacerlo compatible con
ItunesU (soportado en
las últimas versiones de
DSpace)
OCW y Exámenes UPC
• Desarrollados con Drupal
• IDP: Servicio de publicaciones de la UPC
• Integraciones
– Integración con Sistema de Gestión Académica (PRISMA): extracciones de
tablas de la base de datos
– RSS Universia, MDX y OCW Consortium
– Campus Virtual
PRISMA
• Información sobre asignaturas, plan docente
…. mediante importación de base de datos
• Vía SOA, PRISMA captura datos bibliográficos
del catálogo de documentos recomendados
en la guía docente
• Re-uso de esos datos bibliográficos en el OCW
Futuro
• Trabajar en el envío de Tesis
• Exportación de registros de fondo Antiguo a
Memoria Digital de Catalunya
• Aplicar el modelo de carga de PFC SWORD a
más escuelas (proyecto de e-administración)
• Exportación al catálogo con otros repositorios
• …¿Datos?
¡Muchas gracias por la atención!
Seguimos en el Pecha Kucha ;-)