Transcript JeromeDL

Semantic Web Challenge
Universidad de Valladolid
Máster de Investigación en TIC
Tecnologías Emergentes en Sistemas Telemáticos
Jorge Diez Mínguez Noviembre-2009
ÍNDICE
Introducción
Arquitectura
Servicios de Biblioteca Digital
Servicios Semánticos
Servicios Sociales
Conclusiones
Introducción (I)
JeromeDL es una Biblioteca Digital Semántica y Social.
Como biblioteca digital permite publicar fácilmente
documentos en la Web. Soporta una gran variedad de
formatos de documento y permite almacenar y consultar
una rica descripción bibliográfica de cada documento.
Introducción (II)
Con los servicios sociales y semánticos de JeromeDL
cada usuario puede marcar una selección de libros,
artículos u otros materiales en directorios anotados
semánticamente.
Los usuarios pueden permitir a otros usuarios ver sus
selecciones y anotaciones y compartir sus
conocimientos dentro de una red social.
JeromeDL también puede tratar a un único recurso de
la biblioteca como una entrada de blog. Los usuarios
pueden comentar el contenido del recurso y responder
a los comentarios de los demás creando de esta
manera nuevos conocimientos.
Arquitectura
Presenta una arquitectura de 3 capas para la gestión de
los metadatos. Cada capa enriquece la información
básica de la biblioteca con anotaciones semánticas y
proporciona capacidades adicionales de navegación y
búsqueda.
Servicios de Biblioteca Digital
Utiliza Sistemas de Organización del Conocimiento (KOS) [1] que son
herramientas que presentan una interpretación organizada de estructuras de
conocimiento. JeromeDL permite mantener y utilizar ficheros de autoría
con listas de autores y editores, taxonomías como DMoz o DDC. Utiliza un
interface en AJAX para la gestión de KOS y describir recursos utilizando
vocabularios controlados.
Los datos se almacenan en formato XSL:FO (eXtensible Stylesheet
Language Formatting Objects) que permite elegir al lector entre varios tipos
de visualización: pdf, rtf, html,…
No sólo almacena metadatos bibliográficos, además gestiona una
representación electrónica del contenido. Esta estructura puede depender
de varios tipos de recursos (libros, presentaciones, vídeos,…)
JeromeDL propone una ontología para definir la estructura de recursos en
RDF. Permite extender esta descripción de la estructura con nuevos
conceptos.
Servicios Semánticos (I)
• Soporte de la información.
Utiliza el diccionario WordNet [2] para categorizar en dominios.
Permite el uso de cualquier propiedad que se considera apropiada para
anotar publicaciones (Folksonomies).
Ontología bibliográfica: Utiliza el estándar MarcOnt Ontology [3] para
unificar el formato de descripción bibliográfica. Toma los conceptos de
formatos existentes como MARC21, BibTEX o Dublin Core.
Servicios Semánticos (II)
• Gestión de perfiles de la comunidad.
Utiliza el sistema de gestión de identidades distribuido FOAFRealm [4]
basado en FOAF (Friend Of A Friend) que define una tecnología abierta y
descentralizada para conectar redes sociales y los perfiles que las forman.
El contenido se protege mediante ACL (Access Control List) adjunto a cada
recurso.
• Servicios de Búsqueda y Navegación.
Servicio Direct RDF query que permite varios lenguajes de consulta como
RDQL, SeRQL y SRQL. Los resultados de la consulta en RDF pueden
serializarse a formatos XML, N3, N-Triples, TURTLe y JSON o presentarse
en HTML.
Proporciona plantillas para consultas en leguaje natural, creadas a partir de
las consultas que más se realizan.
Servicios Semánticos (III)
Utiliza TagsTreeMaps (TTM) [5] para representar un conjunto de etiquetas
como un árbol de categorías agrupadas. Nos permite filtrar, procesar,
agrupar y encadenar etiquetas.
MultiBeeBrowse (MBB) [6], que nos permite navegar por metadatos no
estructurados representados como un grafo RDF. Acceso a recursos,
búsqueda, filtrado, combinación de servicios (suma, resta, etc… de
resultados)
Serialización JSON y Exhibit Navigation Service [7]. Aunque el usuario
puede escoger como serializar los resultados de una búsqueda, representar
el grafo RDF en formato JSON nos permite integrar el componente de
navegación Exhibit en JeromeDL. Este componente facilita el filtrado de los
recursos presentados en líneas de tiempo y google maps.
Servicios Sociales
• Social Bookmarking ofrecido por JeromeDL mediante Social Semantic
Collaborative Filtering (SSCF) [8] , se trata de un filtrado colaborativo en el
que cada usuario se encarga de un tema específico en el que se considera
“experto” para después compartirlo en la red social.
• JeromeDL como blog: exporta los comentarios de los usuarios a los
recursos de la biblioteca. Utiliza SIOC (Semantically-Interlinked Online
Communities) [9], que proporciona una ontología de la Web Semántica para
la representación de datos de una Web social en RDF. Así los comentarios
pueden ser fácilmente integrados con otras fuentes de información
semántica social.
Conclusiones (I)
• Soporta el legado de las librerías clásicas (p.e. escaneo de libros antiguos
y otros formatos como MARC21, BibTEX o Dublin Core).
• Proporciona características de navegación orientadas al usuario.
• Eficacia en las búsquedas. Los perfiles se anotan como información
estática y se utilizan en el proceso de búsqueda semántica.
• Seguridad y restricción de usuarios (ACL).
• Múltiples formatos de los recursos.
• Permite la comunicación con otras sistemas de bibliotecas digitales.
• Utiliza los últimos resultados de investigación Web Semántica.
Conclusiones (II)
Cumple los principales criterios del Semantic Web Challengue:
• El significado de los datos juega un papel principal así como el procesado
de la información semántica. La diversidad de los metadatos refleja la
sofisticación del algoritmo de búsqueda semántica. Los perfiles se anotan
como información estática y se utilizan en el proceso de búsqueda
• Las fuentes de los recursos son reales. Y se está utilizando en varias
localizaciones como DERI Galway Library [10] y la Universidad Politécnica
de Gdansk (Polonia) [11].
• Es una aplicación de usuario final. Aceptable interfaz de usuario.
• Utiliza varias tecnologías semánticas: RDF, SSCF, SIOC, TTM, MBB.
• Válida para todo tipo de documentos, también Multimedia (Flash).
• Permite formatos distintos para las fuentes y para expresar el resultado de
las consultas.
Referencias
[1] http://www.db.dk/bh/lifeboat_ko/CONCEPTS/knowledge_organization_systems.htm
[2] http://wordnet.princeton.edu/
[3] http://www.marcont.org/ontology/index.html#term_documentation/marcont.html
[4] http://www.foafrealm.org/xfoaf/0.1/index.html
[5] http://tagstreemaps.sourceforge.net/TagsTreeMaps.html
[6] http://www.slideshare.net/skruk/multibeebrowse-accessible-browsing-onunstructured-metadata
[7] http://simile.mit.edu/wiki/Exhibit/Examples
[8] http://www.slideshare.net/skruk/social-semantic-collaborative-filtering
[9] http://sioc-project.org/
[10] http://library.deri.ie/
[11] http://www.wbss.pg.gda.pl/