GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando

Download Report

Transcript GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando

GLOBAL
BIODIVERSITY
INFORMATION
FACILITY
A tecnologia da
Informação e o GBIF
Francisco Pando
Data Digitalization Workshop
Braga, 5 a 7 de Julho, 2006
WWW.GBIF.ORG
Global Biodiversity Information Facility
Sumario

Objetivo y visión de GBIF

Red de datos

Esquemas de datos

Puntos y nombres

Protocolos

Registro de bases de datos

Portales

Estrategias, opciones e implementaciones para compartir
datos
Global Biodiversity Information Facility
Objetivo de GBIF
GBIF se propone hacer accesible por Internet toda la información
disponible sobre los organismos vivos conocidos a nivel mundial
Otra manera de verlo; se propone cambiar la cultura de “mi dato
es mio, mira mis resultados” (en ciencia y en gestión)
“datos de todos para todos”
Global Biodiversity Information Facility
Modelo de datos: redes
centralizadas
Global Biodiversity Information Facility
Red de datos distribuidos
Data Model
Win2000
Brahms
Linux
MySQL
Win98
Access
Win98
biota
Col 3
FreeeBSD
PostgreSQL
Col 4
Col 2
Col 5
Col 1
Communication Protocol
programa
interface
buscar
Figure 4. Diagram showing the complexity of integrating data from biological collections
Global Biodiversity Information Facility
Los elementos de la red
Figure 5. GBIF Network: major classes of nodes
GBIF is responsible for running the network, establishing standards, and developing tools. The portal is the hub for the
development of any service that must be centralized such as the registry of metadata and for serving data from the
biodiversity data index to the end user.
Global Biodiversity Information Facility
Más en detalle
Protocol
Provider
Portal
Registry
Global Biodiversity Information Facility
Tecnologias usadas
• XML data exchange based on Providers, Services and Biodiversity Data
Records
• UDDI registry for technical (access) metadata
• Descriptive metadata retrieved through service interfaces
• Specimen/observation exchange using DiGIR-Darwin Core or BioCASEABCD
• Taxonomic name data from Catalogue of Life (annual checklist for first
release, moving to service-based approach as possible)
• Java (and JSP) components being developed centrally for GBIF Portal
• Current portal development using Tomcat, Xerces, Log4J, MySQL
• Components to be packaged for reuse as appropriate
Global Biodiversity Information Facility
Mapeo de datos
Portal
Profile
Schema
Data Provider System
Data Provider System
DiGIR
Provider
Data Map
Schema
DiGIR
Provider
Data Map
Schema
Data
Data
Global Biodiversity Information Facility
Esquemas datos

Darwin Core
Sencillo (50 elementos)
 La unidad es el registro
 500 bases de datos www.gbif.net


ABCD
Contenido elaborado y detallado (+500
elementos)
 La unidad es el archivo
 170 bases de datos en www.gbif.net

Global Biodiversity Information Facility
La base para el
acceso
unificado:

Perfil común:
Cada base de datos se
traduce a un “perfil
común”, que es una
tabla con una lista
estandarizada de
campos que se pueden
consultar de manara
uniforme

Estándares:



”Darwin Core”
ABCD Schema
www.tdwg.org
Global Biodiversity Information Facility
Darwin Core, desarrollos en curso


Soporte para imágenes
Extensiones
Global Biodiversity Information Facility
Darwin Core, extensiones
Global Biodiversity Information Facility
Integración de nombres y
especímenes
Global Biodiversity Information Facility
Protocolos

DIGIR para Darwin Core

Biocase para ABCD
Global Biodiversity Information Facility
Vida despues de DIGIR

TAPIR

http://www.gbif.org/News/NEWS1129877273
http://ww3.bgbm.org/protocolwiki/
 Unificar protocolos de la red de datos de
GBIF
 Expansión del registro (UDDI), soporte para
redes temáticas, portales nacionales,
extensiones de Darwin core
 Toolkit para portales de datos en desarrollo

Global Biodiversity Information Facility
Registro
A tener en cuenta:
•Un nombre caracteristico
•Una descrición que oriente al usuario
•Condiciones de uso adicionales
•Como citar el uso de este recurso
Global Biodiversity Information Facility
Portales de GBIF
Portal actual (prototipo)
 Portal para nodos
 Nuevo portal (en desarrollo)

Global Biodiversity Information Facility
Portal actual (prototipo)
Search only by scientific or vernacular
names (optional country filter)
Global Biodiversity Information Facility
Portal actual (prototipo)
Countries from which
species is recorded
Data resources with specimens or observations
Occurrence
Detail
Georeferenced
records
Download
Global Biodiversity Information
Facility
records
Portal para Nodos
En desarrollo
 Para que los nodos puedan servir:

Datos de las colecciones de su ámbito (país)
 Datos relevantes para su ámbito

Adaptable a sus necesidades (idioma,
nombres comunes,…)
 Proporcionar una ayuda para que los
nodos puedan servir a sus comunidades

Global Biodiversity Information Facility
Nuevo portal
Estilo www.biologybrowser.com
 Web services
 API interfaz
 Servicios añadidos de indexado y
validación

Global Biodiversity Information Facility
Clients
Portal
architecture
(new version
D. Hobern)
Mirrored access
Web applications
Synchronised data
stores
Data despatcher
Interpretation and
validation
Resource crawler
Torres & Pando 2nd ENBI Forums
2005
23
Data resources
¿Más o menos claro?
Protocol
Provider
Portal
Registry
Global Biodiversity Information Facility
Estandares para la integración de
datos y la iinteroperabilidad
http://www.tdwg.org/standrds.html
Global Biodiversity Information Facility

”Turn-key package”

Basado en PHP y
código del proyecto
DiGIR
Para Linux y Windows



Apoyo técnico:
[email protected]
Registro con el UDDI
del GBIF
Global Biodiversity Information Facility
De las bases de datos al acceso via
Internet

¿De quien son esos datos?

¿Todo, todo?

¿Como de limpio?

¿Como?
Global Biodiversity Information Facility
¿De quien son esos datos?
Global Biodiversity Information Facility
¿Todo, todo?

El proveedor de los datos retiene el
control sobre lo que hace accesible:
Hace pruebas
 Decide diluir la precisión de registros de
especies amenazadas o de datos de interés
económico
 No hace pública los datos de investigaciones
en curso

Global Biodiversity Information Facility
¿Como de limpio?

La perfección no existe

El dato malo tampoco; un dato no es bueno o
malo intrínsicamente, sino que su bondad
depende del uso

Hacer los datos públicos ayuda a su
mejoramiento

Hay herramientas para mejorar los datos y
GBIF estatrabajando en esto:
http://www.secretariat.gbif.net/datatester/index.jsp
http://www.gbif.org/prog/digit/data_quality
Global Biodiversity Information Facility
¿Como?
GBIF
Registry
Participant
Portal A
GBIF
Index
GBIF
Portal
Participant
Portal B
Participant
Portal C
Data
Warehouse
Distribuído
Data
Warehouse
Centralizado
Global Biodiversity Information Facility
A vuestra disposición:
Francisco Pando
Nodes Liaison Officer
GBIF Secretariat
Universitetsparken 15
2100 Kobenhavn, Dinamarca
[email protected]
Tél.: + 45 35 32 1470
Fax: + 45 35 32 1480
Global Biodiversity Information Facility