Introducción a SDMX

Download Report

Transcript Introducción a SDMX

Seminario para contribuir a la modernización de la transmisión
de datos y metadatos estadísticos en la región de América Latina
y el Caribe
A – Introducción
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
A.2 – Por qué SDMX – importancia de SDMX
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
2
Statistical Data and Metadata eXchange
SDMX
ISO TS 17369
UNSD
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
World Bank
3
¿Por qué SDMX?
Falta de estandarización en intercambios de datos o entre organizaciones
Diferentes formatos de
Diferentes lugares para almacenar datos y metadatos
Datos y metadatos
EDIFACT
XML
Diferentes medios
Formato
papel
Correo electrónico
Formato Web
Teléfono
Ficheros Estructurados
Medios extraíbles Subida de ficheros Papel
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
4
Qué es SDMX
 Un modelo para describir datos y metadatos estadísticos
 Un estándar para la comunicación automática de máquina a
máquina
 Una tecnología que soporta herramientas de TI estandarizadas.
Con el fin de sacar partido a lo siguiente:
 Los estadísticos coinciden en el uso de una descripción común
de datos y metadatos
 El proceso de intercambio de datos es manejado por la
descripción común
 Las descripciones de datos se ponen a disposición de todo el que
quiera entender y reutilizar los datos
Esto es lo que SDMX proporciona y habilita
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
5
¿De la versión 1.0 a la versión 2.1 hasta…?
Versión 1.0
GESMES/TS
ISO/TS 17369
Versión 2.0
SDMX-EDI
SDMX-ML
Registro SDMX
Versión
1.0
Septiembre 2004
Versión
2.0
Noviembre 2005
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
En 2008
SDMX se acepta a
nivel de Naciones
Unidas
Se reconoce y
soporta SDMX como
estándar preferido
Febrero 2008
SDMX
2.1
Abril 2011
6
Todos los buenos estándares cambian…
 Todos los estándares cambian con el tiempo, y se
lanzan como una serie de versiones
 Los cambios siempre tienen cierto impacto en los
usuarios
– No siempre se espera que los usuarios usen la última
versión de un estándar
– Las organizaciones estándar (como SDMX) tienen que
proporcionar soporte para varias versiones del estándar,
todas las que estén en uso
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
7
Cambio en la gestión
 Peligro (1): demasiados cambios pueden disuadir
su adopción
 Peligro (2): el no dar a los usuarios las
funcionalidades que quieren desalentará su
adopción
Se necesita encontrar un equilibrio
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
8
Algunos beneficios de los estándares SDMX
 SDMX proporciona soporte para cosas que son esenciales para
los estadísticos, pero que a menudo les resultan difíciles de
lograr
 Un estándar internacional para agrupar todos los elementos
involucrados en el proceso estadístico dentro de un modelo de
información claro
 Un enfoque que maximiza la cantidad de información sobre el
contexto estadístico que se puede entregar a los usuarios, y la
capacidad de enlazar estadísticas entre fuentes similares o
diferentes
 La automatización de procesos: SDMX permite el desarrollo de
herramientas comunes que pueden usarse por todas las
organizaciones estadísticas para mejorar sus actividades
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
9
Beneficios de los estándares SDMX (2)
Organización Estadística
SDMX es también un estándar avanzado
para el descubrimiento de datos con el uso
de servicios basados en web
Los servicios web permiten la consulta,
visualización y carga automática de datos y
metadatos. Las herramientas SDMX
permiten consultar una base de datos, o un
sistema de ficheros, para la creación de
tablas, cuadros, y gráficos a partir de los
resultados de la consulta
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
“SDMX
Reference
Infrastructure”
Organización Estadística
“SDMX
Reference
Infrastructure”
10
Producción / procesamiento de datos: lo que SDMX puede
mejorar
 Estándar internacional:
- Evita la duplicación de esfuerzos en el desarrollo y mantenimiento
de herramientas de TI
- Crea un fondo común de habilidades y recursos (comunidad de
desarrolladores)
 Estandariza la estructura de conjuntos de datos y el formato
de transmisión
- Se reemplazan formatos heterogéneos por uno estándar
- Las nuevas recopilaciones de datos comienzan con una estructura
estandarizada
 Validación de datos
- SDMX permite detectar las inconsistencias de una estructura de
datos en un estadio temprano del procesamiento
 Aumento de la eficiencia
- Más tiempo para el análisis de datos y comprobaciones de la
calidad de datos
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
11
Por qué SDMX - Resumen
 El intercambio y difusión de datos estadísticos es complejo,
caro, y consume recursos intensamente
 Los mismos datos se almacenan en múltiples ubicaciones
 Los datos y metadatos a menudo no son reutilizables durante
la recopilación, compilación, análisis, transmisión, difusión
 Varias organizaciones internacionales tienen estándares
técnicos en propiedad para el intercambio de datos con sus
constituyentes
 Los estándares combinan problemas específicos de
“contenido” con soluciones técnicas
 Los estándares múltiples provocan una carga adicional de
informes
 Transición de una transmisión punto a punto a una red
mundial (XML, servicios web)
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
12
A.3 – Implementación del sistema de intercambio
de datos
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
13
A.4 – Elementos básicos SDMX
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
14
Los componentes SDMX
Especificaciones Técnicas
El Modelo de Información
SDMX
Guías para la
armonización de
contenido
Guías orientadas al
contenido (COG)
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
Herramientas
Arquitecturas de TI para el
intercambio de datos
Herramientas basadas en
SDMX
15
Descripción del intercambio de datos
¿Quién?
¿Cuándo?
¿Cómo?
¿Qué?
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
¿Quién?
¿Dónde?
¿Qué?
16
Modelo de Información SDMX (“metamodelo”)
Proporciona una forma de modelar datos, metadatos y procesos de
intercambio
Definición de Estructura de Datos (DSD)
Dimensiones
(ej: país,
variable/tema, año)
Estructura de
Listas de códigos
Conjunto de
Datos
Metadatos
Estructurales
Atributos
(ej: unidad de
medida)
Identifican/Describen
Datos
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
Metadatos sobre un valor
individual, una serie
temporal o un grupo de
series temporales
17
Guías orientadas al contenido
Listas de códigos y conceptos de dominio transversales
Dominios de temas estadísticos
Vocabulario común de metadatos
Recomendaciones para armonizar
las implementaciones
Organización 1
Organización 2
interoperabilidad
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
Organización 3
interoperabilidad
18
Listas de código y conceptos de dominio
transversal
Conjunto de
conceptos
usados
Dominio 1
Conceptos
de dominio
transversal
FREC
REF. AREA
COMPARABILIDAD
Dominio 2
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
19
Vocabulario común de metadatos
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
20
Dominios de temas estadísticos
Basados en la Clasificación de Actividades Estadísticas Internacionales de la
Comisión Económica de las Naciones Unidas para Europa (UNECE)
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
21
Uso de conceptos de dominio transversal
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
22
Definición de Estructura de Datos: uso de concepto
País
(Dimensión)
Existencias/Flujo
(Dimensión)
Unidad Múltiplo
(Atributo)
Unidad
(Atributo)
Tiempo/Frecuencia
(Dimensión)
Tema
(Dimensión)
(Dimensión)
Observación
(Medida)
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
23
Definición de Estructura de Datos:
definición de estructuras multidimensionales
 Comprende
–Dimensión
Concepts que identifica al valor de observación
–es
Concepts que añaden metadatos adicionales sobre el
Atributos
valor de observación
–Medida
Concept que es el valor de observación
– Cualquiera de estos pueden ser:
• codificados
• texto
• fecha/tiempo Representación
• número
• etc.
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
24
SDMX describe el intercambio de datos y metadatos
A finales de junio
Acuerdo de provisión
Esquema de organización
mantenedor
Registro
SDMX
Esquemas de conceptos
Listas de códigos
DSD
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
Conceptos
25
Arquitectura del repositorio de datos
(Almacén de datos)
registro
consulta
NSI
P
U
L
L
Demandante
“Pull” de
Eurostat
Datos recibidos
en
SDMX-ML
Cargador
Eurobase
Difusión
eDAMIS
P
U
S
H
Registro SDMX
Entrada de Datos
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
Verificación /
Conversión
a SDMX
Almacén
intermedio
XSL para
SDMX-ML
Reservas
en almacén
26
Los componentes
SDMX
Data
warehouse
Data
warehouse
Data
warehouse
SDMX-RI
messages
(web service)
SDMX-RI
Data Hub
(web service)
SDMX-RI
(web service)
Data Providing Organizations
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
Data collector Organizations
Users
27
Progreso del SDMX, 2011 hasta 2015
 Desarrollo de estándares: Abril 2011, estándares técnicos
SDMX 2.1 lanzados en sdmx.org
 Difusión: Mayo 2011, SDMX Global Conference
Se pueden obtener ocho tutoriales de e-learning de la
plataforma CIRCA
 Gobernabilidad: Creación de dos Grupos de Trabajo SDMX
Working Groups (Grupo de Trabajo Técnico y Grupo de
Trabajo Estadístico)
 Plan de Acción 2011 hasta 2015
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
28
Cómo
saber más
acerca de
SDMX
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
29
http://sdmx.org/
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
30
http://epp.eurostat.ec.europa.eu/portal/page/portal/pgp_ess/news/ess_news_detail?id=112774074&pg_id=2417&cc=ESTAT_EUROSTAT
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
31
https://webgate.ec.europa.eu/fpfis/mwikis/sdmx
Cursos de formación sobre SDMX
 SDMX elemental (para estadísticos y personal de TI)
Tiene lugar en Eurostat. Dirigido a personas responsables de la
gestión y difusión de datos y metadatos basados en SDMX.
 Curso avanzado sobre SDMX (para desarrolladores de TI)
Tiene lugar en Eurostat. Dirigido a desarrolladores de TI y
propuesto en dos versiones:
programadores JAVA
programadores .NET
 Curso ESTP sobre “Tecnologías avanzadas para la
recopilación y difusión de datos”
Externo
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
33
Para más información
http://www.sdmx.org (Página web de SDMX)
https://webgate.ec.europa.eu/fpfis/mwikis/sdmx (Espacio de
información de Eurostat)
[email protected] (Información general sobre SDMX)
[email protected] (Proyectos de implementación de
Eurostat)
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
34
A.5 – Herramientas SDMX
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
35
Software de código abierto para SDMX
Convertidor SDMX
Convierte ficheros de datos de formatos SDMX a
otros formatos de ficheros
Registro SDMX
Un repositorio central para almacenar y compartir
artefactos SDMX
Asistente de Estructura de
Datos(DSW)
Usado para crear, editar y probar artefactos
SDMX
Infraestructura de Referencia (SDMXRI)
Un conjunto de herramientas que permite
conectar sus sistemas TI al mundo SDMX
Asistente de Mapeo
Generador XSD
Mapeo y transcodificación de los contenidos de
una base de datos existente a estructuras de
datos SDMX
Genera un esquema de definición XML estándar
para una DSD SDMX dada
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
36
Convertidor SDMX
 Convierte desde todos los formatos existentes de la versión
2.0 estándar de SDMX (genérica, compacta, de utilidad y
transversal) así como de GESMES (SDMX-EDI 2.0) FLR y
formatos CSV.
 La interacción con el Convertidor es posible mediante el uso
de una Interfaz Gráfica de Usuario (GUI), intefaz de línea de
comandos (CLI) y vía su API de programación.
 La interfaz de Servicio Web ofrece la posibilidad de exponer
las funcionalidades del Convertidor en la Web. Los clientes
pueden hacer una llamada al servidor de la aplicación donde
el servicio del Convertidor se encuentre desplegado.
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
37
Registro SDMX
 Registro de metadatos que implementa al registro de
especificaciones SDMX
 El Registro SDMX tiene como tarea el proporcionar una
estructura, organización, y mantenimiento e interfeaces de
consulta para la mayoría de componentes SDMX necesarios
para el soporte de la visión de los datos a compartir
 Proporciona una interfaz de usuario basada en web así como
servicios web para interactuar con los objetos de metadatos
estructurales SDMX en uso dentro de Eurostat y con socios
estadísticos.
 El registro sólo se preocupa de proporcionar la información
necesaria para acceder a los conjuntos de datos y metadatos de
referencia
 Una aplicación que quisiera un conjunto de datos o metadatos
concreto consultaría entonces al registro acerca de la URL, y
entonces iría y obtendría el conjunto de datos o metadatos
directamente del servidor web del proveedor.
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
38
Asistente de Estructura de Datos DSW
 Una aplicación individual de Java que soporta la versión 2 del
estándar SDMX.
 Puede usarse tanto offline como online, dependiendo de la
elección del usuario y sus derechos de acceso.
 Permite el mantenimiento de los siguientes artefactos SDMX
v2.0: Definiciones de Estructuras Datos, Listas de Códigos,
Esquemas de Concepto, Flujos de Datos, Listas de Códigos
Jerarquizadas, Esquemas de Categoría y Esquemas de
Organización.
 Posibilidad de crear dinámicamente una plantilla para una
DSD especificada en formato SDMX v2.0.
 Proporciona un mecanismo para importar/exportar
definiciones DSD SDMX-ML v2.0 y un mecanismo para
importar/exportar definiciones DSD desde/a ficheros de
estructura GESMES/TS
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
39
Infraestructura de Referencia SDMX (SDMX-RI)
 Una infraestructura generalizada de servicios que puede
reutilizarse parcial o completamente por una organización
interesada en empezar proyectos SDMX para el intercambio
de datos.
 Estos son los modelos más comunes de Infraestructura de
Referencia SDMX:
– Parseador de Consultas SDMX
– Recuperador de Datos
– Recuperador de Estructuras
– Generador de Datos SDMX
– Asistente de Mapeo
 Dos componentes web:
– Cliente Web
– Proveedor de Servicios Web
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
40
Asistente de Mapeo
 Facilita el mapeo entre los metadatos estructurales
proporcionados por una Definición de Estructura de Datos
SDMX-ML (DSD) y aquellos que residen en una base de
datos de un entorno de difusión.
 Mantiene un Almacén de Mapeo para guardar los mapeos
entre SDMX y el esquema de almacenaje de datos locales
 En la Infraestructura de Referencia SDMX, proporciona
información de mapeo para el Recuperador de Datos.
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
41
Generador XSD
 Produce Definiciones XML de Esquemas (XSD) basadas en
una DSD recibida
 Produce esquemas XSD para formatos Compactos,
Transversales o de Utilidad para el estándar SDMX v2.0, y
pueden usarse:
–
–
–
–
Como un bloque de construcción reutilizable, a través de su API.
A través de una Interfaz Gráfica de Usuario (GUI) individual
A través de una Interfaz de Línea de Comandos (CLI)
A través de una GUI Web
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
42
Relaciones entre Herramientas – Ejemplo
Produce
DSW
Almacena
DSD
Registro
SDMX
DSD
usa
Convertidor
Produce
Produce
Conjunto
de Datos
SDMX
usa
SDMX-RI
usa
Asistente de
Mapeo
Produce
Mapeo
Fichero
CSV
Base de
Datos
Nacional
Eurostat Unit A6 – Statistical cooperation
SDMX Seminar
43