Abrir - Universidad Nacional de Córdoba

Download Report

Transcript Abrir - Universidad Nacional de Córdoba

UNIVERSIDAD NACIONAL DE CÓRDOBA
CONSEJO DE DIRECTORES DE BIBLIOTECAS
Curso Taller
Metadatos para documentos digitales
FAUD – UNC
13 de agosto de 2013
©2013/SMM
QUÉ SON LOS METADATOS? (1)
Datos
sobre datos
Conjunto
de elementos que pueden ser usados
para describir y representar objetos de
información
Término
usado en Internet para la información
que los bibliotecarios tradicionalmente habían
puesto en los catálogos y más comúnmente se
refiere a información descriptiva sobre recursos
de la web
QUÉ SON LOS METADATOS? (2)

Datos que describen los atributos de un
recurso de información y apoyan su
localización, identificación evaluación y
selección, entre otras funciones, las cuales
pueden ser llevadas a cabo por el usuario
final o por sus agentes (otras personas o
sistemas automatizados) (Dempsey y Heery)
QUÉ SON LOS METADATOS? (3)
Datos
asociados con objetos de información los
cuales le evitan a sus usuarios potenciales el tener un
conocimiento previo de su existencia o sus
características (Dempsey y Heery)
Datos
con sentido propio que proporcionan
información, documentación, a cerca de otros datos
manejados dentro de una aplicación o ambiente...
Los metadatos pueden incluir información descriptiva
a cerca del contexto, calidad y condiciones o
características de los datos. (Taylor, A:)
CARACTERÍSTICAS

Un registro de metadatos consiste en un
conjunto de atributos o elementos necesarios
para describir una fuente en cuestión.

Un sistema común entre los bibliotecarios es
el catálogo, que es un conjunto de registros
de metadatos con elementos que describen
un libro u otra publicación.

La relación entre un registro de metadatos y el
recurso al que describe puede darse de la
siguientes formas:
1.
Los elementos pueden estar en un registro
separado del documento (como en los
catálogos)
2.
Los metadatos pueden estar incluidos en el
propio recurso (CEP o cabecera TEI de un
texto electrónico)
PRINCIPALES CUESTIONAMIENTOS


Existe un término medio entre ambas posibilidades?



Se puede afrontar una catalogación completa?
Se puede aplicar los estándares de catalogación
actual a documentos electrónicos?
Todos los recursos electrónicos merecer ser
catalogados?
Cómo se pueden preservar los recursos electrónicos
una vez catalogados?
FUNCIONES DE LOS METADATOS
Los metadatos tienen tres funciones básicas

Proporcionar una descripción de una entidad de
información junto con otra información necesaria
para su manejo y preservación
Proporcionar
los puntos de acceso a esa
descripción
Codificar
esa descripción
DIVERSIDAD DE METADATOS
Existe una gran diversidad de metadatos debido a:

La existencia de diferentes tipos de usuarios
Usuarios
que requieren términos propios y específicos para el
acceso a los documentos
Investigadores que requieren amplia información de un
recurso
La existencia de diferentes tipos de recursos

Recursos de existencia fugaz
Recursos
con un valor comercial
Recursos de gran valor a la investigación

La existencia de diferentes proveedores de información
Servicios
de información comercial
Servicios de información académica y para investigación
ESTÁNDARES DE METADATOS
El estándar de metadatos ideal es aquel que:
Sea fácil de crear y mantener
 Utilice una semántica que pueda entenderse en forma común
 Pueda crearse en forma automática
 Pueda describir la forma, el contenido y la localización de la
información
 Su estructura permita contenerlos en otros objetos
 Se pueda usar para construir múltiples índices
 Pueda inter operar en los sistemas de indizado que existen
 Pueda ampliarse según necesidades

ALGUNOS PROYECTOS DE METADATOS
 DC
Dublin Core
 RDF
Resource Description Framwork
 TEI
Text Encoding Initiative
 URC
Uniform Resource Characteristic Citattion
MAS PROYECTOS DE METADATOS
 MATC
DTD
Machine Readable Cataloguing
Document type Definition
 GILS
Govermente Information
Locator Service
 EAD
Encode Archive Description
 DOI
Digital Objetct Identifier
DUBLIN CORE METADATA INITIATIVE
 El
Núcleo de Dublin o también conocido como
“DUBLIN CORE” fue concebido en OCLC (de allí su
nombre), por Stuart Weibel, en 1994. Es el sistema
de metadatos más desarrollado y uno de los más
aceptados.
 Consiste
en 15 elementos descriptivos que son
etiquetados, veamos cuales son estos 15 elementos
y como se relacionan con los estándares de
catalogación:
PRINCIPALES CARACTERÍSTICAS

Sistema diseñado para la descripción de recursos
electrónicos así como para su localización y recuperación

Su flexibilidad permite que estos elementos puedan ser
modificados y ampliados
 Su
diseño es intuitivo, por lo cual permite que los
creadores puedan codificar por si mismos sus documentos
en el momento de generarlos
CONFORMADO POR 15 ELEMENTOS FIJOS
1.
2.
3.
4.
5.
6.
7.
8.
TÍTULO
AUTOR O CREADOR
MATERIAS O
PALABRAS CLAVE
DESCRIPCIÓN
EDITOR
OTRO
COLABORADOR
FECHA
TIPO DE MATERIAL
9.
10.
11.
12.
13.
14.
15.
FORMATO
IDENTIFICADOR
DE
MATERIAL
FUENTE
IDIOMA
RELACIÓN
COBERTURA
MANEJO DE
DERECHOS
1.TÍTULO
Etiqueta: DC. TITLE

Es nombre que se le da al material
generalmente otorgado por el creador o
editor.

(Título propiamente dicho como lo definen las
RCA 2. Campo 245 de MARC)
2. AUTOR O CREADOR
Etiqueta: DC. CREATOR

Persona o institución responsable de la creación
del contenido intelectual del documento. Estos
pueden ser autores, artistas, fotógrafos o
ilustradores.

(Casi la misma definición que las RCA 2, pero sin
el contenido artístico. Campos 1XX de MARC)
3. MATERIAS Y PALABRAS
CLAVE
Etiqueta: DC. SUBJECT

El tema del material. Son expresadas a través
de palabras clave o frases que describan el
tema o contenido del documento. Se hace
sobre la base de vocabularios controlados y
sistemas de clasificación.

(Materias establecidas por listas de
encabezamiento de materias/tesauros. Campo
6XX de MARC
4. DESCRIPCIÓN
Etiqueta: DC. DESCRIPTION

Descripción textual del contenido del
documento, incluyendo resúmenes en el
caso de documentos como objetos o
descripciones de contenido en el caso de
documentos visuales.

(Notas de contenido resumen como se
definen en las RCA 2. Campos 505 o 520 de
MARC)
5. EDITOR
Etiqueta: DC. PUBLISHER

La entidad responsable de que el material esté
disponible en su formato actual, puede ser una
casa editora, una universidad o una entidad
corporativa.

(Editor como se define en las RCA 2.
Subcampo 260 $b de MARC)
6. OTRO COLABORADOR
Etiqueta: DC. CONTRIBUTOR

Persona u organización no especificada en el
elemento
CREADOR
que
haya
hecho
contribuciones significativas al material pero cuyo
aporte es secundario. Pueden ser editor
adaptador o ilustrador.

(Asientos secundarios como se definen en las
RCA 2. Campos 7XX de MARC)
7. FECHA
Etiqueta: DC.DATE
 Es
una fecha asociada con la creación o
disponibilidad del material. Tal fecha no debe
confundirse con el elemento COBERTURA
 (Fecha
de publicación en
Subcampo 260 $C DE MARC)
las
RCA
2.
8. TIPO DE MATERIAL
Etiqueta: DC. TYPE

Indica la clase de material, que puede ser
“homepage”, novela, poema, documento de
trabajo, reporte técnico, diccionario

(Asimilable a la naturaleza del ítem en RCA 2.
Campos de longitud fija de MARC, etiqueta 008,
posición 27)
9. FORMATO
Etiqueta: DC.FORMAT
 Los
datos del formato del material empleados
para identificar el programa y el equipo a usar
para poder desplegar el material.
 (En
las RCA 2 podría ser la nota correspondiente
de requerimiento, área 7.5 de ISBD(ER). Campo
516 de MARC)
10. IDENTIFICADOR DE
MATERIAL
Etiqueta: DC. IDENTIFIER

Cadena de signos o números empleados para
identificar el material de manera unívoca.
Comprende los URLs y los URNs. Otras opciones
pueden ser los números ISBN o cualquier otro
elemento que sirva para su identificación.

(Como se define en las RCA 2 y las ISBD(ER)
4.5.2 y área 8. Campos 02X de MARC)
11. FUENTE
Etiqueta: DC. SOURCE

Información a cerca de cualquier
material
secundario del cual se deriva el material
principal.

(Como se define en las RCA 2. Campos 76X 78X de MARC)
12. IDIOMA
Etiqueta: DC. LANGUAGE

El idioma del contenido intelectual del material
 (Campos
de longitud fija de MARC, etiqueta
008, posición 35-37)
13. RELACIÓN
Etiqueta: DC. RELATION

Una identificación de material secundario y su
relación con el material principal. Permite
vínculos por ejemplo pueden citarse “Versión
de“, “ Basado en”, “ Parte de”, “Formato de”.
 (Como
se define en las RCA 2. Campos 76X-78X
de MARC
14.COBERTURA
Etiqueta: DC. COVERAGE
Características especiales (región física) o
temporales (Longitud, latitud) del contenido
intelectual del material o nombres de lugares.
(Campos
de longitud fija de MARC, etiqueta
008, posiciones 033-043)
15. MANEJO DE DERECHOS
Etiqueta: DC. RIGHTS
 Una mención a cerca de cómo manejar los
derechos, o un identificador que vincula una
declaración acerca del manejo de los
derechos, etc.
 (Campos
506 y 561 de MARC)
CALIFICADORES

Hay dos grandes categorías de calificadores

REFINACIÓN DE ELEMENTOS: Estos calificadores
hacen que el significado de un elemento sea más
estrecho o específico. Un elemento refinado comparte el
significado del elemento no calificado, pero con un
alcance más restrictivo.

ESQUEMA DE CODIFICACIÓN: Estos calificadores
identifican esquemas que ayudan en la interpretación del
valor de un elemento. Estos esquemas incluyen
vocabularios controlados y notaciones formales
Título
Calificadores que refinan al título
 Alternativo
(Alternative)
Materia
Esquemas de codificación para Materia

LCSH
Etiqueta: LCSH

MESH
Etiqueta: MESH

DDC
Etiqueta: DDC

LCC
Etiqueta: LCC

UCD
Etiqueta: UCD
Descripción

Calificadores que refinan Descripción

Tabla de Contenidos (Table Of Contents)
Resumen
(Abstract)
Fecha
Calificadores que refinan Fecha
 Creado
(Created)
 Válido (Valid)
 Disponible (Available)
 Aparición/Publicación (Issued)
 Modificado (Modified
 Fecha aceptación (Data Accepted)
 Fecha de Copyright (Data
Copyrighted)
 Fecha de envío (Data Submited)

Esquema de Codificación

DCMI Period
W·C-DTF

Tipo
Esquema de codificación

DCMI Type Vocabulary
Tipo de recurso
Esquemas de codificación para Tipo de recurso

DCMI Type Vocabulary
Nombre: DCMI Type Vocabulary
Etiqueta: Tipo DCMI
Definición: Una lista de tipos para categorizar la
naturaleza o el género del contenido del recurso.
Formato
Calificadores que refinan Formato
 Extensión
(Extent)
 Medio (Medium)
Esquema de codificación
 IMT
Identificador
Calificadores que refinan Identificador
Cita Bibliográfica
Esquema de codificación
 URI
Fuente
Esquema de codificación
URI
Idioma
Esquema de codificación
 ISO
639-2
 RFO 3066
Relación

Calificadores que refinan Relación
Versión
Requiere
Es parte de

Esquema de codificación

URI
Cobertura
Calificadores de
refinamiento para
Cobertura


Espacial
Temporal
Esquema de
codificación
DCMI Point
ISO 3166
DCMI Box
TGN
DCMI Period
W3C DTF
Derechos
Calificadores de refinamiento para Cobertura
Derechos de acceso
 Licencia

Esquema de codificación

URI
Etiquetas agregados a DC Calificado

Audiencia (Audience)

Procedencia (Provenance)

Administrador de derechos (Rights Holder
PARA MÁS INFORMACIÓN
http://es.dublincore.org/
Muchas gracias!!