MI2006-0.3.ppt

Download Report

Transcript MI2006-0.3.ppt

Universidade
do Minho
Universidade do Minho
Mestrado em Informática
Preservação Digital
conceitos, estratégias e
actuais consensos
Miguel Ferreira
[email protected]
2006-05-05
Contextualização
Mestrado em Informática
Universidade do Minho
Universidade
do Minho
2
• Vivemos na era digital
– Grande parte da actual produção
intelectual é criada em formatos digitais
– Facilidades na sua criação e disseminação
– Qualidade dos resultados obtidos
• Rápida obsolescência da
tecnologia
– Embora um objecto digital possa ser
copiado inúmeras vezes sem perder
qualidade
– Depende de um contexto tecnológico para
que possa ser interpretado
– Os objectos acabam prisioneiros dos seus
próprios suportes e/ou formatos
Preservação Digital
Mestrado em Informática
Universidade do Minho
Universidade
do Minho
3
Conjunto de actividades ou
processos responsáveis por garantir o
acesso continuado a longo-prazo à
informação e restante património
cultural existente em formatos digitais
Webb, C., Bradley, K., Campbell, D., Clifton, G., Corbould, M., O’Connor, M., Phillips, M. and
Whiting, J. Guidelines for the Preservation of Digital Heritage, Information Society Division - United
Nations Educational, Scientific and Cultural Organization, 2003.
Longo-prazo
Mestrado em Informática
Universidade do Minho
Universidade
do Minho
4
Período de tempo suficientemente longo para
que haja preocupação com o impacto da
evolução da tecnologia (incluindo o
aparecimento de novos suportes e/ou
formatos de dados), assim como, com
alterações ao nível dos requisitos/exigências
impostos pela comunidade de consumidores
da informação preservada.
Consultative Committee for Space Data Systems Reference Model for an Open Archival
Information System (OAIS) - Blue Book. National Aeronautics and Space Administration,
Washington, January 2002.
Objecto, Material ou Recurso Digital
Mestrado em Informática
Universidade do Minho
Universidade
do Minho
Tudo que possa ser representado em
formato digital, quer tenha nascido
digital, quer tenha sido convertido a
partir de formatos analógicos
• e.g. databases, spreadsheets, word processor documents,
webpages, video, audio, images, maps, 2 and 3D models,
computer software, etc…
Thibodeau, K., Overview of Thechnological Approaches to Digital Preservation and Challenges in Coming
Years. in The State of Digital Preservation: An International Perspective, (Washington D.C., July 2002),
Documentation Abstracts, Inc. - Institutes for Information Science.
5
Analógico versos Digital
Mestrado em Informática
Universidade do Minho
Universidade
do Minho
6
Analógico versus Digital
Mestrado em Informática
Universidade do Minho
Universidade
do Minho
7
A anatomia dum Objecto Digital
Mestrado em Informática
Universidade do Minho
Universidade
do Minho
8
• Nível Conceptual
– Aquilo com que lidamos no mundo
real; o que reconhecemos como uma
unidade significativa de informação
– e.g., jornal, livro, mapa, fotografia
Objecto Conceptual
• Nível Lógico
– Codificação da informação
– Tarefa realizada pelo software
– Trata-se do formato do objecto
• Nível Físico
– Sinais inscritos em suporte físico
– e.g. disco rígido, CD, Pen-drive
Objecto Lógico
Objecto Físico
Thibodeau, K., Overview of Thechnological Approaches to Digital Preservation and Challenges in Coming Years. in The State of Digital Preservation:
An International Perspective, (Washington D.C., July 2002), Documentation Abstracts, Inc. - Institutes for Information Science.
A anatomia dum Objecto Digital
Mestrado em Informática
Universidade do Minho
Universidade
do Minho
9
Objecto Conceptual
Objecto Lógico
Objecto Físico
Tese de Doutoramento
Word
PDF
CD, DVD, Disco Rígido, Tape, memória Flash,
etc.
Se um dos níveis se tornar obsoleto o objecto conceptual
deixa de estar acessível
Thibodeau, K., Overview of Thechnological Approaches to Digital Preservation and Challenges in Coming Years. in The State of
Digital Preservation: An International Perspective, (Washington D.C., July 2002), Documentation Abstracts, Inc. - Institutes for
Information Science.
10
Universidade do Minho
Mestrado em Informática
Universidade
do Minho
Estratégias de
Preservação
Estratégias de Preservação
Universidade
do Minho
11
Universidade do Minho
Mestrado em Informática
• Foco no objecto físico/lógico
– Preocupação em preservar a informação nos
seus formatos lógicos e/ou físicos originais
– Utilização da tecnologia originalmente associada
a estes objectos para garantir o acesso aos
mesmos
– Preservação de tecnologia
• Foco no objecto conceptual
– Preocupação em preservar as características
essenciais dos objectos digitais de uma forma
independente do hardware e do software
– Preservação de objectos conceptuais
12
Universidade do Minho
Mestrado em Informática
Universidade
do Minho
Preservação de
tecnologia
(físico/lógico)
Refrescamento
13
Universidade do Minho
Mestrado em Informática
Universidade
do Minho
Transferência de informação de um
suporte físico de armazenamento para
outro mais estável antes que o primeiro
se deteriore ou se torne
irremediavelmente obsoleto
Preservação de tecnologia
14
Universidade do Minho
Mestrado em Informática
Universidade
do Minho
• Museus de hardware
– Preservação do contexto de
criação/interpretação original em museus
de hardware e software obsoleto
• Demasiado dispendioso
• Dificuldade em mater o hardware operacional a
longo-prazo
• Restrições elevadas no acesso à informação
• Dificuldade na reutilização da informação
• Digital tablet
– Um computador portátil com um ecrã
sensível ao tacto especializado na
interpretação de determinados tipos de
material
– Possui as mesmas desvantagens da
preservação de hardware
Emulação
15
Universidade do Minho
Mestrado em Informática
Universidade
do Minho
Software capaz de reproduzir o
comportamento de uma plataforma de
hardware e/ou software
• Vantagens
– Recriação do contexto tecnológico original
– Preservação do look & feel do objecto
• Desvantagens
–
–
–
–
–
Os próprios emuladores estão sujeitos a obsolescência
Os utilizadores são obrigados a operar sistemas obsoletos
A construção de emuladores é um processo complexo
Problemas de direitos de autor
Preservar um sistema operativo inteiro apenas para
visualizar um documento parece uma tarefa
exageradamente pesada
– Não garante a reutilização da informação.
Encapsulamento
16
Universidade do Minho
Mestrado em Informática
Universidade
do Minho
Preservação do bit stream original
juntamente com metainformação
capaz de garantir a sua futura
interpretação
• Vantagens
– Permite adiar as responsabilidades de preservação
– Orientado a objectos que apenas serão acedidos
num futuro longínquo
– Desenvolvimento de visualizadores, migradores ou
emuladores apenas no futuro
• Desvantagens
– Objectos complexos possuem especificações
complexas
– Uma especificação incompleta poderá ter um
efeito desastroso
Universal Virtual Computer
17
Universidade do Minho
Mestrado em Informática
Universidade
do Minho
• Variante da Emulação e Encapsulamento
• Preservação do bit stream original + parser
compilado para uma máquina virtual (e.g.
Java)
• A máquina virtual será facilmente reproduzida
no futuro
• Simplifica o processo de emulação
• Está limitada a um conjunto finito de
operações
• Necessita de software de visualização
• Estratégia ainda em estudo (interpretação
muito lenta)
Raymond Lorie, IBM
18
Universidade do Minho
Mestrado em Informática
Universidade
do Minho
Preservação do objecto
conceptual
Migração
19
Universidade do Minho
Mestrado em Informática
Universidade
do Minho
• Descrição
– Transferência periódica de material digital de uma
configuração de hardware/software para outra mais
actual
– Concentra-se na preservação das características
essenciais do objecto sem se preocupar em manter o bit
stream original
• Vantagens
– Disseminação dos materiais em formatos actualizados que
os consumidores reconhecem
– Sem necessidade de preservar o software original
– A estratégia mais aplicada e a única que funcionou até
ao momento
• Desvantagens
– Possível perda de informação durante a conversão
– Necessidade de diligência continua
– Dispendiosa a longo-prazo
Migração (variantes)
Universidade
do Minho
20
Universidade do Minho
Mestrado em Informática
• Print-out
– Transferir o objecto digital para um meio analógico
mais persistente (e.g. imprimir em papel)
• Actualização de versões
– Actualização dos formatos utilizando software retrocompatível
– e.g. utilização do Word 6 para actualizar um
documento criado com o Word 5
• Migração entre formatos
– Conversão para formatos rivais
• Normalização
– Migração para um número mais reduzido de
formatos normalizados
Migration on Request
21
Universidade do Minho
Mestrado em Informática
Universidade
do Minho
• Variante da migração com o objecto de fazer diminuir
a perda de informação
• Preservação do bit stream original
• Manutenção de uma ferramenta capaz de converter o
bit stream original para formatos actuais
Migração distribuída
22
Universidade do Minho
t1
<.9, .8, .95, .1>
t2
t3
<.9, .8, .6, .1>
Mestrado em Informática
Universidade
do Minho
t4
t5
t6
t7
23
Universidade do Minho
Mestrado em Informática
Universidade
do Minho
O modelo de referência
OAIS
Modelo de referência OAIS
24
Universidade do Minho
Mestrado em Informática
Universidade
do Minho
• Define os componentes funcionais básicos
presentes num sistema de arquivo com
responsabilidade de preservação
– Interfaces internas e externas
– Caracteriza os objectos digitais manuseados
– Determina a terminologia a utilizar no contexto da
preservação
• Desenvolvido pelo Consultative Commitee for
Space Data Systems (CCSDS)
– Grupo responsável por estabelecer normas para os dados
produzidos por agências espaciais
• Aprovado como uma norma ISO em Janeiro
de 2002 (ISO 14721)
Consultative Committee for Space Data Systems Reference Model for an Open Archival Information System
(OAIS) - Blue Book. National Aeronautics and Space Administration, Washington, January 2002.
OAIS (Intervenientes)
Universidade
do Minho
• Produtor
25
Universidade do Minho
Mestrado em Informática
– Responsável pela criação e depósito do material
• Consumidor
– Aquele que procura encontrar itens de informação
• Gestão
– Responsável pela gestão do arquivo digital
OAIS (Componentes Funcionais)
Universidade
do Minho
• Ingestão
26
Universidade do Minho
Mestrado em Informática
– Recepção, validação, transformação, descrição da informação
submetida pelos produtores
• Armazenamento
– Garante a preservação da informação a nível físico e lógico (e.g.
refrescamento, migração, verificação de integridade, disaster
recovery, etc.)
• Gestão de metainformação
– Responsável pela gestão da metainformação associada aos
objectos custodiados
OAIS (Componentes Funcionais)
27
Universidade do Minho
Mestrado em Informática
Universidade
do Minho
• Planeamento de preservação
– Monitoriza o ambiente externo quanto a modificações na
tecnologia ou comunidade de utilizadores que poderão afectar a
estratégia de preservação
• Acesso
– Localização, pedido, transformação e entrega de objectos digitais
aos consumidores
– Controlo de acessos
• Administração
– Dá suporte às operações do dia-a-dia
– Coordena as restantes actividades
OAIS (Information Packages)
Universidade
do Minho
• Pacote de submissão (SIP)
28
Universidade do Minho
Mestrado em Informática
– Objecto digital fornecido
– Metainformação disponibilizada pelo produtor
• Pacote de arquivo (AIP)
– Objecto digital a arquivar
– Metainformação suficiente para garantir a preservação e o acesso
ao objecto
• Pacote de disseminação (DIP)
– Objecto no formato que será entregue ao consumidor
– Metainformação relevante
Conclusões
Universidade
do Minho
29
Universidade do Minho
Mestrado em Informática
• Emulação versus Migração
– Emulação para preservação de software e objectos
complexos/interactivos
– Migração para a preservação dos restantes
objectos digitais
• Não existe uma solução única e
adequada a todos os tipos de material
• Preservação do bit stream original
– Hoje em dia reconhece-se que para garantir a
preservação será necessário alterar o objecto
preservado
– Os objectos analógicos (e.g. livros) também são
modificados ao longo do tempo (e.g.
escurecimento das folhas)
Conclusões
30
Universidade do Minho
Mestrado em Informática
Universidade
do Minho
• A decisão sobre que estratégia de
preservação adoptar depende de
vários factores:
– Simplicidade de implementação a curto e longoprazo
– Custo
– Restrições legais
– Satisfação da comunidade de interesse
• Avaliação/selecção vs arquivar
cegamente
– O preço/Mb decresce com o tempo
– O preço do homem/mês aumenta com o tempo
– “Prefiro ser condenado por algo que fiz do que por
algo que não fiz” (Lesk, Internet Archive)
31
Universidade do Minho
Mestrado em Informática
Discussão
Universidade
do Minho
Questões
32
Universidade do Minho
Mestrado em Informática
Universidade
do Minho
• Dê exemplos de objectos digitais
que gostaria de ver preservados
por um longo período de tempo.
Justifique.
• Que medidas poderiam ser
tomadas para preservar cada
uma dos objectos que identificou?