Digitalização dos documentos

Download Report

Transcript Digitalização dos documentos

[email protected]
Porto Alegre, 05 de novembro de 2012
O PROCESSO DE DIGITALIZAÇÃO DE DOCUMENTOS
Democratização e facilidade de acesso, otimização do espaço
físico, qualidade total, senhas de acesso, universalidade,
transposição de barreiras geográficas para envio de
documentos, são algumas das razões para implantação de um
projeto de digitalização. Além disso, é ainda uma forma de
auxiliar o processo de conservação do acervo, minimizando o
manuseio.
Diferentemente da revolução da microfilmagem, que ainda hoje
garante qualidade e durabilidade, ou seja, segurança da
integridade da informação, é preciso que o profissional de
arquivo atente para que este tipo de trabalho não se perca.
Problemas futuros com a manutenção da possibilidade de leitura
de documentos, assim como da padronização, obsolescência de
softwares e hardwares já ocorreram anteriormente, e embora os
fabricantes estejam mais responsáveis nesse sentido, a
comunidade arquivística precisa manter-se informada para evitar
possíveis mudanças bruscas em função apenas de um novo
cenário econômico, devendo optar sempre por soluções que
tenham respaldo internacional e menos suscetíveis a mudanças.
É preciso ainda alertar para alguns cuidados com relação à
conservação e riscos do seu próprio sistema e ambiente,
atentando para o retrabalho e pensando no futuro, adiantando
processos de descrição e análise arquivística e diplomática.
“Memória e Prova em Plataformas Digitais”
A informação em plataformas digitais constitui-se como meio de
memória e prova de acontecimentos passados, mas de uma forma
diferente do que a informação fixada no suporte papel. Pelo fato de
caracterizar-se em uma estrutura dinâmica, usá-la como meio de
memória e prova implica ter uma outra perspectiva sobre o passado,
onde o acréscimo ou decréscimo de informação não a invalidam como
reconstituição do passado. Desta maneira, observamos então este
fenômeno cada vez mais presente, de como esta interatividade entre os
usuários e a constante (re)edição desta informação produzida afeta
nossos paradigmas sobre memória e prova em plataformas digitais.
ROCKEMBACH, Moisés
ANÁLISE ARQUIVÍSTICA E DIPLOMÁTICA
O potencial probatório de um documento, segundo Duranti (1994), diz respeito a
algumas características básicas:
imparcialidade – por deverem ser inerentemente verdadeiros, livres de
preconceito e produzidos para desenvolver atividades de acordo com a função
do emissor
autenticidade – conferida pela rotina processual de manutenção e custódia;
naturalidade – por acumularem-se naturalmente, de acordo com sua estrutura
orgânica, o que também confere credibilidade;
inter-relacionamento – por estabelecerem relações entre outros documentos e
as ações que deles resultam; e finalmente,
unicidade – pois cada documento assume um lugar único, apesar de poderem
existir cópias, que também serão únicas.
O caráter probatório de um documento arquivístico é dado pela diplomática, que
só analisa documentos com essa origem, ou seja, que tiveram sua natureza
orgânica considerada, bem como uma tipologia documental definida, que nada
mais é do que a configuração que uma espécie documental assume de acordo
com a sua atividade geradora. É assim garantido o caráter involuntário da
documentação gerada.
A diplomática, como explica Rondinelli (2002) ao citar Luciana Duranti, “o
documento escrito, isto é, evidencia que é produzida num suporte (...) por meio
de um instrumento escrito (...) ou de um aparato para fixar dados, imagens e/ou
vozes”, porém apenas quando for um documento arquivístico.
NORMAS, METADADOS, DESCRIÇÃO
Metadados:
Dados estruturados e
codificados, que descrevem e
permitem acessar, gerenciar,
compreender e/ou preservar
outros dados ao longo do
tempo.
DICIONÁRIO BRASILEIRO
DE TERMINOLOGIA
ARQUIVÍSTICA, 2005, p. 116
ESPECIFICAÇÕES DE APARELHOS
MANUAIS DE FABRICANTES
SOFTWARES, DRIVES
SCANNER PLANETÁRIO
SCANNER DE MÃO
SCANNER DE NEGATIVOS
FOTOGRÁFICOS
EXEMPLO
Digitalização da massa documental composta por:
- 100 revistas semanais
- 20.000 notas fiscais preenchidas à mão e à máquina
- 2.000 ofícios assinados
- 500 manuscritos
Equipamentos:
- 02 scanners marca HP, modelo Scanjet 8250
Exemplo segundo especificações técnicas do fabricante
• Alimentador Automático de Documentos
a 15 ppm, com capacidade frente e
verso.
• Alta velocidade – pré-visualize
digitalizações em cerca de 4 segundos.
• 4 800 ppp e adaptador para
transparências incorporado.
Digitalização dos documentos
Mesmo podendo ser utilizadas resoluções mais baixas (200 a 400 dpi) para
arquivamento, especialmente para grande massa documental, optamos
pelas mais altas (300 a 600 dpi), devido à possibilidade de ampliação e
visualização de detalhes.
Foi escolhido o formato TIFF para compressão e representação, que tem
possibilidade de conversão para outros formatos, como JPEG e PDF, mais
apropriados para serem visualizados na Internet. Além disso, permite
múltiplas imagens em um arquivo, diferentes formatos de algorítmos e
compressão com e sem perda, resolução de até 24 bits (16 milhões de
cores), ou seja, é um formato adequado para digitalização e arquivamento
com possibilidade de derivação.
Digitalização dos documentos
Para as revistas foi estipulado o uso de 24 bits, para preservar a integridade das
cores, e resolução de 300 dpi. Já para os documentos de texto, serão apenas
duas cores, ou seja, apenas 1 bit, sendo 600 dpi no caso de notas fiscais e
ofícios, tendo em vista a necessidade eventual de ampliação para conferência de
documentos como provas.
No caso dos manuscritos, considerados documentos recentes, higienizados,
legíveis, preferencialmente minutas, ou seja, não documentos históricos e/ou que
possam vir a ser analisados probatória e diplomaticamente, que necessitariam de
maior resolução, a indicação foi de 400 dpi.
A fórmula para chegar ao tamanho mínimo em KB de uma imagem não
compactada foi: KB = (Largura * dpi) * (Altura * dpi) * Bits / 8 * 1024
As características das imagens digitalizadas, decorrentes da massa documental
da instituição em questão, portanto, são as seguintes:
Digitalização dos documentos
Devido ao elevado volume de espaço, a grande massa deve ficar em
unidades de disco rígido (HD/hard disk), e hospedado em um servidor, caso
seja disponibilizado em rede interna ou externa. A realização de backup
também é recomendada, com a localização em endereços diferentes.
A utilização de CD/DVD, pela sua mobilidade, pode ser considerada, mas a
longo prazo, visto que seriam necessárias 209 mídias CD de 700MB ou 30
DVDs de 4,7 GB.
Digitalização dos documentos
O cálculo para compressão é:
KB = (Largura * dpi) * (Altura * dpi) * Bits / 8 * 1024 * Compressão
Utilizamos o formato TIFF para todos os documentos, sem compactação.
Na compactação foram considerados os formatos CCITT Grupo IV (20 x sem
perda) para docs p&b, e LZW (3 a 4 x sem perda) para imagens coloridas.
O cálculo para dimensionamento, calculado em Giga Bytes (GB) e
considerando a Margem do Projeto em 1 = 100% é:
GB = (Tamanho mínimo + (Tamanho mínimo x Margem de Projeto)) *
Quantidade de imagens / 1024 * 1024
Digitalização dos documentos
Resumo:
- Maior resolução (300 a 600 dpi)
- Opção pelo formato TIFF
- KB = (Largura * dpi) * (Altura * dpi) * Bits / 8 * 1024
- KB = (Largura * dpi) * (Altura * dpi) * Bits / 8 * 1024 * Compressão
- GB = (Tamanho mínimo + (Tamanho mínimo x Margem de
Projeto)) * Quantidade de imagens / 1024 * 1024
- margem 1 = 100%
Digitalização dos documentos
O tamanho mínimo considerado é de uma página tamanho A4 (21 x 29,7) para
todos os documentos, tendo em vista a dimensão fixa no caso dos ofícios e
manuscritos, aproximada no caso das revistas (20,4 x 26,5), e variável no caso
das notas fiscais.
4
No caso das 100 revistas, foi considerada média de 110 páginas por
revista, ou seja, 11.000 páginas (ou 5.500 frente e verso), ao contrário
dos demais documentos, cuja quantidade global corresponde ao mesmo
número de páginas.
Somando-se às 20.000 notas fiscais, 2.000 ofícios e 500 manuscritos,
tratam-se de 33.500 documentos. Consideramos a capacidade de 15 ppm
do scanner, com uma taxa de redigitalização de 5% e de média de
produção em 70%.
O tamanho mínimo considerado é de uma página tamanho A4
(21 x 29,7) para todos os documentos, tendo em vista a dimensão
fixa no caso dos ofícios e manuscritos, aproximada no caso das
revistas (20,4 x 26,5), e variável no caso das notas fiscais.
5
30 DVDs
Necessidades de arquivos
PDF Preservação/CCITT/LZW/Algorítimo/JPEG200
TIF /PNG Difusão
JPG / GIF THUMBNAIL (miniatura)
Os cuidados com a digitalização não se restringem apenas a evitar
manchas, linhas verticais, folhas inclinadas e má configuração, o que
nem sempre é possível corrigir, embora hajam recursos para tal, como
ajustes do tom de cinza (thresholging), simulação dos tons de cinza por
pontos (dithering), retirada de pontos soltos (despecle), alinhamento de
documentos inclinados (deskew), eliminação de bordas (crop) e rotação
(rotation).
A simples mudança de orientação – vertical/horizontal – gera
compactação e perda de qualidade.
Optar por digitalizar já na orientação adequada.
Condições ambientais: recomendação para armazenamento de mídias a
uma temperatura de 10º Celsius e umidade relativa de 25%, constantes,
bem como limpeza especializada, buscando atingir a durabilidade estimada
de 200 anos.
Retomando:
Projeto de Digitalização de Acervo
1. Identificação do acervo: características físicas, uso, necessidade
2. Análise arquivística: avaliação do documento, dados para descrição,
indexação – evitar retrabalho
3. Decisões sobre cor, resolução, arquivos, compactação: evitar problemas
de origem (posicionamento, perda de qualidade)
4. Conhecimento do equipamento e suas especificações
5. Cálculo do tempo
6. Cálculo e escolha da forma de armazenagem
7. Preservação digital: possibilidades de acesso, migração, condições
ambientais
8. Forma de acesso: permissões
REFERÊNCIAS
ARQUIVO NACIONAL (Brasil). Conarq. Recomendações para Digitalização de Documentos
Arquivísticos Permanentes. 2010.
http://www.conarq.arquivonacional.gov.br/media/publicacoes/recomenda/recomendaes_para_di
gitalizao.pdf Acesso em 30/10/2012.
BALDAN, R.; VALLE, R.; Cavalcanti, M. GED – Gerenciamento Eletrônico de Documentos.
São Paulo: Érica, 2002.
BELLOTTO, Heloísa Liberalli. Arquivos Permanentes: tratamento documental. 3. ed. Rio de
Janeiro : Editora FGV, 2005. p. 65-103.
BERWANGER, Ana Regina, LEAL, João Eurípedes Franklin. Noções de Paleografia e de
Diplomática. 2. ed. Santa Maria : Editora da UFSM, 1995.
Conservação Preventiva em Bibliotecas e Arquivos – CPBA. http://www.arqsp.org.br/cpba/
Cadernos 44-47 e 51. Acesso em 30/10/2012.
REFERÊNCIAS
Dicionário brasileiro de terminologia arquivística. Rio de Janeiro: Arquivo Nacional, 2005.
232p
DURANTI, Luciana. Registros documentais contemporâneos como provas de ação. Estudos
históricos, Rio de Janeiro, v.7, n.13, 1994, p.49-64.
NOBRADE: Norma Brasileira de Descrição Arquivística. Rio de Janeiro: Arquivo Nacional,
2006. 124p.
ROCHA, Rafael Port da. Imagem de Documento. Notas de Aula 2006. Disponível em
http://www.geocities.com/r2ocha/notasaula/ImagemDeDocumento.pdf Versão: 18/04/06 11:16.
Rockembach, Moisés. Memória e Prova em Plataformas Digitais. Revista PRISMA, nº 13.
2010. http://revistas.ua.pt/index.php/prismacom/article/view/741 Acesso em 15/10/2012
RONDINELLI, Rosely Cury. Gerenciamento arquivístico de documentos eletrônicos. Rio
de Janeiro : Editora FGV, 2002. p. 42-61.