Som e imagem

Download Report

Transcript Som e imagem

Aplicações Informáticas B 1

Sinal Analógico

– Variação Contínua

Sinal Digital

– Variação Discreta – Intervalo de Sinalização Aplicações Informáticas B 2

Transmissor Receptor

T

Intervalos de sinalização Transmissão

T

Instantes de amostragem

T

Sinal recuperado

“Não é necessário que se preserve o formato preciso do sinal original para que se possa receber corretamente as informações” Aplicações Informáticas B 3

Sinal analógico original

Conversão Analógica – Digital

Sinal analógico recuperado

Conversor A/D

Sinal digital (010010...)

Conversor D/A

Digitalização

: Conversão de sinal analógico (onda) para digital (bits) – Ex: “Digitalização” de áudio: • ADC :

Analogic-to-Digital Converter

 sinal de áudio convertido em amostras digitais (

stream

de bits) • DCA:

Digital-to-Analogic Converter

 produção do sinais acústicos (reconstrução do sinal analógico) Aplicações Informáticas B 4

Analógico

Digital Composta por duas fases:

Amostragem + Quantização

Taxa de Amostragem (

Sampling rate

)

Número de amostras capturadas no sinal contínuo /seg (Hz)

Quantização (

bits per sample

)

Número de bits usado para medir a amplitude do sinal Aplicações Informáticas B 5

Distorção no sinal analógico restituído O sinal gerado após a conversão D/A não é idêntico ao original (a informação não é idêntica à capturada no mundo real) Tamanho dos arquivos Necessidade de meios de armazenamento digital com grandes capacidades Alta largura de banda Ex: 8 min de som estéreo com qualidade CD = 80 Megabytes!

Solução: ganhos tecnológicos e compressão Aplicações Informáticas B 6

Amostragem Linear e Quantização

Amplitude amostra

.75

0 -.75

Amostra Tempo 3bits

8 valores

Aplicações Informáticas B 7

• Quantização: conversão dos valores amostrados em valores discretos de quantização. • Erro de quantização  relação sinal/ruído, SNR ou S/R (em dB) – Quanto maior, melhor o sinal (S/R >70 dB para evitar ruídos) – Menos bits  maior perda  perda de qualidade  mais ruído Aplicações Informáticas B 8

OBJECTOS MÉDIA

Aplicações Informáticas B 9

Objetos

média

Apesar de existirem outras classificações, o estudo dos objetos média será dividido em:

Texto Áudio Imagem Vídeo ou Imagens em movimento Aplicações Informáticas B 10

Aplicações Informáticas B 11

Mais simples dos objetos média de base Forma primária de comunicação assíncrona

Livros, cartas, jornais, e-mails...

Dois tipos: formatados e não-formatados

Não-formatados: ASCII (utf-8 e utf-16) Formatados: não existe um padrão, apesar do RTF

(Rich Text Forma

t) ter ganho espaço o Descrição da estrutura: Tex, Latex, SGML, XML o Descrição das páginas: PostScript da Adobe Aplicações Informáticas B 12

Tipo (typeface): família de caracteres gráficos que incluem vários tamanhos e estilos (ex. Helvetica, Times, Courrier). Fonte: coleção de caracteres do mesmo tamanho e estilo, pertencentes a uma família de Tipos (ex. Times 12 italic, Courier New 12 bold). Estilo: negrito, itálico, sublinhado, Tamanho: tamanho da fonte, expresso em pontos (1 ponto = 1/72 polegada). Aplicações Informáticas B 13

Espaço adicional entre linhas para uniformizar o espaçamento entre elas (

leading

)

lead

= chumbo em inglês; tira de chumbo utilizada pelos tipógrafos para separar linhas de texto.

Espaço entre caracteres (

tracking

): em geral, aplicado manualmente, forçando os caracteres a coexistirem com espaçamentos entre si diferentes do definido na fonte Sem tracking Com tracking negativo Com tracking positivo Aplicações Informáticas B 14

kerning

: espaço entre pares de caracteres; normalmente, o

kerning

utiliza informação existente na própria fonte (ex. o espaço entre o V e o A deverá ser menor do que entre o V e o Z).

serif

: pequenos “ornamentos” nas extremidades dos traços de um caracter.

Aplicações Informáticas B 15

Formatados de formas variadas e dependentes de plataforma – denominador comum: ASCII e mais recentemente o

Unicode

(UTF-8 e UTF-16) Formatação em tempo de autoria (WYSIWYG)

versus

formatação pós-edição:

MSWord versus

“Latex” ou “XML + XSL” Fácil compressão: métodos tradicionais de compressão obtém bons resultados (

zip

) Praticamente toda a indexação de objetos mídia é feita através de textos (metadados) Aplicações Informáticas B 16

“Boa regra” : desacoplamento do conteúdo da formatação de apresentação XML e DTDs/Schemas : teste de conformidade (sintaxe correta) Compactação interna (formato pdf, doc) ou externa (zip, compress, gzip, ...) Apresentações dinâmicas: CSS, scripts, Flash, ...

Na verdade, funcionam como animações... Avanços: Acentuação em diversas línguas e diferentes caracteres Textos especiais para grupos específicos de trabalho: matemática (MathML), por exemplo...

Aplicações Informáticas B 17

Aplicações Informáticas B 18

Acústica é o estudo do som Geração, transmissão e recepção de ondas sonoras Onda sonora - a energia causa perturbação em um meio

compressão rarefação

Aplicações Informáticas B 19

SOM

: um sinal analógico produzido por um fluxo contínuo de vibrações que provoca variações na pressão do ar O ouvido percebe

variações de pressão

transforma em

impulsos elétricos

para o cérebro e

Transdutores

: alto-falantes (sinal elétrico em acústico) e microfones (sinal acústico em elétrico) Aplicações Informáticas B 20

SOM

onda

oscilação em 1 dimensão

Parâmetros perceptuais:

Intensidade:

sons fortes e fracos (dB)

Altura

: sons graves (menor) e agudos (maior)

Timbre

: notas de mesma altura e intensidade tocadas em diferentes instrumentos Aplicações Informáticas B 21

A fala é uma forma de onda complexa Vogais e sons graves estão em baixas freqüências Consoantes correspodem a altas freqüências O ouvido humano é mais sensível a baixas freqüências A região mais importante fica entre 2 kHz e 4 kHz A audição depende do espaço e do ambiente O som precebido pode ser mascarado por interferência de outros sons Aplicações Informáticas B 22

Aplicações Informáticas B 23

Áudio digital: uma

stream

de amplitude de bytes contendo dados CD: os bytes representam picos de volume E as freqüências ou timbres?

Resultam da “repetição da amplitude” durante um certo intervalo de tempo...

Áudio digital: Combinação de freqüências limitadas pela “quantidade de amplitudes” apresentadas por segundo e o “tamanho” de cada amplitude...

Aplicações Informáticas B 24

Dispositivos analógicos: pressão mecânica em sinais magnéticos ou elétricos Dispositivos digitais: sinais representados por seqüência de bits

Sinal original

Filtro Analógico

Sinal filtrado

Amostrador

Sinal digital Sinal amostrado Sinal digital

Sistema Digital Quantizador

Aplicações Informáticas B 25

Esquema da Codificação PCM

Sinal original Pulsos PAM Pulsos PCM Saída PCM 7.0

6.0

5.0

5.0

5.0

4.1

3.0

4.5

2.2

2.5

1.1

100 110 011 010 101 010 100 001 101 111 101 3 2 1 0 7 6 5 4

26

MIDI

Fontes: http://www.mozart.co.uk/information/articles/midinote.htm

http://www.borg.com/~jglatt/tech/midispec.htm

http://www.sonicspot.com/guide/midi.html

Aplicações Informáticas B 27

MIDI

:

M

usical

I

nstrument

D

igital

I

nterface

Origem: padronização da comunicação entre instrumentos musicais eletrônicos MIDI é a “

língua franca

” para a música...

Sintetizador MIDI: recupera instruções e sintetiza o som de acordo com elas

Qualidade depende do sintetizador Aplicações Informáticas B 28

Aplicações Informáticas B 29

http://www.mundocor.com.br/cores/ciencia_cor.htm

Aplicações Informáticas B 30

Imagem: formada pela reflexão da luz incidente sobre um objeto que estimula os receptores sensíveis à intensidade de luz do olho Descrição de uma imagem monocromática: Valor da intensidade coordenadas espaciais a de luz como função de duas a(x,y) (2D) ou a(x,y,z) (3D) Imagens coloridas: Reflexão de diferentes comprimentos de onda (cores) • Seria necessário um espectro completo para a descrição (Newton) • Mas... O sistema de visão humana tem características que simplificam este processo.

Aplicações Informáticas B 31

Aplicações Informáticas B 32

A córnea do olho funciona como uma lente que focaliza os raios luminosos para dentro da retina Estes raios estimulam incontáveis nervos especializados chamados

bastões (rods)

situados na superfície da retina e

cones

Os receptores nos

cones

vermelho , verde à luminosidade são sensíveis às cores e azul ; os receptores nos

bastões

O olho não responde igualmente a todos os comprimentos de onda da luz...

Aplicações Informáticas B 33

Espectro da Luz x Espectro Visível

Aplicações Informáticas B 34

Diferentes distribuições espectrais da luz podem resultar na mesma resposta visual, i.e.: É possível criar sensações de cores idênticas com diferentes combinações de comprimentos de onda (cores) Teoria Young/Helmholtz: existem três receptores sensíveis à luz, que reagem ao vermelho , verde e azul , gerando, desse sistema, a visão das demais tonalidades: Qualquer sensação de cor reproduzida pela combinação de três luzes coloridas monocromáticas (RGB) primárias.

Toda imagem colorida plana pode ser representada por três funções 2D, uma para cada componente primária Aplicações Informáticas B 35

Lentes da câmera focam uma imagem de uma cena em uma superfície foto-sensível de sensores CCD (

Charge-Coupled Device

) Brilho de cada ponto é convertido em uma carga elétrica proporcional ao brilho por uma camada foto sensível A superfície foto-sensível é rastreada por um feixe de elétrons para capturar as cargas elétricas A imagem ou cena é convertida em um sinal elétrico contínuo Para imagens coloridas, a câmera divide a luz em suas 3 componentes primárias, gerando um sinal elétrico para cada uma delas (para sinal RGB) Aplicações Informáticas B 36

Captura de imagens coloridas

Aplicações Informáticas B 37

Scanners: imagens digitais a partir de papel ou películas fotográficas Imagem formada pela medida da reflexão gerada a partir de uma fonte de luz Características: resolução óptica (dpi), velocidade, número de cores, tamanho do papel, sensores Máquinas digitais: Princípio semelhante às tradicionais, com armazenagem digital da foto (muitas vezes com compressão) Fotos para Web ( < 2Mpixels) Fotos profissionais (> 3Mpixels) Aplicações Informáticas B 38

IMAGEM DIGITAL

Aplicações Informáticas B 39

Imagem digital: matriz composta de pixels contendo valores associados a informações de cores e brilho, que vista “a uma certa distância” forma uma imagem Digitalização (imagem monocromática): Transformação da imagem analógica contínuo para uma digital a[m,n] a(x,y) no espaço 2D no espaço discreto 2D através de um processo de amostragem Imagem 2D a(x,y) dividida em M linhas e N colunas com {m=0,1,2,...,M-1} e {n=0,1,2,...,N-1} gerando a[m,n] Representação da amplitude “média” do brilho (escala de cinza) de cada pixel através de quantização Aplicações Informáticas B 40

Digitalização

Colunas Valor =  (

x,y,z,

,t

) MxN = 16x16 a[3,10] = 120 (valor do brilho) Aplicações Informáticas B 41

Três tipos básicos: 1. Imagem Vetorial (gráfico ou desenho) 2. Imagem por Modelos Matemáticos 3. Imagem Matricial ou

Bitmap

(

raster

)

Aplicações Informáticas B 42

Imagem vista como um conjunto de primitivas mais complexas: segmentos, elipses, polígonos, ...

As primitivas possuem atributos como espessura, cor, padrões de preenchimento, etc.

Imagens técnicas (mapas, diagramas, plantas, ...) Geradas por editores ou programas Podem ser editadas: objetos podem ser removidos, adicionados, movidos, modificados, etc.

Escalamento não altera a qualidade (como no caso do

bitmap

) Ex. de formatos padrão: PHIGS, GKS, IGS, ...

Aplicações Informáticas B 43

Imagem por Modelos Matemáticos

• Modelos matemáticos que eliminam redundâncias contidas na informação  compressão • Fractais (

fractal - fractional dimension

): Qualquer curva ou superfície que é independente da escala • Propriedade (

self-similarity

idênticas ao fractal )  quando a escala aumenta, a superfície gerada contém porções • Processo de escalamento iterativo • Cenários virtuais, textura, artes, ...

Aplicações Informáticas B 44

Imagem Matricial ou

Bitmap

• Imagem vista como uma matriz de células, quadradas e de cor única:

pixel

(

picture element

) • Descrita como uma função que retorna o valor da intensidade e cor da luz de cada ponto de uma região plana • Não contém informações estruturais: objetos que compõem a imagem não podem ser modificados • Resultam de capturas do mundo real (

scanner

ou câmeras) ou de síntese (capturas,

paints

, conversão de gráficos,...) • Foto-realismo Aplicações Informáticas B 45

Especificado por 3 parâmetros principais: Tamanho: Altura x Largura Resolução espacial:

pixels

/ unidade de comprimento Tela 10.5’’x 8’’ com 800 x 600 pixels  75 pixels/inch com 1024 x 768 pixels  96 pixels/inch Profundidade de bits Tamanho do arquivo de imagem: Altura x Largura x Resolução 2 x Profundidade de Bits Aplicações Informáticas B 46

Resolução:

pixels

por unidade linear de medida Em

Pixels Per Inch

(PPI) ou

Dots Per Inch

(DPI) Imagem = matriz de pontos  tamanho das células diminui  resolução cresce, o aumenta a quantidade de pixels por unidade de distância (PPI) Achar a resolução ideal envolve: Saber como a imagem foi gerada e onde será utilizada Aplicações Informáticas B 47

Escalamento x resolução

cor: 1bit Resolução: 2000 pixels/pol cor: 8bits Resolução: 200 pixels/pol Imagem 1-bit 2000-ppi (2 x 2 x 2000 2 x 1)/8192 = 1953 KB Imagem 8-bit 200-ppi (2 x 2 x 200 2 x 8)/8192 = 156 KB Aplicações Informáticas B 48

A sensação visual do olho humano ao se deparar com uma cor pode ser definida por: Tom (

hue

): percepção da nuance (mudança de cor vista ao olhar para o arco-íris); mede a freqüência dominante da onda luminosa; Saturação (

colorfulness

): percepção da vivacidade, pureza da cor (ir do azul do céu ao azul escuro) Luminância (

brightness

): percepção de uma área com mais ou menos luz ou brilho (clarear ou escurecer uma imagem) Aplicações Informáticas B 49

R G B • Espaço de cores 3D: RGB formam 3 eixos e definem um cubo – Preto = (0,0,0) e branco = (255,255,255) com 24 bits. • Espaço aditivo: cores formadas pela soma das intensidades de red , green e blue – Uma imagem digital começa sem nenhuma intensidade (cor = preto) e depois vai se formando!

– Menos energia para o preto que para o branco.

Aplicações Informáticas B 50

C M Y

K

• Espaço subtrativo: cores formadas pela subtração dos valores do ciano, magenta, amarelo do branco – Ciano absorve a luz vermelha; magenta, a verde e amarelo, a azul; preto absorve todas e branco reflete todas as cores • Usado para definir cores de impressão – A impressão, em geral, começa sobre um papel em branco • Seja uma cor CMYK = (7,9,5) – Usando preto para as cores que se sobrepõem, faz-se a mesma cor com 2 unidades de ciano, 4 de magenta e 0 de amarelo!

– Reduziu-se a “quantidade de inks” (elementos de imagem impressa) de 21 para 11 (5 unidades de preto custam menos que 6 de cores) Aplicações Informáticas B 51

Espaço de cores

Aplicações Informáticas B 52

ARQUIVO GIF JPG JBIG

Formatos “

Web standards

CONTEÚDO & MODELO GIF

Graphics Interchange Format

– Matricial com forte compressão sem perdas DESCRIÇÃO Formato “padrão” na Web proposto por

CompuServe

. Ideal para imagens em 256 cores. Suporta animação JPEG

Joint Photographic Expert Group

Padrão Internacional para compressão – com perdas Aceita todos os tipos de imagens matriciais: PB + color . Vários níveis de qualidade possíveis, de acordo com a compressão (1:10, 1:30, etc. - 1: 20 é normal...). “Padrão” Web JBIG

Joint Bi-level Image experts Group

– Padrão Internacional para compressão sem perdas Padrão International para compressão de imagem sem perdas da ISO PNG PDF PNG Portable Network Graphics – Matricial com compressão com perdas desenvolvido como opção ao GIF Apareceu recentemente como forma de evitar o licenciamento do algoritmo de compressão GIF. PNG-8: 8-bits comparável ao GIF PNG-24: 24-bits comparável ao JPEG Suporte à animação em estudo...

PDF

Photoshop Portable Document Format –

Vetorial Desenvolvido pela Adobe, incorpora características para layout de página.

Aceita imagens PB e coloridas Aplicações Informáticas B 53

JPG, GIF, PNG-8 & PNG-24

8-colour GIF (1292 bytes) 64-colour GIF (2940 bytes) 16-colour PNG-8 (6481 bytes Full-colour PNG-24 (34377 bytes) Low-quality JPEG (4089 bytes) High-quality JPEG (17465 bytes)

54

8-colour GIF (1292 bytes) Aplicações Informáticas B 55

64-colour GIF (2940 bytes) Aplicações Informáticas B 56

16-colour PNG-8 (6481 bytes) Aplicações Informáticas B 57

Full-colour PNG-24 (34377 bytes) Aplicações Informáticas B 58

Low-quality JPEG (4089 bytes) Aplicações Informáticas B 59

High-quality JPEG (17465 bytes) Aplicações Informáticas B 60

GIF x JPG

GIF é melhor para tratar bordas (cantos) (imagens sintéticas) GIF 4 cores 2.3Kbytes

7.14Kbytes

61

GIF x JPG

JPG é melhor para mudanças suaves (foto-realismo) GIF 11.229 bytes 256-color Dithered JPEG 2.583 bytes PSP Compression: 40

62