Komprese bitonálního obrazu
Download
Report
Transcript Komprese bitonálního obrazu
Komprese obrazu
Adolf Knoll
Národní knihovna České republiky
Obecná schémata pro aplikaci
komprese
Schémata jsou přizpůsobena charakteru
reprezentovaných objektů:
Bitonální obraz (1-bit, černobílý)
Barevný fotorealistický obraz
Smíšený dokument (obě výše uvedené
komponenty)
Trendy
Bitonální
od CCITT Fax Gr. 3 a 4 k variantám JBIG
Fotorealistický
Bezeztrátová komprese: PNG, TIFF/LZW
Ztrátová: od JPEG DCT k wavelet
Smíšený dokument
Aplikace obého (Mixed Raster Content –
Smíšený rastrový obsah – obvykle vertikálně)
Jak jsou kompresní schémata
zabudována do formátů?
Snahou je obvykle ISO TIFF (v něm jsou možné
dokonce JPEG, LZW nebo PNG) – ale to
nestačí, protože mohou chybět nástroje na
konverze a zobrazení
Proto jsou používány jiné vhodnější formáty,
například JPEG nebo PNG
Z tohoto důvodu jsme též svědky velkého
rozvoje v oblasti smíšených formátů, přestože
tyto si nekladou za cíl bát normou ISO
Relevantní směry
Bitonální obraz
JBIG2 (ISO) – pokusy jednotlivých firem, naoř. LuraTech; existují
i odvozené aktivity (například bitonální kompresor v DjVu)
Fotorealistický obraz
wavelet JPEG2000 a některé další ne-ISO iniciativy (WI, LWF,
IW44, SID, Imagepower IW, …)
Smíšený obsah
DjVu, LDF a další řešení LuraTech, v minulosti Imagepower
MRC
Cíle
Archivace obrazu
standardizovaný
archivní formát (TIFF,
JPEG, PNG, …)
Dodávání obrazů
Účinnější moderní
formát (JB2, MrSID,
DjVu, LDF, …)
Jak se vyrovnat s těmito dvěma cíli?
Klíč je v zaměření projektu.
Komprese…
Předzpracování obrazu
Komprese
Zakódování do obrazového formátu
Dekódování z formátu
Dekomprese
Zobrazení - Tisk
Předzpracování bitonálního obrazu - I
Účinná schémata jsou stavěna na možnostech aplikace
slovníků pixelových shluků:
Např. text je obraz, který může být interpretován jako velké množství
obrázků jednotlivých písmen, zatím co opakovaný výskyt každého
písmene může být vyjádřen souřadnicemi (x,y) a odkazem na
slovník, ve kterém je pouze jedna reprezentace podobných písmen
(digitalizována jen jednou jako bitmapa)
Tato metoda se nazývá PATTERN MATCHING (porovnávání se
vzorem), ale…
Předzpracování bitonálního obrazu - II
Naskenované texty obsahují však spoustu
informačního šumu ve shlucích pixelů,
představujících jedno písmeno v textu, i mimo
ně
Proto je vhodné omezit odchylky mezi identicky
identifikovatelnými shluky
vyhlazování
obracení pixelů
odstranění šumu
Vyhlazování a obracení pixelů
Problémy v pattern matching
Česká republika
Originál nebo sken nízké kvality + špatné zpracování
Soft pattern matching
Lepší práce se slovníky; náhrada jen tam, kde je
jistota, že nebude překročen kritický práh
vedoucí k nežádoucí záměně shluků
Kdyby to hrozilo, je uložena další malá bitmapa
Vyladění těchto mechanismů je klíčem k
úspěšné aplikaci ztrátové komprese bitonálního
obrazu.
Jak to zjistit…
Knihovny mají dokumenty různé kvality vč.
té velmi špatné
Tyto dokumenty se obtížněji zpracovávají
než kvalitní vzorky prezentované
softwarovými firmami
Je třeba testovat na typických materiálech,
které chceme digitalizovat v knihovnách
Bitonální komprese
Bezeztrátová (LZW, PNG, …, CCITT Fax
Group 3 and 4, JB2, JBIG, JBIG2, Algo
Vision/Luratech
Moderní ztrátová schémata:
AT&T (Lizardtech) (JB2) – soft pattern
matching
ImagePower Inc. JBIG2 (JB2) – v minulosti pouze pattern matching
Summus Inc. (Lightning Strike), ...
GIF by byl mírně
horší než PNG
Květy české – 19. století
Vliv kvality digitalizovaných originálů na
výkonnost kompresních schémat
JB2
Nejvýkonnějším kompresním schémat je
JB2 z formátu DjVu (AT&T/Lizardtech).
Umožňuje kompresi:
bezeztrátovou
ztrátovou
agresivní – nastavitelná; zachovává vysokou
čitelnost originálu
Zkuste si komprimovat do DjVu on-line:
http://any2djvu.djvuzone.org/
JB2 jako komponenta formátu
DjVu
Více souborů může být sloučeno a uloženo v jednom
(jako v PDF) – mají společný slovník, takže jejich
celkový objem bude menší než součet objemů
individuálních souborů
Více souborů může být sloučeno virtuálně (na webu jsou
volány dle potřeb uživatele)
Více výhod: display, odkazy, OCR, … (DjVu plug-in)
Drahý kódující software + řada řešení zdarma
Vzorky a résumé
Je třeba monitorovat a testovat nové
způsoby zpracování obrazu
Nové přístupy mohou být velmi vhodné
pro systémy dodávání dokumentů
Obrazové servery
Naskenovaný obsah
Klikněte, pokud máte zájem si přečíst
speciální studii
Které formáty jsou vhodné pro bitonální
obraz?
Jestliže chcete nejjednodušší řešení:
GIF
Jestliže chcete menší soubory, používejte PNG
Oba formáty jsou doporučeny pro web
Úspornějším řešením je však TIFF/CCITT Fax
Gr. 4
Používejte DjVu/JB2, pokud chcete velmi malé
soubory
Problémy
Zavedený software pro práci s obrazem obvykle
neobsahuje podporu pro TIFF s kódováním
CCITT Fax Gr. 4
Na druhé straně je uvedený TIFF dobře
zobrazitelný elementárními nástroji Windows
GIF a PNG podporují též větší barevnou hloubku
(GIF: 8 bitů / PNG: 24 bitů i více) – vyhněte se
ukládání bitonálního obrazu ve větší barevné
hloubce
DjVu – je vždy nezbytné mít na paměti výrobu a
příjem obrazu v tomto formátu
Ztrátová komprese –
bitonální obraz
Komprese barevného
obrazu
Bezeztrátová
LZW
GIF (pouze 8 bitů)
TIFF (od verze 5.0)
PNG
Wavelet
JPEG2000 (JP2)
…
Ztrátová
DCT (JPEG)
Fraktální komprese
Wavelet
IW44
LWF, WI
JPEG2000 (JP2)
MrSID, …
V podstatě ale jde o střet klasických přístupů s technologií wavelet.
Barevný obraz
DCT
wavelet
Účinnost komprese – bitonální obraz
Účinnost komprese – barevný
obraz
Referenční vzorek
Jak aplikovat kompresi?
Záleží na charakteru objektů v obraze:
Fotorealistický obraz (JPEG, wavelet)
Text a jednoduchá černobílá grafika (Fax
Group 4, JB2, …)
Barevná grafiky (problém ztrátové komprese;
je lépe bezeztrátově v PNG nebo GIF –
aplikační oblast vektorové grafiky - SVG)
Smíšený obsah (složená řešení: DjVu, LDF,
…)
Nejúčinnější řešení
Segmentace obrazu do dvou nebo více
skupin objektů:
1. Objekty vhodné pro bitonální konverzi
2. Objekty vhodné pro barevnou reprezentaci
Komprimovat každou skupinu zvlášť a
potom je sloučit v jednom formátu.
Horizontální segmentace/zónování
-
Text
Grafika
Fotografie
Imagepower Inc.
Vertikální
segmentace/zónování
popředí
pozadí
Lizardtech Inc. (AT&T)
Luratech GmBH
DjVu, LDF
Bitonální versus složený obraz
Šedá škála
Další vlastnosti DjVu
Více obrazů v jednom souboru:
jako TIFF, PDF, LDF, …, s použitím
společného slovníku pixelových shluků
virtuálně: stránky zůstanou na serveru a
dodána je jen ta strana, která je volána
Příklad virtuálního DjVu
Obrazový soubor s několika
rozlišeními
MrSID
V jednom souboru je (až 9) obrazů v
různých rozlišeních
Účinné ve spojení s obrazovým serverem
Příklad MrSID (bez obrazového serveru)