Kompresni algoritmy grafiky

Download Report

Transcript Kompresni algoritmy grafiky

Kompresní algoritmy grafiky

Jan Janoušek F11125

K čemu je komprese dobrá?

Pokud je třeba skladovat datově

náročné soubory. Např. pro záznam obrazu, hudby a hlavně videa je třeba skladovat překvapivě mnoho dat. • Při přenosu dat po síti. Zmenšením datové náročnosti se minimalizuje čas potřebný k přenosu.

Základní pojmy

• •

Data

„Jakékoliv fyzicky (materiálně) zaznamenané znalosti (vědomosti), poznatky, zkušenosti nebo výsledky pozorování procesů, projevů, činností a prvků reálného světa (reality).“ „Surovina, z níž se tvoří informace.“ Zdroj: http://cs.wikipedia.org/wiki/Data •

Informace

Data která dávají smysl.

Základní pojmy

Kompresní algoritmus

Postup, který minimalizuje množství dat potřebné k popsání dané informace.

• •

Entropie

Míra množství informace Všechny kompresní algoritmy využívají faktu, že data často obsahují řadu nadbytečných informací. S odstraňováním těchto redundantních informací se zvyšuje entropie dat.

Základní pojmy

Kompresní poměr k

Jedná se o poměr mezi velikostí dat po a před kompresí nebo o poměr zkomprimovaného datového toku k nezkomprimovanému. •

Kompresní zisk z

Kompresní zisk je dán vztahem z=1-k a určuje tedy, kolik dat bylo kompresí „ušetřeno“. V případě, že kompresní algoritmus zvětší objem dat (kompresní poměr je větší, než jedna), je kompresní zisk záporný.

Základní pojmy

Bezztrátový kompresní algoritmus

Z komprimovaných dat lze získat původní data bez jakékoliv ztráty kvality. Obvykle méně účinná, než ztrátová komprese. •

Ztrátový kompresní algoritmus

Z komprimovaných dat nelze zrekonstruovat původní data, protože při komprimaci dochází k určitému zkreslení. Při komprimaci grafiky se využívá znalostí psychovizuálního model.

Výhody/nevýhody

• •

Ztrátové

Z komprimovaných dat nelze zrekonstruovat původní data Pro obrázky s vysokým počtem barev (fotky) lepší kompresní poměr • • •

Bezztrátové

Nehodí se pro fotky a spol.

Z komprimovaných dat lze zrekonstruovat původní data U obrázků z nízkým počtem barev obvykle lepší kompresní poměr i kvalita.

Bezztrátové kompresní algoritmy

• • • Slovníkové metody komprese – Komprimovaná data jsou ukládána do „slovníku“. Při opakování dat, která jsou už ve slovníku obsažena, se místo dat samotných uvede odkaz na pozici ve slovníku Statistické metody komprese – Statistické metody komprese jsou založeny na tom, že pro nejčastěji se vyskytující znaky jsou vytvářeny nejkratší odkazy.

Ostatní metody komprese

Ostatní metody komprese

• • •

RLE

Vstup: – wwwwwbwwwbbbbwbbbbbb Výstup: – 5w1b3w4b1w6b Kompresní poměr (v tomto případě): – 12 20 = 0,6 • • •

Vlastnosti RLE

Velmi záleží na typu obrázku Záleží i na orientaci obrázku V některých případech může být i záporný kompresní zisk

Slovníkové metody komprese – LZ77

„Podle principu je nazývána metodou posuvného okna. Pro lepší vysvětlení předpokládejme, že budou data reprezentována řetězcem. Posuvné okno (sliding window) je rozděleno na část, kde už jsou zakódovaná data, a na část, kde jsou ta nezakódovaná.

Kódování začíná nastavením sliding window na řetězec, který má být zakódován, tak, že část pro již zakódovaná data je prázdná a druhá část je naplněna řetězcem (netřeba celým). Hledá se shoda co nejdelšího řetězce (počínajíce rozmezím) z nezakódované části s řetězcem v zakódované části. V případě shody je nový podřetězec zakódován uspořádanou dvojicí (p, n), kde p je pozice prvního znaku v zakódované části, a n je délka shodného podřetězce. “ Zdroj: Foltýnek, Tomáš a Přichystal, Jan. Komprimace a šifrování.

Slovníkové metody komprese – LZ77

Příklad: Vstupní text: leze leze po železe Výstupní text: leze l(2,3) po že(5,4) Zdroj: Foltýnek, Tomáš a Přichystal, Jan. Komprimace a šifrování.

Zdroj: Večerka, Arnošt. Komprese dat

Slovníkové metody komprese – LZW84

• Použití: – Gif, tiff, zip • Na 20 let byl chráněn patentem Zdroj: Foltýnek, Tomáš a Přichystal, Jan. Komprimace a šifrování.

Statistické metody komprese Huffmanovo kódování

„Konvertuje znaky vstupního souboru do bitových řetězců různé délky. Znaky, které se ve vstupním souboru vyskytují nejčastěji, jsou konvertovány do bitových řetězců s nejkratší délkou (nejfrekventovanější znak tak může být konvertován do jediného bitu), znaky, které se vyskytují velmi zřídka, jsou konvertovány do delších řetězců (mohou být i delší než 8 bitů).

Nejjednodušší metoda komprese touto metodou probíhá ve dvou fázích. První projde soubor a vytvoří statistiku četností každého znaku. Ve druhé fázi se využije této statistiky pro vytvoření binárního stromu a k následné kompresi vstupních dat.“ Zdroj: http://cs.wikipedia.org/wiki/Huffmanovo_k%C3%B3dov%C3%A1n%C3%AD

Ztrátové kompresní algoritmy

• • • Ztrátové kompresní algoritmy se používají tam, kde nevadí určité zkreslení informací (obraz, audio, video). Psychovizuálním model pro obrazová data Psychoakustický model pro zvuková data

Psychoakustický model

• • Klíčové znalosti pro ztrátovou kompresi obrazu: – Lidské oko je mnohem citlivější na jas barvy, než na její odstín.

– Lidské oko má větší citlivost na nízké frekvence, než na vysoké.

Při ztrátové kompresi jsou tedy přednostně komprimovány (a tedy zkreslovány) právě tyto informace.

Kompresní algoritmus JPEG

• • Pro velké obrázky z mnoha barvami se bezztrátové komprimační algoritmy nehodí.

Algoritmus využívá tzv. diskrétní kosinová transformace (DCT)

Kompresní algoritmus JPEG

„Metoda je vhodná především pro kódování fotografií, u nichž sousední pixely mají sice odlišné, ale přesto blízké barvy. Snižování kvality se projevuje potlačováním rozdílů v blízkých barvách. U metody DCT je kompresní poměr řízen požadavkem na výši kvality dekomprimovaného obrazu. V praxi se ukazuje, že snížení kvality na 75 % je pro většinu uživatelů nepozorovatelné, přitom kompresní poměr v takovém případě může být až 25:1.“ Zdroj: Foltýnek, Tomáš a Přichystal, Jan. Komprimace a šifrování.

Postup kompresního algoritmu

1. Transformace barev z barevného prostoru RGB do YCBCR – kvůli aplikaci komprese využívající psychovizuálního modelu (barevné složky budou ve výsledku více zkreslené, než složky jasové)

2. Podvzorkování

barevných složek – redukce objemu dat zprůměrováním barevných složek sousedních pixelů

Postup kompresního algoritmu

3. Rozdělení obrazu na čtverce 8 × 8 4. Aplikace dopředné diskrétní kosinové

transformace na prvky čtvercové matice vzniklé v minulém kroku

Postup kompresního algoritmu

5. Kvantování koeficientů

matice – v tomto kroku se určuje stupeň komprese obrazu)

6. Zkomprimování kvantovaných koeficientů

pomocí Huffmanova kompresního algoritmu – po předchozím kroku má mnoho prvků matice nulovou hodnotu

Transformace barev

• Transformace z barevného prostoru RGB do barevného prostoru YC B C R je přesně definována ve specifikaci JFIF, ve které jsou uvedeny jak rovnice pro převod z barevného prostoru RGB do YC B C R , tak rovnice pro převod inverzní.

Transformace barev

• • Specifikace předpokládá, že složky RGB a YC B C R jsou reprezentovány jako celá čísla v rozsahu 0 až 255.

Ačkoliv tato transformace je v principu bezztrátová, tyto samotné převody jsou do určité míry ztrátové, protože dochází k zaokrouhlování výsledků na celá čísla.

YC

B

C

R

Jasová složka barvy – Y (luma)

 Na tuto složku je lidské oko nejvíce citlivé a podléhá tedy nejmenší kompresi.

 𝑌 = 0,299𝑅 + 0,587𝐺 + 0,114𝐵 • • • •

Barevné složky – C B a C R (chroma)

Barevné složky pro modrou a červenou barvu.

𝐶 𝐵 = −0,1687𝑅 − 0,3313𝐺 + 0,5𝐵 + 128 𝐶 𝑅 = 0,5𝑅 − 0,4187𝐺 + 0,0813𝐵 + 128 Barevná složka pro zelenou se neuvádí, protože je jí možno z Y, C B a C R dopočítat.

Zpětný převod

  𝑅 = 𝑌 + 1,402 × 𝐶 𝑅 − 128 𝐺 = 𝑌 − 0,34414 × 𝐶 𝐵 𝐶 𝑅 − 128 − 128 − 0,71414 ×  𝐵 = 𝑌 + 1,772 × 𝐶 𝐵 − 128

Podvzorkování barevných složek

• • Protože lidské oko je mnohem méně citlivé na barvy, než na jas, využívá se podvzorkování (nebo také redukce) barvonosných složek pro zvýšení efektivity kompresního algoritmu. Jedná se o první významněji ztrátový převod, protože informace o barvách v tomto procesu zanikají.

Podvzorkování barevných složek

Podvzorkování funguje tak, že z hodnot barevných složek sousedních pixelů je spočítána průměrná hodnota. Jsou přípustné dvě možnosti:

Podvzorkování barevných složek

• Průměrování hodnot dvou sousedních pixelů na řádku.

– Úspora dat ze 6 bytů na 4, kompresní poměr tedy asi 67%. • Průměrování hodnot pixelů tvořící čtverec 2×2 – Úspora dat ze 12 bytů na 6, kompresní poměr tedy 50%.

Rozdělení obrazu na čtverce 8 × 8

• Obrázek je rozdělen na čtvercové bloky o rozměrech 8 × 8 pixelů. • Tohoto rozdělení lze později využít pro rychle generování náhledového obrázku.

Rozdělení obrazu na čtverce 8 × 8

• Pokud není výška nebo šířka obrázku dělitelná osmi, je nutné tyto „okrajové“ bloky vhodně doplnit do požadovaného rozměru 8 × 8 pixelů. Způsob doplnění je ponechán na konkrétním software, který obrázek zpracovává. Obvykle se používá zrcadlení již existujících pixelů.

Aplikace dopředné diskrétní kosinové transformace

• Nyní máme matici 8 × 8 pixelů, kde každý prvek této matice obsahuje informaci o jasu (složka Y) a o barvě (složky CB a CR). • Od všech jednotlivých složek se odečte hodnota 128, čímž se přetransformuje jejich rozsah do intervalu -128 až 127

Aplikace dopředné diskrétní kosinové transformace

• • Jednotlivé složky se budou nyní dopřednou DCT zpracovávat samostatně. DCT je nutno provést celkem třikrát: jednou pro jasovou složku Y a dvakrát pro barevné složky C B a C R .

• Účelem DCT je přetransformovat tuto matici do matice nové, ve které budou, z hlediska lidského vnímání, nejdůležitější prvky uvedeny v levém horním rohu a směrem k rohu levému bude jejich důležitost klesat.

Aplikace dopředné diskrétní kosinové transformace

Transformace se pro jednotlivé prvky provádí pomocí rovnice: • • • 𝑪 𝒊

,

𝑪 𝒋 – Funkce, pro které platí: 𝐶 0 = 1 2 a 𝐶 𝑖 = 𝐶 𝑗 = 1 pro 𝑖, 𝑗 ≠ 0 𝑵 – Rozměr matice. V tomto případě tedy platí 𝑁 = 8 .

𝒇 𝒎, 𝒏 – Hodnota matice v bodě 𝑚 , 𝑛 .

Aplikace dopředné diskrétní kosinové transformace

• Výsledkem transformace je matice, která v levém horním rohu obsahuje tzv. stejnosměrný koeficient (DC), u něhož jsou hodnoty Y, C B a C R matice.

průměrné celého bloku

Aplikace dopředné diskrétní kosinové transformace

• Výsledkem transformace je matice, která v levém horním rohu obsahuje tzv. stejnosměrný koeficient (DC), u něhož jsou hodnoty Y, C B a C R matice.

průměrné celého bloku

Aplikace dopředné diskrétní kosinové transformace

• Ostatní koeficienty jsou tzv. střídavé (AC). Čím vyšší frekvenci tyto koeficienty mají, tím je jejich důležitost nižší a mohou se v následujícím kroku více zkomprimovat (a tedy více zkreslit jejich hodnota).

Kvantování koeficientů matice

• Až na proces podvzorkování barvonosných složek dosud algoritmus dosud neprováděl žádnou kompresi. Ta nejdůležitější část komprese – kvantování koeficientů tabulky – se provádí právě zde.

Kvantování koeficientů matice

• Z předchozího kroku je připravena matice, která má v určité části důležité koeficienty a v jiné méně důležité až téměř nevýznamné. Každý prvek této matice se celočíselně vydělí hodnotami z tzv. kvantizační tabulky.

Kvantování koeficientů matice

• Kvantizační tabulky obsahují nízké hodnoty u důležitých členů (nízkofrekvenčních) a vysoké hodnoty u důležitých členů (vysokofrekvenčních). Po tomto procesu tedy vzniknou u vysokofrekvenčních prvků převážně nuly.

Zdroj: http://www.root.cz/clanky/p rogramujeme-jpeg kvantizace-dct-koeficientu/

Kvantování koeficientů matice

• Výsledná kvalita závisí převážně na použité kvantizační tabulce. Proto obvykle existují pro různé stupně komprese různé tabulky.

• Kvantizační tabulky nejsou dány normou, a proto každý výrobce softwaru může zvolit vlastní sadu kvantizačních tabulek.

Kvantování koeficientů matice

• Často aplikace neobsahuje pro každý stupeň komprese specifickou kvantizační tabulku. Tento problém se řeší pomocí lineární interpolace ze známých příslušných hodnot ostatních kvantizačních tabulek.

Kvantování koeficientů matice

Zdroj: http://www.root.cz/clanky/programujeme-jpeg-kvantizace-dct koeficientu/

Zkomprimování kvantovaných koeficientů

• V aktuálním stavu obsahuje kvantovaný blok 8 × 8 pixelů mnoho pixelů v části vysokofrekvenčních členů. Tento blok nyní stačí už pouze zkomprimovat pomocí Huffmanova kompresního algoritmu.

Zkomprimování kvantovaných koeficientů

• Matice je komprimována postupně „cik-cak“ od členu s nejnižší frekvencí (stejnosměrný člen – DC) po člen s nejvyšší frekvencí. Tímto postupem Huffmanovo kódování dosáhne nejvyšší účinnosti díky opakování mnoha nul po sobě.

Zdroj: http://www.root.cz/clan ky/programujeme-jpeg kvantizace-dct koeficientu/

Zkomprimování kvantovaných koeficientů

• Tímto krokem je samotná komprimace dokončena. Nyní zbývá už jen data uložit v podobě dle specifikace, přidat hlavičku a ostatní metadata (EXIF, IPTC apod.).

Zdroje

5.

6.

7.

1.

2.

3.

4.

Foltýnek, Tomáš a Přichystal, Jan. Komprimace a šifrování. [Online] [Citace: 6. 4 2012.] https://akela.mendelu.cz/~foltynek/KAS/elearning/KAS_PDF.pdf.

Večerka, Arnošt. Komprese dat. [Online] 2008. [Citace: 6. 4 2012.] phoenix.inf.upol.cz/esf/ucebni/komprese.pd.

Tišnovský, Pavel. Programujeme JPEG: diskrétní kosinová transformace (DCT). Root.cz. [Online] 4. 1 2007. [Citace: 6. 4 2012.] http://www.root.cz/clanky/programujeme-jpeg-diskretni-kosinova-transformace dct/.

—. Programujeme JPEG: Kvantizace DCT koeficientů. Root.cz. [Online] 11. 1 2007. [Citace: 6. 4 2012.] http://www.root.cz/clanky/programujeme-jpeg-kvantizace dct-koeficientu/.

Bařina, David. Ztrátová komprese obrazu. FIT VUT Brno. [Online] 2007. [Citace: 6. 4 2012.] www.fit.vutbr.cz/study/DP/rpfile.php?id=5779.

Data compression ratio. Wikipedia. [Online] [Citace: 6. 4 2012.] http://en.wikipedia.org/wiki/Data_compression_ratio.

Komprese Dat. Wikipedia. [Online] [Citace: 1. 4 2012.] http://cs.wikipedia.org/wiki/Komprese_dat.