Kiegészítõ diák

Download Report

Transcript Kiegészítõ diák

Az információ mérése

pozitív egészre legyen

1 , …,

a m

különböző üzenetek halmaza.

Ha az

a i

üzenetet

k i

-szer fordul elő az adásban, akkor

a i gyakorisága k i

relatív gyakorisága

p i



k n i

,

,...,

p m m

-es az

üzenetek eloszlása.

A definíciókból nyilvánvaló, hogy

i m

  1

p i



1 .

a i

üzenet

egyedi információtartalma

I i

  log

r p i

, ahol

egy egynél nagyobb valós szám az

információ egysége.

= 2 esetén beszélünk bitekről.

Az üzenetek

átlagos információtartama

Általánosítva: egy

tagú eloszlás pozitív valós számokból álló

0 ,

1 , …,

p n

sorozat, amelyre

i m

  1

p i

 1 , ahol az

eloszlás entrópiája

H r

(

,...,

p m

)

 

i m

  1

p i

log

r p i

.

Tehát az átlagos információtartalom legfeljebb

log r m

bit.

Betűnkénti kódolás 5

Legyenek

nem üres halmazok a

kódolandó ábécé

, illetve a

kódoló ábécé

betűinek halmaza.

A megfelelő ábécéből képzett összes szó halmaza

+ , illetve

+ .

legalább 1 hosszú Ha megengedjük az úgynevezett „üres” szót is, akkor

* , illetve

* .

A betűnkénti kódolás tulajdonképpen egy  :

→

* függvény, amelyet kiterjesztünk egy  :

A *

→

* függvénnyé: injektív!

abc



A *

prefix szuffix infix Az üres szó és

x triviális prefix, infix, szuffix.

Kódfa

  111 ,   000 ,   101 ,

 {

 { 0 , 1 }.

a c b

7 Morse – ábécé

Felbontható (egyértelműen dekódolható, veszteségmentes) kódok

injektív, akkor ilyen

Prefix kód:

prefix mentes!

Vesszős kód:

vessző

olyan nemüres elem a kódszavak közül, amely minden kódszónak szuffixe, és egyetlen kódszónak sem prefixe, vagy infixe.

Egyenletes (fix hosszúságú) kód:

kódszavak hossza megegyezik.

Észrevétel:

egy betűnkénti kód pontosan akkor prefix, ha

a kódfának csak a levelei kódszavak.

Tétel (McMillan-egyenlőtlenség) 9

Legyen

= {

1 , …,

a n

} , |

| =

 2 és  :

→

+ injektív leképezés. Ha a  által meghatározott betűnkénti kódolás felbontható, és

l i = |

 (

a i

)|, akkor

i n

  1



l i



1 ,

és fordítva, ha

, …, l n

olyan pozitív egészek, hogy

i n

  1



l i

 1 , akkor létezik az

halmaz elemeinek a

elemeivel való olyan prefix kódolása, hogy az

a i

betű kódjának a hossza

l i .

Optimális kód 10

Az előbbi jelöléseket használva az

átlagos szóhosszúság



i n

  1

p i l i

optimális kódról

beszélünk, ha egy felbontható betűnkénti kód átlagos szóhosszúsága minimális.

Létezik optimális kód ?

Ha egy tetszőleges felbontható kód átlagos szóhosszúsága

, akkor

p i l i

esetén a kód nem lehet optimális  elég csak az

l i



l/p i

eseteket vizsgálni  ilyen kódok véges sokan vannak.

Tétel (optimális kód konstrukciója)

Az előző tétel jelöléseivel, legyen n > 1.

Tekintsünk egy optimális prefix kódot és kódfáját, továbbá legyen a kódszavak hosszának maximuma

Ekkor

Továbbá még a csonka csúcsokból is

(5) egy optimális prefix kód kódfájában  nincs csonka csúcs, ha



mod(

 1 ), azaz

 2  ( (

 2 ) mod(

 1 )), ha egy csonka csúcs van, akkor annak

kifokára



mod(

 1 ), azaz

 2  ( (

 2 ) mod(

 1 )); trivi

akkor

Biz.

két betű kódját felcserélve

csökken éllel együtt átrakjuk a csonka csúcsra, akkor a kódhossz

-ről

+ 1-re változik, tehát az átlag csökken.

(3) Tfh, hogy van olyan csonka csúcs, amelyből csak 1 él indul.

…

0 0 1 2 16

(4) Tfh, van két csonka csúcs (2)  mindkettő az

– 1–edik szinten van az egyik csonka csúcshoz tartozó leveleket éllel együtt átrakjuk a másikra …

(5) Tfh,

levél van a kódfában töröljük az egyik csúcshoz tartalmazó összes levelet ha van csonka csúcs, azzal kezdjük mert +1 keletkezik is ha

levelet töröltünk, akkor

– 1-gyel csökken a levelek száma

…végül

lépés után csak a gyökér marad.

Ekkor azaz

Huffman-kód (példa): |A| = 9, r = 4.

eloszlás

4   9 (mod 3)  lesz csonka csúcs!

a: 0.20

k: 0.45

l: 1.00

b: 0.19

a: 0.20

c: 0.16

d: 0.11

e: 0.10

f: 0.09

g: 0.06

h: 0.05

i: 0.04

c: 0.16

b: 0.19

j: 0.15

c: 0.16

d: 0.11

k a

e: 0.10

d e

f: 0.09

Mennyit kell összefogni?

 2 + (7 mod (3)) 

= 2 + 1.

g f h j b i c

(7) Helyettesítsük az

a k

betű kódját

kódszóval, úgy hogy a a levelek száma

prefix tulajdonság megmaradjon. Ekkor a kódolandó ábácé nőtt

– 1 betűvel.

A kapott kódot jelöljük

–vel.

Indirekte tfh, az állítás nem igaz, és legyen

φ *

Az általánosság megsértése nélkül feltehetjük, hogy Konstrukció + (5) 

és

φ *

kódfájában egyszerre van csonka csúcs, és ha van, akkor a kifoka ugyanannyi mindkét kódolásnál:

, ha nincs, akkor

φ *

optimális + (1), (2)  az

db legkisebb valószínűséghez tartozó kódszó

a legmagasabb szinten van a kódfában, és ugyanezen szinten vannak azok a kódszavak, amelyek a csonka csúcshoz tartoznak.

Azonos szinten lévő kódszavak cseréje nem változtatja meg az átlag kódhosszt  feltehetjük, hogy mindkét kódfában

db legkisebb valószínűségű kódszóhoz tartozó levél ugyanahhoz a csúcshoz tartozik.

Hibakorlátozó kódolás Példák

Paritásbit Ismétléses kód A hibakorlátozó kódok elméleti vizsgálata során fel szokás tenni, hogy nincsenek elveszett bitek, tehát ugyanannyi bit érkezik, mint amennyit elküldtünk.

Fontos feltétel továbbá, hogy egyenletes kódról van szó, tehát minden kódszó egyforma hosszú

Def.

Egy kódot

t-hibajelzőnek

nevezünk, ha minden olyan esetben jelez, ha a vett kódszó legfeljebb

helyen változik meg.

Def.

A kód

pontosan t-hibajelző

, ha hibajelző, azaz van olyan

t t

-hibajelző, de nem + 1 hiba, amelyet a kód nem jelez.

+ 1

Kódok távolsága és súlya 23

Legyen

a kódábécé két szava. Ekkor

(

) a két szó

Hamming-távolsága

, az azonos pozícióban lévő különböző jegyek száma.

Általánosítva a

kódhalmazra,

(

) a

kód távolsága

, legalább 2 elem esetén az összes kódszó-pár távolságának minimuma.

A Hamming-távolság rendelkezik a következő tulajdonságokkal:

kódábécé Abel-csoport, akkor legyen az

kódszó

Hamming-súlya w

(

), a nullától különböző jegyek száma

-ban.

Az előbbiekhez hasonlóan

(

) jelenti a

kód súlyát

, azaz a nem nulla kódszavak súlyának minimumát.

Észrevételek

(

) =

(

–

) ,

(

)

= d

(

, 0).

Csoport kódról

beszélünk, ha



A n

, azaz ha

is Abel-csoport. Ekkor

(

) =

(

Észrevételek

A fentebb bevezetett fogalmakkal: egy kód akkor és csak akkor

-hibajelző, ha

, és csak akkor pontosan

-hibajelző, ha

–

paritásbites kód

: a kódszavak legalább 1 bitben különböznek  ha az eltérés pont 1 bit két közleményszóban  a paritásbit különbözik  Hamming-távolság 2, ha az eltérés pont 2 bit két közleményszóban  a paritásbit ugyanaz ha Hamming-távolság 2 

pontosan 1-hibajelző.

Minimális távolságú dekódolás hibát észleltünk

: nem létező kódszót kaptunk

feladat

: a hibás kódszóhoz keressük meg a „jót”

döntési függvény:

pontosan egy kódszót rendel a hibás szóhoz

26 döntési hiba:

nem a jó kódszót rendeli hozzá

cél

: hibalehetőség a lehető legkisebb legyen Önkényesen feltételezzük, hogy a kapott kódszóban több a jó bit, mint a hibás, még akkor is, ha ez sajnos a valóságban nem mindig teljesül, tehát azt várjuk a döntési függvénytől, hogy a kapott, esetleg hibás szóhoz azt a kódszót rendelje, amelynek a tőle vett távolsága minimális.



Minimális távolságú dekódolás

Mi van, ha több ilyen kódszó is van?

Adunk egy algoritmust, amely „következetesen” választ egy kódszót, vagy nem döntünk, csak jelezzük a hibát.

Def.

Egy kódot

t-hibajavítónak

nevezünk, ha minden olyan esetben helyesen javít, amikor a vett kódszó legfeljebb

helyen változik meg.

Def.

A kód

pontosan t-hibajavító

, ha hibajavító, azaz van olyan helytelenül javít.

t t

-hibajavító, de nem

+ 1 + 1 hiba, amelyet a kód nem javít, vagy Ha minimális hosszúságú dekódolással dolgozunk, akkor a

távolságú kód minden



2 esetén

-hibajavító, és ekkor pontosan

 

2 1   hibajavító.

Ismétléses kód

Kódszó:

2 

a n

Duplázás:

2 

a n



2 

a n a

2 

a n

1-hibajelző 2-hibajelző és 1-hibajavító Triplázás:

2 

a n



2 

a n a

2 

a n a

2 

a n

Kétdimenziós paritásellenőrzés

darab

-bites üzenet paritásbitek páratlanra

paritásbitek párosra 1-hibajavító kódolás.

Def.

Legyen

injektív, Im(

) = és

C S

nem üres véges halmaz, 

S n

. Ekkor

egy

> 0 egész,

blokk-kód

(

) S ahol |

| =

és

(



+ jelöléssel,

Def.

Abel-csoport, és művelettel, akkor

C csoportkód



S n

a komponensenkénti

-beli

Def.

S n

egyben egy test feletti vektortér, és -dimenziós altere (k  0 egész), akkor a kód

lineáris

ennek egy . Jel.: [

]

, ahol

a test elemszáma.

Def.

s n

Ha [

, – 1

1 …

s n k

– 2 ,

]

kódban bármely

1 …

s n

is eleme a kódnak, akkor – 2

s n

– 1

C ciklikus kód.

kódszó esetén

Hamming-korlát

elemű ábácé és

hosszú kódszavak esetén, ha

C t

-hibajavító, akkor  két kódszóra a tőlük legfeljebb

távolságra lévő szavak halmazai diszjunktak

Mivel egy kódszótól pontosan

távolságra pontosan  

j n

  

 1 

szó van, kapjuk, hogy

C j t

  0  

j n

  

 1 



q n

Egyenlőség esetén

tökéletes kód.

Singleton-korlát

elemű ábácé és

hosszú szavaiból álló

kód távolsága

, akkor  kódszóból

– 1 betűt ( ugyanarról a

– 1 helyről) elhagyva a kódszavak még mindig különböznek, de csak

–

+ 1 hosszúak 



q n



 1

mindkét oldallogaritmusát véve



 1 log

q C

Lineáris kód esetén a Singleton-korlát alakja:



–

+ 1.

Egyenlőség esetén

maximális távolságú szeparábilis kód

, ekkor



q k

, ahol

–

+ 1.

Miért szeparábilis?

 rögzített

– 1 =

–

helyen álló betűket elhagyva

q k

különböző szó marad ezekre képezzük le az üzeneteket, a megmaradt

– 1 =

–

helyekre ellenőrző betűket írunk, így kódoló és ellenőrző betűk elválaszthatók lesznek.

Lineáris kód

A gyakorlatban általában ilyeneket használnak.

A test feletti

-esek, vagyis az 

,



a n

 1  alakú kódszavak tulajdonképpen ugyanezen test feletti

(

)



0 

 

a n

 1

x n

 1 alakú polinomoknak tekinthetők.

Def.

A kód

generátormátrixa

az altér egy bázisa lesz, úgy hogy darab sorvektorként írjuk a báziselemeket.

Tehát kapunk egy

G k



-es mátrixot.

Az előbbi

-dimenziós altér

ortogonális altere

rendelkezik azzal a tulajdonsággal, hogy a benne lévő vektorok szorzata egy altérbeli vektorral mindig 0-t ad.

Hasonlóan

-hez, megkonstruálunk egy

(

–

) 

-es

ellenőrző mátrixot

, amelyben az ortogonális altér bázisvektorai vannak. Ekkor



G T

 0 , ahol

G T

mátrix transzponáltja.

Hogyan azonosítjuk a kódszavakat?

Tegyük fel, hogy a kapott szavunk



K n

Szorzunk a

ellenőrző mátrixszal, kódszó esetén azt kell kapjuk, hogy







0 .

szindróma (hibajellemző) Megfelelően megkonstruált kód esetén, valamennyi hiba erejéig a kapott szorzat vektor el is tudja árulni, hogy hol keressük a hibát.

Cyclic Redundancy Check (CRC) F

2 -ből indulunk ki, tehát a kételemű testből, így az üzenetszó, illetve a kódszó is bitekből fog állni.

Legyen a kódolni kívánt üzenet

hosszú, ekkor

 2





redundáns bitek száma Veszünk egy

-edfokú polinomot, amely az úgynevezett

g kódpolinom

hosszúságú üzenetszót kiegészítjük jobbról

0-val

hosszúságúra.

Az így kapott szót (polinomot) osztjuk a kódpolinommal maradékosan, a maradékot beírjuk az előbbi 0-k helyére az üzenetszó után.

Kapjuk a kódszót, amely rendelkezik azzal a jó tulajdonsággal, hogy osztható a kódpolinommal 

hibaellenőrzéskor

a kapott szót, azaz a neki megfelelő polinomot osztani kell a kódpolinommal, és ha a maradék polinom 0, akkor kódszót kaptunk.

Kihasználtuk, hogy a kételemű testben 1 = – 1:

Tehát, ha az üzenetpolinom

(

) 

x m

(

) 

(

) +

(

) a kódpolinom:

(

) 

(

) =

(

) 

x m

–

(

) =

(

) 

x m

(

) .

40 Példa:

legyen



2

3 

8 ,



3 ,



5 ,

továbbá az üzenet 101, és a kódpolinom

5 

2 

1 .

(

)

(

) 

x m

101



10100000



7 

5 

7 

5  

5 

2 

1

  

2 

1

 

4 

1



(

)

4 

1



10001

végül a kódszó:

(

) 

(

) redundáns bitek

10110001

Végezzük el a hibaellenőrzést is. A kódszónak megfelelő polinom

10110001



7 

5 

4 

1

Ezt a polinomot osztjuk most a kódpolinommal maradékosan: 

7 

5 

4 

1

 

5 

2 

1

 

2 

1

 

0 .

Példák a mindennapi életben gyakran használt CRC-kódpolinomra.

Hamming-kód

A kódot, amely pontosan 1-hibajavító, példán keresztül mutatjuk be.

F 2

felett dolgozunk, így vektoraink komponensei bitek. Legyen

 2 ,

 2

 1 ,





Készítünk egy



-es mátrixot az oszlopokba alulról felfelé vezető nullákkal ellátva felírjuk a számokat egytől

-ig, bináris formában. Tehát

= 3 esetén:

Ez lesz a

ellenőrző mátrix, de a kódokat is ezzel generáljuk, hiszen azok a

vektorok kerülnek be a kódba, amelyekre



v =

Vegyük észre, hogy a kettő hatványokban (2

) pontosan 1 darab 1-es van, mégpedig az

-edik helyen.



-es egységmátrix tartalmazza a redundáns biteket, a többi soronként

darab bit lesz a „közlemény”.

Könnyen ellenőrizhető, hogy a

  0 , 0 , 0 , 1 , 1 , 1 , 1  szó kódszó, mivel

H v T

  0 , 0 , 0 

Mi a helyzet az

  0 , 0 , 0 , 1 , 1 , 1 , 0  szóval?

nem kódszó, és a hibavektor

 

0 , 0 , 0 , 0 , 0 , 0 , 1 ,

 azaz





 

0 , 0 , 0 , 1 , 1 , 1 , 1 0 , 0 , 0 , 0 , 0 , 0 , 1 0 , 0 , 0 , 1 , 1 , 1 , 0 .

 Végezzük el a számolást:

H u T

  

.

Az 111 bitsorozat tízes számrendszerben felírva 7.

7  0  hiba van. Azt is megkaptuk, hogy a hiba a 7. helyen van a kapott szóban, tehát tudunk javítani.

A kódszavakat hogyan határozhatjuk meg?

Ha a

hosszúságú üzenet

1 …

b k

, akkor az

bit hosszú kódszóba először tegyük be kiszámítandó redundáns biteket a pontosan

–

darab 2-hatvány helyre.

Ez az előző példában az 1., 2., 4. helyet jelenti. A maradék helyekre pedig beszúrjuk az üzenet

darab bitjét.

Ekkor a kapott

vektor transzponáltját H-val szorozva:

Hc T

 0 .

A Hamming-kód esetén a maximális üzenethosszak

 2



 1 , azaz 4 , 11 , 26 , 57 , 120 , 247 , 502 , 1013 , 2036 , 4083 

Kiegészítõ diák

Transcript Kiegészítõ diák

,

,

,...,

1 .

(

,...,

)

log

.

1 ,

,

,

(

)

0 .

2

8 ,

3 ,

5 ,

1 .

101

10100000

1

1

1

1

10001

10110001

10110001

1

1

1

1

0 .

0 , 0 , 0 , 0 , 0 , 0 , 1 ,

0 , 0 , 0 , 1 , 1 , 1 , 1 0 , 0 , 0 , 0 , 0 , 0 , 1 0 , 0 , 0 , 1 , 1 , 1 , 0 .

.

Directory