Karakterek ábrázolása

Download Report

Transcript Karakterek ábrázolása

Karakterek ábrázolása
• A karakterek kódolásának elve
• Az ASCII, Unicode kódolási rendszerek elvei,
előnyök, hátrányok
• A bittérképes betűképtárolás elve
• A bittérképes betűképtárolás alkalmazása,
előnyök, hátrányok
• A kontúrvonalas betűképtárolás elve
• A kontúrvonalas betűképtárolás alkalmazása,
előnyök, hátrányok
Karakter kódolás elve:
• A számítógép és a külvilág, vagy egy másik
számítógép közötti kapcsolat megvalósítása során
az információk átvitele kódolva történik. A
bitcsoportoknak - amelyek elvileg tetszőleges
számú bitből állhatnak - jelentést tulajdonítunk
akkor kódolást végzünk.
• Az információátvitele során ezeket a
bitcsoportokat továbbítjuk és a vevő oldalon a
jelentésének megfelelően értelmezzük
(dekódoljuk).
• Egy karakter kódtábla vagy karakterkészlet (néha használják a code
page kifejezést) egy párokból álló sorozat.
– egyik eleme a kód
– a másik pedig egy adott halmaz egy karaktere
• A pár kód része általában egy egész szám, vagy azok sorozata, byte
vagy azok sorozata, vagy elektromos impulzus, vagy bármi egyéb, amit
a számítógép tárolójában szövegként tárolni lehet, illetve adatátviteli
hálózaton, mint szöveg, továbbítható. Egy mindenki által ismert példa
erre a Morzekód: ami betűkhöz latin ábécé a távíró billentyű rövid vagy
hosszú lenyomását rendeli.
Az ASCII Kódrendszer
American Standard Code for Information Interchange
• Az ASCII, amely betűk, számok és más
szimbólumokhoz rendelt integer, amelyet egy
7-bites bináris számként értelmez. Általában
ezt a 7-bites számot kiegészítik egy külön 0
bittel, így 8-bites byte formában tárolják, és
kezelik.
• Az ASCII karakterkészlet 128 hétbites,
különböző kódot tartalmaz, amelyik
mindegyike egy egyedi karaktert reprezentál.
Az ANSI szabvány az ASCII karakterkészlet
definiálásakor a kódokat két fő csoportba osztotta:
grafikus karakterek és vezérlő karakterek csoportjába.
• 1. Grafikus karakterek alatt a megjeleníthető, látható,
nyomtatható karaktereket értjük.
• 2. A vezérlőkarakterek: a vezérlő karakterek, a
megjelenítés vezérlésére, formájának kialakítására,
valamint az információcsere vezérlésére szolgálnak.
• három kategóriába soroljuk:
• - információcsere vezérlők,
• - formátumot befolyásolók
• - információ elkülönítők.
• Az első 32 karakter, és az utolsó DEL karakter tartozik
ezekbe a kategóriákba.
• ASCII után először az úgynevezett Latin-1 kódolás
terjedt el, ami tartalmazza az összes angol nyelvhez
szükséges betűt, illetve számos európai nyelv betűit, de
például a magyar „ő” és „ű” betűket nem (ezek helyett
– helytelenül – gyakran használják a hullámos illetve a
kalapos betűket: û ô vagy õ). Magyarhoz lehet azonban
a Latin-2 (közép-európai) kódolást is használni, ami
ismeri az ő és ű betűinket, de nem ismer más fontos
betűket, például a cirill, görög, vagy például az örmény,
indiai, arab és héber betűket, a kínai írásjegyeket és a
japán kanákat
Az UNICODE:
• Az Unicode nemzetközi szabvány (ejtsd:
unikód vagy junikód) a különböző
írásrendszerek egységes kódolását és
használatát írja le. Az Unicode nem csak a
kódolással, hanem a karakterek
osztályozásával, megjelenítésével és
használatával is részletesen foglalkozik.
• A Unicode szabvány 16 biten tárolt síkokra
osztja a szabvány legutóbbi változatában
rögzített mintegy 100 ezer karaktert.
Legelterjedtebb kódolásai
• (UTF - Unicode Transformation Format)
– UTF32 -4 bájtos (32 bites)
– UTF16- 16 v. 32 bites (változó hosszúságú)
– UTF8- 8 bites
Unicode 1.0 kódrendszer a világ
összes írott ABC-jének kódolását
tartalmazza.
UNICODE előnyei:
• 1. Teljesség Az Unicode-t úgy tervezték, hogy
a szövegek létrehozásához használt összes
karaktert tartalmazza, ebbe még olyan "holt"
nyelvek is beletartoznak mint pl. a szankszkrit.
• 2. Egyszerűség és hatékonyság Minden
Unicode kód azonos, 16 bites hosszúságú és
mindegyik egy tényleges létező karaktert
reprezentál. Nincsenek sem vezérlő kódok sem
vezérlő kódsorozatok. Ezek mind
bonyolultabbá teszik a számítógépes
szövegkezelést és feldolgozást.
• 3. Egyértelműség Minden kód egyértelműen
egy karaktert jelent. Ezért egy karakter hibás
olvasásakor csak egy a hibás és nincs előre
mutató következménye.
• 4. Pontosság Minden kódolt karakter
szabványos, a nyelvi szakértõk által ismert és
elfogadott.
Betűábrázolás:
Betűábrázolás:
• A tipográfiában a betűkép egy összhangba
hozott betűterv sorozat, ami egy teljes ábécét
alkot, amelyet nyomtatásban vagy a
számítógép képernyőjén meg lehet jeleníteni.
• A betűtípus betűrajzolatok sorozata, melyek
egy bizonyos betűképen belüli karaktereket
írnak le egy karakterkészletben.
• Betűcsaládnak nevezzük az azonos grafikus
jellemzőkkel és formai sajátosságokkal
rendelkező betűk összességét
A digitális betűtípusokban a karakterek
képeit kétféleképpen lehet ábrázolni:
• 1. bittérképként (bittérképes betűtípus)
• 2. vagy jobb minőségű, görbékből álló
kontúr-betűtípusként („vektoros betűtípus”).
A Windows operációs rendszerben
megtalálhatjuk
• - a TrueType, méretezhető vektorbetűket
(kiterjesztésük .ttf)
• - és a bittérképes rendszerfontokat
(kiterjesztésük .fon).
A lényeges különbség közöttük:
• - A raszteres betűk megjelenítése egy az egyben a
letárolt képpont-információk alapján történik,
• - A vektoros betűk méretezhetők, azaz ha egy
vektoros betű méreteit megadjuk, akkor a
betűcsaládnak megfelelő programrész először
kiolvassa a betű körvonal információit és kiszámítja,
hogy az adott méretben a vonalak hol helyezkednek
el, így megkapja a betű határoló körvonalait, ebből
határozza meg a megjelenítéskor érintett pixeleket.
Bittérképes ábrázolás:
• A képek, betűk, ábrák stb. meghatározott számú
képpontokból (pixelekből) állnak. (raszter Font) A
meghatározott számú kifejezés azt jelenti, hogy nagyításkor a
képet alkotó pixelek (négyzetek) mérete, és nem a száma
változik, pixelesedik a kép.
• Pixel: képpont. képpont, a bittérképes kép legkisebb önálló
eleme. A letapogatott képeredeti vagy a monitor egy pontja,
amelyen belül minden elemi felület fénytani tulajdonságát
azonosnak vesszük, vagyis a pixel által határolt felület egy
átlag értéket képvisel, ha valamilyen tulajdonságát fénytani
adatokkal adjuk meg
Raszter font jellemzői
• Raszter font: a betű alakját raszterkép-ként
tárolja
–felbontás egyszer és mindenkorra meghatározott,
–külön képernyő-és nyomtató betűkészlet szükséges
az eltérő felbontás miatt,
–minden betűmérethez (fokozathoz) külön készlet
kell,
+felbontáshoz, mérethez optimalizálható a betű
alakja (főleg kis méreteknél fontos).
Körvonalas betűkészletek
• Körvonalas font: az egyes betűk kontúrját Bèzier-görbék
segítségével írja le, a belsejét kitölti (pl. Open-Type, TrueType,
Type1 fontok)
– +tetszőlegesen kicsinyíthető, nagyítható, elforgatható,
torzítható,
– +ugyanaz a leírás használható a kép-ernyőn való
megjelenítéshez és nyomtatáshoz,
– +alávágási táblázat (kerningtable),
– –torzítások eredménye sokszor kétséges,
– –képernyőn kis méretben olvashatatlan(helyettesítő
bitmapfont kell),
– –kis méretben nem ad arányos betűképet.
Bèzier-görbe
• Vektor font:
-A betű alakját a középvonallal írja le
nincs kitöltés,
-egyébként minden igaz rá, ami a körvonalas
fontokra,
-CAD programok használják
VÉGE
Betűcsaládok, betűváltozatok
• A font fogalma
• A Type 1 típusú font állományai, az
állományokban tárolt adatcsoportok
• A True type fontok sajátosságai
• Az Open type fontok sajátosságai
• A fontok alkalmazásának jogi vonatkozásai
• A fontok telepítése, aktiválása, deaktiválása
fontkezelő programokkal
• A fontokkal kapcsolatos teendők nyomtatáskor
A font fogalma:
• A számítógépen egy-egy fájlban rögzített
névvel ellátott karakterek összessége.
• Font alatt mindig egy jelkészletet értünk, melyben
lehetnek betűk, számok, matematikai szimbólumok
stb. Ha szöveges információk kezeléséről van szó,
akkor a font mindig egy betűkből álló jelkészletet
jelent.
Betűcsalád fogalma
• Betűcsaládnak nevezzük az azonos grafikus
jellemzőkkel és formai sajátosságokkal
rendelkező betűk összességét.
Betűtípusok
•
A karakterek több féle típusúak lehetnek.
• Ez azt jelenti, hogy a különböző
betűtípusokhoz tartozó karaktereknek más az
alakja (például van talpa a betűknek vagy
nincs, milyen formán hajlanak az ívek,
mennyire díszes vagy hivatalos kinézetűek a
jelek).
Szövegformázási szempontból a
betűtípusok két nagyobb
csoportra oszthatók:
Szöveg
talpas és
talpatlan betűket.
reklámbetűk
Betűválasztási szabályok:
• Mindig a szöveg határozza meg, milyen betűtípust
alkalmazunk.
• Hosszabb szöveget általában nem reklámbetűkkel
írunk.
• A hosszú szövegekhez használjunk talpas betűket
(Serif), mert jobban olvashatóak, a betűk alján, illetve
tetején levő kis vonalkák ugyanis vezetik a szemet.
• A talpatlan betűket (Sans Serif) elsősorban címekhez,
rövid szövegekhez használjuk.
Elterjedt betűtípusok
• TrueType betűtípus
• a TrueType, méretezhető vektorgrafikus
betűcsalád (kiterjesztésük .ttf)
• Minden betűtípusnak saját neve van, amely
azonosítja: pl. a Times New Roman, Arial,
Courier New, Brush Script, Algerian, Verdana,
Garamond, Desdemona
• "TrueType" fogalma.
• Jelentése: úgy néz ki a monitoron, ahogy a
nyomtatón fog.
• Ez elméletileg igaz, gyakorlatilag nem 100 %,
különösen a gyengébb nyomtatók esetén.
• Az OpenType az Adobe és a Microsoft által
kifejlesztett keresztplatformos betűformátumleírás. Az OpenType alapja az Unicode,
valójában a TrueType „sfnt” (leíró rész,
amelynek alapján görbékből megrajzolható a
betű, az adatok további információt adnak
kódjára, méretezésére, elnevezésére,
PostScriptbesorolására, kernelésére stb.
nézve).
• Formátumának továbbfejlesztett változata,
amely támogatja a PostScript
betűformátumot, és újabb tipográfiai
beállításokat kínál. A TrueType betű .ttf vagy
.ttc kiterjesztésű, amíg a PostScript alapú
OpenType állomány .otf végződésű.