Мультимедиа технологии. Лекция 1. Введен

Download Report

Transcript Мультимедиа технологии. Лекция 1. Введен

Мультимедиа технологии.
Лекция 2. Составляющие мультимедиа. Текст
Антон Викторович Кудинов,
доцент кафедры ВТ
Содержание
Историческое значение текста
 Текст и символы
 Кодирование и стандарты
 Шрифты
 Типографская терминология
 Форматы текстовых файлов
 Концепция гипертекста

2
Историческое значение текста

В доисторические времена смысл
послания передавался в виде
набора рисунков

Самые ранние письменные памятники появились на
юге Месопотамии (современного государства Ирак) в
конце IV тысячелетия до н.э.
Паек для гонца.
… 5 литров пива, 3 литра
хлебной похлебки, 3/60
литра лука, 3/60 литра
масла, 2/60 литра мыльного
корня…
© http://www.hermitagemuseum.org
3
Текст и символы

Различают:



лексическое содержимое текста
внешний вид текстового фрагмента
А также:


T
абстрактный символ
графическое представление символа
T T T T T T T T TT T
4
О,Боже!
Боже! Космические
О,
Космические
О,
Боже!
Космические
пришельцы! Не
пришельцы!
Неешьте
ешьте
пришельцы!
ешьте
меня.
жена,
дети.
меня.
У меня
жена,
меня.
УУ меня
дети.
Съешьте
их!
дети.
Съешьте
Съешьте
их! их!
Символы и алфавиты
Абстрактные символы группируются в алфавиты




5
традиционные фонетические алфавиты
идеографическая система записи
промежуточные слоговые алфавиты (корейский)
Алфавиты и кодовые точки
В математике алфавит – множество символов
Символ – кодовое значение из набора кодовых точек


АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЫЪЭЮЯ
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
A B C D E F G H I J K L M N O P Q R ST UV W XY Z
1 .. 6000
6
Стандарт ASCII




American Standard Code for Information Interchange
7 бит → 128 кодовых точек
95 знаков
0..31 и 127 – управляющие символы
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
7
пробел
!
''
#
$
%
&
‘
(
)
*
+
,
.
/
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
0
1
2
3
4
5
6
7
8
9
:
;
<
=
>
?
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
@
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
P
Q
R
S
T
U
V
W
X
Y
Z
[
\
]
^
_
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
`
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
p
q
r
s
t
u
v
w
x
y
z
{
|
}
~
Escape
ASCII и ISO
1972 г. ASCII принят как стандарт ISO 646
национальные версии стандарта (ISO 646-US) –
проблемы совместимости
решение – увеличение числа кодовых точек
(8 бит → 255 кодовых точек)
нижняя половина – ISO 646-US, верхняя половина –
национальные наборы символов
стандарт ISO 8859, Latin1
недостатки:







8
мало кодовых точек для идеографических алфавитов
нельзя одновременно работать с несколькими языками
ISO 10646
256 групп по 256 плоскостей по 256 строк из 256
символов
32-битные кодовые точки (g,p,r,c)
(0,0,0,*) = ISO Latin1



9
Unicode






16 бит → 65536 кодовых точек
CJK-consolidation (Chinese, Japanese and Korean)
Содержит:
 символы нескольких десятков алфавитов
 идеограммы и силлабические шрифты китайского, японского и
корейского языков
 знаки пунктуации, технические и математические символы
 стрелки и декоративные символы
 диакритические знаки и др.
сейчас распределены 39 000 кодовых точек
6400 кодовых точек – Private Use Area
1991 г. – согласованы Unicode и ISO 10646
(0,0,*,*) – Basic Multilingual Plane (BMP) = Unicode
10
Кодирование

преобразование кодового значения в последовательность
байтов для хранения и передачи

схема Quoted-Printable (QP) – представление 8-битных
символов как последовательности 7-битных символов

Символ é (233(10)=Е9(16) в ISO Latin1) записывается как =Е9
схема ISO 10646 UCS-4 (Universal Character Set)

– 4 байта на символ

схема ISO 10646 UCS-2
– отброшены 2 байта (= Unicode)

3 схемы для Unicode - UCS Transformation Formats (UTF)
UTF-8, UTF-7, UTF-16
11
Шрифты и их свойства




Глиф (glyph) – визуальное представление формы
символа.
Шрифт (font, type) – набор глифов (литер)
определенного алфавита со знаками препинания,
цифрами и другими символами.
Кегль – основной размер, характеризующий шрифт,
т.е. размер литер, шпаций и других наборных
материалов, измеряемый в направлении высоты
полосы набора.
ПРОПИСНЫЕ и строчные буквы
12
Типографская система мер

Разработана французом Дидо в 1785 г.




При компьютерном наборе используется англоамериканский типографский пункт (point, pt)




1 пункт (п.) = 1/72 фр. дюйма  0,376 мм
1 цицеро (1 циц.) = 12 п.  4,5 мм
1 квадрат (1 кв.) = 4 циц. = 48 п.  18 мм
1 pt = 0,9348 п. = 0,353 мм
1 п. = 1,07 pt
1 pica (pc) = 12 pt = 4,23 мм
Таким образом, французские единицы больше
соответствующих англо-американских на 7%
13
Параметры шрифтов

Ширина литеры. Разделяют шрифты:




моноширинные (Courier New)
пропорциональные (Times New Roman)
Плотность шрифта определяется
отношением ширины знаков типа "н", "п",
"и" строчных к их высоте (в процентах).
Для нормальных шрифтов 10 п. - 60 - 85%.
Насыщенность шрифта определяется
отношением толщины основного штриха
знаков к высоте строчных букв.
Для светлых шрифтов 10 п. - не более 23 %.
14
Виды начертаний шрифтов

по наклону:

прямые (normal), курсивные (italic) и НАКЛОННЫЕ (slanted)

по плотности:

по насыщенности (весу):

светлые (normal), полужирные (bold) и жирные
 КАПИТЕЛЬ
– В КАЧЕСТВЕ СТРОЧНЫХ БУКВ ИСПОЛЬЗУЮТСЯ
УМЕНЬШЕННЫЕ ВЕРСИИ ПРОПИСНЫХ
15
Виды шрифтов
 шрифты
с засечками (Roman)
 каллиграфические
 рукописные
 фантазийные
16
H
Выбор шрифтов




Для больших фрагментов текста предпочтительно
использовать пропорциональные шрифты
нормального веса и насыщенности
При низком разрешении шрифты с засечками лучше
не использовать
Для выделения фрагмента в печатном тексте лучше
использовать курсив, а в электронном – полужирность
Моноширинные шрифты используются для:


17
фрагментов компьютерного кода
заголовков и акцентированного выделения фрагментов
Выбор шрифтов (продолжение)




Каллиграфические, рукописные и фантазийные
шрифты используются только для короткого,
изолированного текста, требующего привлечь
внимание
На одной «странице» стараются избегать
использования более 3-х шрифтов
Хорошо сочетаются между собой шрифты одного
семейства (гарнитуры) разных начертаний, либо
совершенно различные шрифты
Хуже всего сочетаются похожие, но неодинаковые
шрифты
18
Выбор шрифтов (продолжение)



Удобочитаемость «текстового» шрифта зависит от его
«знакомства» читателю, они более консервативны
Мода на заголовочные, «экранные» шрифты быстро
проходит
На экране следует :




19
избегать больших объемов слитного текста
не использовать выравнивание по ширине
использовать шрифты бóльшего, по сравнению с печатным
текстом, размера (≈ на 60%)
использовать формы выделения, подходящие для низкого
разрешения (полужирность, цвет, фон)
Технологии цифровых шрифтов



растровые (практически не используются)
векторные
Стандарты:
 Type 1 от Adobe (PostScript) – основан на кубических
кривых Безье
 TrueType – основан на кривых второго порядка (опорные
точки и кривые, описывающие форму контура литеры)
 оба формата поддерживают до 256 глифов в одном
шрифтовом файле
 OpenType – межплатформенный формат, большее
количество глифов с большей детальностью
20
Форматы текстовых файлов
ANSI (.TXT)
 Microsoft Word (.DOC, .DOCX)
 Rich Text Format (.RTF)
 Hyper Text Markup Language (.HTML)
 Portable Document Format (.PDF)
 LaTeX (.TEX)

21
Гипертекст и гипермедиа




1945 г. – концепция организации памяти «MEMEX»,
Ваннивер Буш, США – ассоциативный принцип
организации больших массивов информации
рубеж 60-70-х годов – проект Xanadu, Тед Нельсон –
объединение всей мировой литературы,
возникновение термина «гипертекст»
1987 г. – программа HyperCard от Apple – первое
массовое внедрение технологии, язык HyperTalk
1991 г. – HTML, World Wide Web
22
Спасибо за внимание!

23
[email protected]