Мультимедиа технологии. Лекция 1. Введен
Download
Report
Transcript Мультимедиа технологии. Лекция 1. Введен
Мультимедиа технологии.
Лекция 2. Составляющие мультимедиа. Текст
Антон Викторович Кудинов,
доцент кафедры ВТ
Содержание
Историческое значение текста
Текст и символы
Кодирование и стандарты
Шрифты
Типографская терминология
Форматы текстовых файлов
Концепция гипертекста
2
Историческое значение текста
В доисторические времена смысл
послания передавался в виде
набора рисунков
Самые ранние письменные памятники появились на
юге Месопотамии (современного государства Ирак) в
конце IV тысячелетия до н.э.
Паек для гонца.
… 5 литров пива, 3 литра
хлебной похлебки, 3/60
литра лука, 3/60 литра
масла, 2/60 литра мыльного
корня…
© http://www.hermitagemuseum.org
3
Текст и символы
Различают:
лексическое содержимое текста
внешний вид текстового фрагмента
А также:
T
абстрактный символ
графическое представление символа
T T T T T T T T TT T
4
О,Боже!
Боже! Космические
О,
Космические
О,
Боже!
Космические
пришельцы! Не
пришельцы!
Неешьте
ешьте
пришельцы!
ешьте
меня.
жена,
дети.
меня.
У меня
жена,
меня.
УУ меня
дети.
Съешьте
их!
дети.
Съешьте
Съешьте
их! их!
Символы и алфавиты
Абстрактные символы группируются в алфавиты
5
традиционные фонетические алфавиты
идеографическая система записи
промежуточные слоговые алфавиты (корейский)
Алфавиты и кодовые точки
В математике алфавит – множество символов
Символ – кодовое значение из набора кодовых точек
АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЫЪЭЮЯ
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
A B C D E F G H I J K L M N O P Q R ST UV W XY Z
1 .. 6000
6
Стандарт ASCII
American Standard Code for Information Interchange
7 бит → 128 кодовых точек
95 знаков
0..31 и 127 – управляющие символы
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
7
пробел
!
''
#
$
%
&
‘
(
)
*
+
,
.
/
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
0
1
2
3
4
5
6
7
8
9
:
;
<
=
>
?
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
@
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
P
Q
R
S
T
U
V
W
X
Y
Z
[
\
]
^
_
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
`
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
p
q
r
s
t
u
v
w
x
y
z
{
|
}
~
Escape
ASCII и ISO
1972 г. ASCII принят как стандарт ISO 646
национальные версии стандарта (ISO 646-US) –
проблемы совместимости
решение – увеличение числа кодовых точек
(8 бит → 255 кодовых точек)
нижняя половина – ISO 646-US, верхняя половина –
национальные наборы символов
стандарт ISO 8859, Latin1
недостатки:
8
мало кодовых точек для идеографических алфавитов
нельзя одновременно работать с несколькими языками
ISO 10646
256 групп по 256 плоскостей по 256 строк из 256
символов
32-битные кодовые точки (g,p,r,c)
(0,0,0,*) = ISO Latin1
9
Unicode
16 бит → 65536 кодовых точек
CJK-consolidation (Chinese, Japanese and Korean)
Содержит:
символы нескольких десятков алфавитов
идеограммы и силлабические шрифты китайского, японского и
корейского языков
знаки пунктуации, технические и математические символы
стрелки и декоративные символы
диакритические знаки и др.
сейчас распределены 39 000 кодовых точек
6400 кодовых точек – Private Use Area
1991 г. – согласованы Unicode и ISO 10646
(0,0,*,*) – Basic Multilingual Plane (BMP) = Unicode
10
Кодирование
преобразование кодового значения в последовательность
байтов для хранения и передачи
схема Quoted-Printable (QP) – представление 8-битных
символов как последовательности 7-битных символов
Символ é (233(10)=Е9(16) в ISO Latin1) записывается как =Е9
схема ISO 10646 UCS-4 (Universal Character Set)
– 4 байта на символ
схема ISO 10646 UCS-2
– отброшены 2 байта (= Unicode)
3 схемы для Unicode - UCS Transformation Formats (UTF)
UTF-8, UTF-7, UTF-16
11
Шрифты и их свойства
Глиф (glyph) – визуальное представление формы
символа.
Шрифт (font, type) – набор глифов (литер)
определенного алфавита со знаками препинания,
цифрами и другими символами.
Кегль – основной размер, характеризующий шрифт,
т.е. размер литер, шпаций и других наборных
материалов, измеряемый в направлении высоты
полосы набора.
ПРОПИСНЫЕ и строчные буквы
12
Типографская система мер
Разработана французом Дидо в 1785 г.
При компьютерном наборе используется англоамериканский типографский пункт (point, pt)
1 пункт (п.) = 1/72 фр. дюйма 0,376 мм
1 цицеро (1 циц.) = 12 п. 4,5 мм
1 квадрат (1 кв.) = 4 циц. = 48 п. 18 мм
1 pt = 0,9348 п. = 0,353 мм
1 п. = 1,07 pt
1 pica (pc) = 12 pt = 4,23 мм
Таким образом, французские единицы больше
соответствующих англо-американских на 7%
13
Параметры шрифтов
Ширина литеры. Разделяют шрифты:
моноширинные (Courier New)
пропорциональные (Times New Roman)
Плотность шрифта определяется
отношением ширины знаков типа "н", "п",
"и" строчных к их высоте (в процентах).
Для нормальных шрифтов 10 п. - 60 - 85%.
Насыщенность шрифта определяется
отношением толщины основного штриха
знаков к высоте строчных букв.
Для светлых шрифтов 10 п. - не более 23 %.
14
Виды начертаний шрифтов
по наклону:
прямые (normal), курсивные (italic) и НАКЛОННЫЕ (slanted)
по плотности:
по насыщенности (весу):
светлые (normal), полужирные (bold) и жирные
КАПИТЕЛЬ
– В КАЧЕСТВЕ СТРОЧНЫХ БУКВ ИСПОЛЬЗУЮТСЯ
УМЕНЬШЕННЫЕ ВЕРСИИ ПРОПИСНЫХ
15
Виды шрифтов
шрифты
с засечками (Roman)
каллиграфические
рукописные
фантазийные
16
H
Выбор шрифтов
Для больших фрагментов текста предпочтительно
использовать пропорциональные шрифты
нормального веса и насыщенности
При низком разрешении шрифты с засечками лучше
не использовать
Для выделения фрагмента в печатном тексте лучше
использовать курсив, а в электронном – полужирность
Моноширинные шрифты используются для:
17
фрагментов компьютерного кода
заголовков и акцентированного выделения фрагментов
Выбор шрифтов (продолжение)
Каллиграфические, рукописные и фантазийные
шрифты используются только для короткого,
изолированного текста, требующего привлечь
внимание
На одной «странице» стараются избегать
использования более 3-х шрифтов
Хорошо сочетаются между собой шрифты одного
семейства (гарнитуры) разных начертаний, либо
совершенно различные шрифты
Хуже всего сочетаются похожие, но неодинаковые
шрифты
18
Выбор шрифтов (продолжение)
Удобочитаемость «текстового» шрифта зависит от его
«знакомства» читателю, они более консервативны
Мода на заголовочные, «экранные» шрифты быстро
проходит
На экране следует :
19
избегать больших объемов слитного текста
не использовать выравнивание по ширине
использовать шрифты бóльшего, по сравнению с печатным
текстом, размера (≈ на 60%)
использовать формы выделения, подходящие для низкого
разрешения (полужирность, цвет, фон)
Технологии цифровых шрифтов
растровые (практически не используются)
векторные
Стандарты:
Type 1 от Adobe (PostScript) – основан на кубических
кривых Безье
TrueType – основан на кривых второго порядка (опорные
точки и кривые, описывающие форму контура литеры)
оба формата поддерживают до 256 глифов в одном
шрифтовом файле
OpenType – межплатформенный формат, большее
количество глифов с большей детальностью
20
Форматы текстовых файлов
ANSI (.TXT)
Microsoft Word (.DOC, .DOCX)
Rich Text Format (.RTF)
Hyper Text Markup Language (.HTML)
Portable Document Format (.PDF)
LaTeX (.TEX)
21
Гипертекст и гипермедиа
1945 г. – концепция организации памяти «MEMEX»,
Ваннивер Буш, США – ассоциативный принцип
организации больших массивов информации
рубеж 60-70-х годов – проект Xanadu, Тед Нельсон –
объединение всей мировой литературы,
возникновение термина «гипертекст»
1987 г. – программа HyperCard от Apple – первое
массовое внедрение технологии, язык HyperTalk
1991 г. – HTML, World Wide Web
22
Спасибо за внимание!
23
[email protected]