3. Лекция №3 "Кодирование информации"

Download Report

Transcript 3. Лекция №3 "Кодирование информации"

Кодирование
информации
Кодирование – процесс преобразования (букв)
символов одного алфавита в буквы (слова)
другого алфавита.
Код (от французского code –
кодекс, свод законов) – правило
отображения информации.
28.10.10
122222222222222 1, 2, 3, ….
28.10.10
КОД ЦЕЗАРЯ
28.10.10
http://qrco der.ru/co de/?Irina+ S am o ilo & 3& 0
Генератор QR кодов
Что такое QR-код:
«QR - Quick Response - Быстрый Отклик» — это двухмерный
(матричный)штрихкод (бар-код), предоставляющий информацию для
быстрого ее распознавания с помощью камеры на мобильном телефоне.
При помощи QR-кода можно закодировать
любую информацию,
http://qrcoder.ru
например: текст, номер телефона, ссылку на сайт или визитную карточку.
QR код
Ваш QR-код: Irina Samoilo
28.10.10
Современный компьютер может
обрабатывать числовую,
• текстовую,
• графическую,
• звуковую
•
и видео информацию.
28.10.10
28.10.10
Компьютерное представление
чисел
• Компьютер оперирует с двоичными числами.
• Любая вводимая информация должна быть представлена
в виде двоичного кода.
• Когда пользователь вводит с клавиатуры десятичные
числа, они сразу преобразуются в двоичные числа (это
процесс кодирования).
Для кодирования чисел используются
1,2,4,8,16 байт
Количество информации в
двоичном коде равно
общему числу 0 и 1.
Пример: Число 11000011
содержит
8 бит информации.
28.10.10
Количество знаков
в коде –длина
кода в знаках.
Хранение целого числа без знака:
Минимальное число при этом соответствует 8 нулям
(00000000)=0, максимальное – 8 единиц
(11111111)= 1⋅20 + 1⋅21 +1⋅22 +1⋅23 +1⋅24 +1⋅25
+1⋅26 +1⋅27 = 25510. С помощью 2-х байт (16-и бит
или разрядов) можно представить 216 = 65536
целых чисел: например, от 0 до 65535.
Для хранения целых чисел со знаком отводится 2
байта памяти.
28.10.10
СПЕЦИАЛЬНЫЕ КОДЫ: прямой( для хранения положительных
чисел), обратный, дополнительный (для хранения
отрицательных чисел)
• При хранении числа один
бит(крайний левый)
отводится под знак числа.
• Старший разряд называется
знаковым.
• Прямой двоичный код –
такое представление
двоичного числа, при
котором знак плюс
кодируется нулём в
старшем разряде числа, а
знак минус- единицей:
-510=1.101; +510=0.101
28.10.10
Обратный код – для
отрицательных чисел
( единицы незнаковых разрядов
заменяются нулями, а нули
единицами).
-510=1.010
Дополнительный код - для
отрицательных чисел
(получается из обратного
добавлением единицы к
младшему разряду)
-510=1.011
Определите соответствие между выражением
в дополнительном двоичном коде:
1)0.1001+ 0.0010
28.10.10
(-9-2) и выражением
2)1.0111+1.1110
Действительные числа кодируются (представляются) в
формате с плавающей запятой, использующем
нормализованную (экспоненциальную) форму
записи числа, с помощью 4 байт (обычная
точность) или 8 байт (двойная точность).
Число в экспоненциальной форме представляется в
виде
А=
n
m⋅q ,
Где m – мантисса числа (правильная, отличная от нуля
дробь);
q – основание системы счисления;
n – порядок числа.
28.10.10
Пример: Число (например, число Авогадро)
представляется в нормализованной форме 6,0221415*1023.
Здесь 6,0221415 - мантисса, а 23 - порядок. На мантиссу
(вместе со знаком) приходится большая часть, на порядок
(вместе со знаком) приходится меньшая часть из 32
разрядов.
0,60221415*1024 = 0,60221415E+24.
Кодовые таблицы.
Представление текстовой
(символьной) информации
• Для кодирования текста, вводимого в компьютер,
используется самый простой способ кодировки:
каждому знаку (символу) ставится в соответствие двоичное
число.
• Правила соответствия или правила кодировки записываются
в таблицу, которая называется кодовой (или кодовой
страницей).
ASCII (American Standard Code for Information
Interchange) — американский стандартный код для
обмена информацией (1 символ - 1 байт).
Поскольку с помощью одного разряда (0 или 1) можно
присвоить номера только двум символам, семиразрядные
числа дают возможность перенумеровать 27 = 128 символов
– этого достаточно для кодирования букв английского
алфавита и управляющих и различных специальных
символов: %;:… Если в компьютере нужно поддерживать
два алфавита, то семи разрядов кода недостаточно.
С помощью 1-го байта (8-и битов или разрядов) можно
представить 28 = 256 целых чисел: от 0 до 255.
Максимальное - (11111111)2 =255.
Поэтому для кодирования используется код длиной 8 бит
или 1 байт. Первые 128 кодов предназначены для ASCII(
стандартная и обязательная часть для всех кодовых страниц).
Последующие коды, начиная с 128 и до 255, отдают под
национальный стандарт – являются расшрирениями.
Для русского текста (для кириллицы) есть и другие
кодировки: КОИ-8, Windows-1251 и т.д.
28.10.10
28.10.10
В 90-х годах был разработан стандарт Unicode — стандарт
кодирования символов, позволяющий представить знаки
практически всех письменных языков: в документах Unicode
могут соседствовать китайские иероглифы, математические
символы, буквы греческого алфавита, латиницы и
кириллицы. Первая версия Unicode: 1 символ - 2 байта,
общее число символов 216 = 65 536. С помощью 2-х байт (16и бит или разрядов) можно представить 216 = 65536 целых
чисел: например, от 0 до 65535.
UTF-8 – ПЕРЕМЕННОЕ КОДИРОВАНИЕ
#!/usr/bin/python3
# -*-coding: utf-8 -*import math
A = float(input( 'a= '))
B = float(input( 'b= '))
C = float(input( 'c= '))
D = B*B + 4.0*A*C
if D<0:
print( 'ERROR')
else:
X1 = ( - B + math.sqrt(D))/(2.0*A)
X2 = ( - B - math.sqrt(D))/(2.0*A)
print( X1,X2 )
print( 'END' )
28.10.10
28.10.10
28.10.10
28.10.10
Кодирование растровых изображений
Растровое изображение —
изображение,
представляющее собой
сетку пикселей или
цветных точек (обычно
прямоугольную) на
компьютерном мониторе,
бумаге и других
отображающих устройствах
и материалах.
• Пи́ксель (pixel, сокр.
PICture'S ELement, элемент
изображения), пи́ксель —
минимальный участок
изображения, для которого
независимым способом
можно задать цвет.
Важными характеристиками изображения
являются:
• Количество пикселей — может указываться отдельно
количество пикселей по ширине и высоте (1024×768,
640×480 и т. п.) или же общее количество пикселей;
• Количество используемых цветов - палитра;
• Глубина цвета;
• Цветовое пространство (цветовая модель) — RGB,
CMYK, HSB и др.;
•
Важнейшая характеристика растрового изображения –
разрешающая способность растрового изображения,
которая определяется количеством точек по
горизонтали и вертикали на единицу длины
изображения. Величина разрешающей способности
обычно выражается в dpi (dot per inch - точек на дюйм),
т. е. в количестве точек в полоске изображения длиной
один дюйм (1 дюйм = 2,54 см)
Количество цветов =2 битовая глубина цвета
Количество информации, которое
используется для кодирования
точки изображения (пиксела),
называется глубиной цвета
(color depth), или битовой
глубиной цвета (bit depth).
28.10.10
𝑁=2
𝐼
Если изображение формируется на экране монитора, то
главными характеристиками его качества будут глубина
цвета и пространственное разрешение экрана монитора.
Пространственное разрешение Монитор может
экрана монитора
отображать
определяется как
информацию с
произведение количества
различными
строк изображения на
пространственными
количество точек в строке.
разрешениями (800 х
(глубина цвета в битах на
600, 1024 х 768, 1152
пиксель).
х 864 и выше).
28.10.10
Общий объем памяти, необходимый для хранения
неупакованного растрового изображения можно
рассчитать по формуле:
In = I× X×Y,
где In - информационный объем видеопамяти в битах;
X × У - количество точек изображения (X количество точек по горизонтали, Y - по
вертикали); I – число бит, используемое для
хранения кода цвета одного пикселя
28.10.10
Пример . Объём информации, который занимает
неупакованное растровое изображение размером
1024 х 512 точек и глубиной цвета 24 бита равен:
In = I× X×Y = 24 бита × 1024 × 512 = 12582912 бит =
1 572864 байт = 1 536 Кбайт = 1,5 Мбайт.
28.10.10
Глубина цвета и количество цветов в
палитре
28.10.10
Кодирование графических изображений:
глубина цвета и количество цветов в
палитре
Изображения в системах
RGB и оттенках серого
(gray scale) обычно
содержат 8 бит на один
цветовой канал.
Поскольку в RGB три
цветовых канала,
глубина цвета в
этих режимах равна
8* 3 = 24 бит
(True color).
28.10.10
Цвет
Составляющие
K
З
С
Красный
11111111
00000000
00000000
Зеленый
00000000
11111111
00000000
Синий
00000000
00000000
11111111
Голубой
00000000
11111111
11111111
Пурпурный
11111111
00000000
11111111
Желтый
11111111
11111111
00000000
Белый
11111111
11111111
11111111
Черный
00000000
00000000
00000000
28.10.10
RGB Cube
28.10.10
Цвет влюбленной жабы….
28.10.10
Кодирование цвета в полиграфии: система цветопередачи
CMYK ( 32 битовое кодирование)
28.10.10
Модель HSB характеризуется тремя компонентами: оттенок
цвета(Hue), насыщенность цвета (Saturation) и яркость цвета
(Brightness)
Значение цвета выбирается как вектор, выходящий
из центра окружности. Направление вектора
задается в угловых градусах и определяет
цветовой оттенок. Насыщенность цвета
определяется длиной вектора, а яркость цвета
задается на отдельной оси, нулевая точка
которой имеет черный цвет. Точка в центре
соответствует белому (нейтральному) цвету, а
точки по периметру - чистым цветам
28.10.10
.
Цветовые палитры
28.10.10
Кодирование и обработка звуковой
информации
Звук – механическая волна,
распространяющаяся в
какой-либо среде, является
аналоговым (непрерывным
по времени и амплитуде)
сигналом. У аналогово
сигнала физические
величины-характеристики
процесса (давление, сила
тока и т.д.) принимают
множество значений,
причем эти значения
28.10.10
непрерывно меняются.
28.10.10
Звуковые аналоговый и цифровой
сигналы
28.10.10
Четырёхканальный аналого-цифровой
преобразователь (АЦП)
28.10.10
Для кодирования аналогового сигнала
АЦП выполняет семплирование
(оцифровку) звукового сигнала.
Важными параметрами семплирования
являются частота дискретизации
сигнала и глубина квантования сигнала
(разрядность).
28.10.10
Дискретизация сигнала - это измерение с определенной частотой (частотой
дискретизации, частотой семплирования) через равные промежутки времени
мгновенного значения аналогового сигнала.
Частота дискретизации звука может лежать в диапазоне от 8000 Гц до 5 640 800 Гц
(измерений в секунду).
Для выбора частоты дискретизации применяют теорему В.А. Котельникова
Сигнал с дискретным
временем
28.10.10
Квантование сигнала. Мгновенное измеренное значение аналогового сигнала
округляется до ближайшего уровня из нескольких заранее определённых значений.
Количество уровней берётся кратным степени двойки, например, 256=28, 65536=216.
Показатель степени называют разрядностью АЦП (8-и, 12-и, 16-и разрядные).
Квантование (англ. quantization) — в информатике разбиение диапазона значений
непрерывной или дискретной величины на конечное число интервалов.
Квантованный сигнал
28.10.10
Итог: оцифрованный сигнал
28.10.10
Глубина кодирования (семплирования) звука – это количество
информации, которое необходимо для кодирования дискретных
уровней громкости цифрового звука.
Глубину
кодирования звука
можно найти из
формулы:
N=2I ,
где I – глубина
кодирования;
N – количество
уровней
квантования.
28.10.10
В процессе кодирования
каждому уровню
квантования сигнала
присваивается свой 16
битовый двоичный код:
(0000000000000000) –
наименьшее значение
амплитуды сигнала;
(1111111111111111) –
максимальное
значение амплитуды
сигнала.
Оценим информационный объём некоторого
цифрового стереозвукового файла с
глубиной квантования 16 битов и частотой
семплирования 96000Гц:
I = 16 бит⋅96 000⋅2(стерео звук!)=
3072000битов=384000байтов=375Кбайт.
- режим моно- осуществляется запись одной
звуковой дорожки;
режим стерео – запись двух звуковых
дорожек.
28.10.10
28.10.10