Transcript Кодирование текстовой информации. Единицы измерения
Единицы измерения информации
Кодирование текстовой информации
Единицы измерения информации
Наименьшая единица количества информации Наименьшая единица измерения информации –
1бит 1 байт
Наименьшая единица хранения информации - файл
1 бит = 0/1 1 байт = 8 бит = 2 8 бит = 256 значений 1 Кбайт = 2 10 1 Мбайт = 2 10 байт = 1024 байт Кбайт = 1024 Кбайт = 1 048 576 байт; 1 Гбайт = 2 10 1 Тбайт = 2 10 Мбайт = 1024 Мбайт = 1 073 741 824 байт; Гбайт = 1024 Гбайт = 1 099 511 627 776 байт.
байт килобайт мегабайт гигабайт терабайт петабайт эксабайт зеттабайт йоттабайт байт Кбайт Мбайт Гбайт Тбайт Пбайт Эбайт Збайт Йбайт 2 50 2 60 2 70 2 80 2 0 2 10 2 20 2 30 2 40
ASCII
(American Stsndart Cod for Information Interchange) Институт стандартизации США ввел в действие систему кодирования ASCII.
В системе ASCII закреплены таблицы кодирования некоторых специальных символов, строчных и прописных русских и латинских букв, цифр, знаков препинания и арифметических действий и других.
ASCII
Каждому символу
ASCII
соответствует
8 битовый двоичный код
: А - 01000001; В – 010000010; С – 010000011; D – 01000100 и т.д.
При записи текстового файла на диск, каждый символ текста хранится в памяти компьютера в виде набора из восьми нулей и единиц.
Windows - 1251
Кодировка символов русского языка введена компанией Microsoft.
Эта кодировка используется на некоторых локальных компьютерах, работающих на платформе Windows. Каждому символу в этой кодировке соответствует
8 битовый двоичный код
.
КОИ - 8
Встречается в компьютерных сетях на территории России и в российском секторе Интернета.
Код обмена информацией - восьмизначный
UNICODE
Система, основанная на 16-разрядном кодировании символов. Шестнадцать разрядов позволяют обеспечить уникальные коды для 65536 различных символов. Каждому символу в этой кодировке соответствует
16 битовый (2-байтовый) двоичный код.
Пример 1.
Определить количество информационного объема выражения: «Жесткий диск», записанного в кодировке UNICODE.
Решение.
В системе UNICODE каждый символ кодируется 2 байтами. В выражении 12 символов. Следовательно, информационный объем этого выражения равен
12 * 2 = 24 байта
Пример 2.
Каждая станица текста состоит из 32 строк, в каждой строке по 64 символа. Определить максимальное количество станиц такого текста (без учета символов форматирования), записанного в кодировке КОИ-8 на USB Flash drive (UFD ) емкостью 512 Мб.
Решение.
В кодировке КОИ-8 каждый символ кодируется одним байтом. Информационный объем страницы данного текста составляет
32 * 64 = 2048 байт.
Емкость UFD
512 Мб = 512 * 1024 * 1024 = 536870912 байт
. Следовательно, максимальное количество страниц указанного текста, записанного в кодировке КОИ-8 на UFD емкостью 512 Мб, равно
536870912 : 2048 = 362144 страницы.