Кодирование текстовой информации. Единицы измерения

Download Report

Transcript Кодирование текстовой информации. Единицы измерения

Единицы измерения информации

Кодирование текстовой информации

Единицы измерения информации

Наименьшая единица количества информации Наименьшая единица измерения информации –

1бит 1 байт

Наименьшая единица хранения информации - файл

1 бит = 0/1 1 байт = 8 бит = 2 8 бит = 256 значений 1 Кбайт = 2 10 1 Мбайт = 2 10 байт = 1024 байт Кбайт = 1024 Кбайт = 1 048 576 байт; 1 Гбайт = 2 10 1 Тбайт = 2 10 Мбайт = 1024 Мбайт = 1 073 741 824 байт; Гбайт = 1024 Гбайт = 1 099 511 627 776 байт.

байт килобайт мегабайт гигабайт терабайт петабайт эксабайт зеттабайт йоттабайт байт Кбайт Мбайт Гбайт Тбайт Пбайт Эбайт Збайт Йбайт 2 50 2 60 2 70 2 80 2 0 2 10 2 20 2 30 2 40

ASCII

(American Stsndart Cod for Information Interchange) Институт стандартизации США ввел в действие систему кодирования ASCII.

В системе ASCII закреплены таблицы кодирования некоторых специальных символов, строчных и прописных русских и латинских букв, цифр, знаков препинания и арифметических действий и других.

ASCII

Каждому символу

ASCII

соответствует

8 битовый двоичный код

: А - 01000001; В – 010000010; С – 010000011; D – 01000100 и т.д.

При записи текстового файла на диск, каждый символ текста хранится в памяти компьютера в виде набора из восьми нулей и единиц.

Windows - 1251

Кодировка символов русского языка введена компанией Microsoft.

Эта кодировка используется на некоторых локальных компьютерах, работающих на платформе Windows. Каждому символу в этой кодировке соответствует

8 битовый двоичный код

.

КОИ - 8

Встречается в компьютерных сетях на территории России и в российском секторе Интернета.

Код обмена информацией - восьмизначный

UNICODE

Система, основанная на 16-разрядном кодировании символов. Шестнадцать разрядов позволяют обеспечить уникальные коды для 65536 различных символов. Каждому символу в этой кодировке соответствует

16 битовый (2-байтовый) двоичный код.

Пример 1.

Определить количество информационного объема выражения: «Жесткий диск», записанного в кодировке UNICODE.

Решение.

В системе UNICODE каждый символ кодируется 2 байтами. В выражении 12 символов. Следовательно, информационный объем этого выражения равен

12 * 2 = 24 байта

Пример 2.

Каждая станица текста состоит из 32 строк, в каждой строке по 64 символа. Определить максимальное количество станиц такого текста (без учета символов форматирования), записанного в кодировке КОИ-8 на USB Flash drive (UFD ) емкостью 512 Мб.

Решение.

В кодировке КОИ-8 каждый символ кодируется одним байтом. Информационный объем страницы данного текста составляет

32 * 64 = 2048 байт.

Емкость UFD

512 Мб = 512 * 1024 * 1024 = 536870912 байт

. Следовательно, максимальное количество страниц указанного текста, записанного в кодировке КОИ-8 на UFD емкостью 512 Мб, равно

536870912 : 2048 = 362144 страницы.