Transcript презентация "Количество информации"
Как измерить информацию?
Вопрос этот очень непростой. Ответ на него зависит от того, что понимать под информацией. Но поскольку определять информацию можно по-разному, то и способы измерения тоже могут быть разными.
Измерение информации Содержательный подход Алфавитный подход
Содержательный подход к измерению информации.
Для человека
информация — это знания.
Если п олучение новой информации приводит к расширению знаний, то можно говорить, что
такое сообщение
содержит
информацию
.
Говорят, что
сообщение информативно если оно пополняет знания
человека. Например, прогноз погоды на завтра — информативное сообщение, а сообщение о вчерашней погоде неинформативно, т.к. нам это уже известно.
Основоположником этого подхода является американский учёный Клод Элвуд Шеннон(1916 — 2001).
По Шеннону, информация — уменьшение
неопределенности наших знаний.
Неопределенность некоторого события — это количество возможных исходов данного события.
Так, например, если из колоды карт наугад выбирают карту, то неопределенность равна количеству карт в колоде.
При бросании монеты неопределенность равна 2.
Содержательный подход к измерению информации.
Единица измерения информации была определена в науке, которая называется теорией информации. Эта единица носит название «
бит
». Ее определение звучит так:
Сообщение, уменьшающее неопределенность знаний в два раза, несет 1 бит информации.
Неопределенность знаний о некотором событии — это количество возможных результатов события.
Тогда можно записать формулу:
2
i
= N N -
i
количество событий количество информации одного события
Пример:
На книжном стеллаже восемь полок. Книга может быть поставлена на любую из них. Сколько информации содержит сообщение о том, где находится книга?
Решение: N = 8.
i
2
i
= N
- ?
2
i
= 8
i
2
i
= 2
3
= 3 бита Ответ
: сообщение о том, что книга находится на любой из полок равно 3 бита.
Алфавитный подход к измерению информации
Алфавитный подход к измерению количества информации основан на подсчете числа символов в сообщении.
При алфавитном подходе к определению количества информации
отвлекаются от содержания
информации и рассматривают информационное сообщение как
последовательность знаков
определенной знаковой системы.
Все множество
используемых в языке
символов
будем традиционно называть алфавитом. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел, т.е. пропуск между словами.
Полное количество символов алфавита принято называть мощностью алфавита. В формуле
2
i
= N N -
i мощность алфавита количество информации одного символа
Алфавитный подход к измерению информации
При алфавитном подходе к измерению информации количество информации зависит не от содержания, а от размера текста и мощности алфавита.
Информационный объем текста (I), содержащего K символов вычисляют по формуле:
где I -
i
K -
I=K*i
информационный объем текста , количество символов в тексте, информационный объем одного символа.
Основоположником этого подхода является Андрей Николаевич Колмогоров,(1903-1987), великий российский ученый-математик.
Пример:
Определите информационный объем страницы книги, если для записи текста использовались только заглавные буквы русского алфавита, кроме буквы Ё.
Решение: N = 32 2 i = N 2 i 2 i = 32 = 2 5 i = 5 бит На странице 3000 знаков,т.е. К=3000, тогда объем информации I =K * i I = 3000 * 5 , I = 15000 бит .
Ответ:
информационный объем страницы книги равен
15000 бит .
Таблица байтов:
1 байт = 8 бит 1 Кб (1
Килобайт
) = 2 10 байт = 2*2*2*2*2*2*2*2*2*2 байт = = 1024 байт (примерно 1 тысяча байт – 10 3 байт) 1 Мб (1
Мегабайт
) = 2 20 байт – 10 6 байт) байт = 1024 килобайт (примерно 1 миллион 1 Гб (1
Гигабайт
) = 2 30 байт – 10 9 байт) байт = 1024 мегабайт (примерно 1 миллиард 1 Тб (1
Терабайт
) = 2 40 байт = 1024 гигабайт (примерно 10 12 Терабайт иногда называют
тонна
.
байт). 1 Pb (1
Петабайт
) = 2 50 байт = 1024 терабайт (примерно 10 15 байт).
1 Eb (
Эксабайт)
= 2 60 байт = 1024 петабайт (примерно 10 18 байт).
1 Zb (
Зеттабайт)
= 2 70 байт = 1024 эксабайт (примерно 10 21 байт).
1 Yb (
Йоттабайт
)= 2 80 байт = 1024 зеттабайт (примерно 10 24 байт).
1) Сколько байт (без кавычек) содержит фраза «Сегодня 7 июля 2011 г.»?
2) Сколько байт (килобайт) занимает одна страница текста, если в одной строке помещается 60 символов, а на странице – 40 строк? Каков объем одной книги, состоящей из 100 подобных страниц?
3) Терабайтник - это внешний жесткий диск, который подключается к компьютеру через разъем USB, и имеет емкость 1 террабайт. В инструкции по его применению написано, что на этот диск может поместиться 250 тыс. музыкальных файлов или 285 тыс. фотографий. Каковы по мнению производителей этого устройства размер одного музыкального файла и размер одной фотографии?
4) Сколько подобных музыкальных файлов может поместиться на одном CD-диске размером 700 мегабайт?
5) Сколько подобных фотографий может поместиться на флешке размером 4 гигабайта?
Решения: 1) «Сегодня » – с пробелом (но без кавычек) 8 байт «7 июля » – с двумя пробелами (без кавычек) 7 байт «2011 г.» – с пробелом и с точкой (без кавычек) 7 байт. Итого: 8 + 7 + 7 =
22 байта
«весит» фраза «Сегодня 7 июля 2011 г.» 2) В одной строке помещается 60 символов, значит, объём одной строки 60 байт. На странице 40 таких строк, в каждой из которых содержится по 60 байт, поэтому объём одной страницы текста 60 x 40 = 2400 байт = 2,4 Килобайта = 2,4 Кб Объём одной книги 2400 x 100 = 240 000 байт = 240 Килобайт = 1000 000 000 : 250 = 4 000 000 байт = 4 Мегабайта = 4 Мб
240 Кб
3) Размер одного музыкального файла, который по мнению производителей можно записать на «терабайтник»: 1 000 000 000 000 : 250 000 = (сокращаем по три нуля в делимом и в делителе) Размер одной фотографии, который по мнению производителей можно записать на «терабайтник»: 1 000 000 000 000 : 285 000 = (сокращаем по три нуля в делимом и в делителе) 1 000 000 000 : 285 = 3 508 771, 93 байта = (округляем) 3,5 Мегабайта = потом выполнять с ними различные арифметические операции.
3,5 Мб
4) На CD-диске размером 700 мегабайт может поместиться 700 Мб : 4 Мб =
175
музыкальных файлов, каждый из которых размером не более 4 Мб. Здесь мегабайты можно сразу делить на мегабайты, а вот при работе с разными объёмами байтов лучше сначала переводить все в байты, а 5) На флешке размером 4 гигабайта может поместиться 4 000 000 000 : 3 508 771, 93 = (сокращаем по три нуля в делимом и в делителе) = 4 000 000 : 3 508 = 1 139,99 фото = (округляем)
1 140 фото
, каждое из которых размером не более 3,5 Мб.
Можно считать и приблизительно. Тогда: На флешке размером 4 гигабайта может поместиться 4 000 000 000 : 3 500 000 = (сокращаем по пять нулей в делимом и в делителе) = 40 000 : 35 = 1 142,86 фото = (округляем в сторону уменьшения) 1 140 фото, каждое из которых размером не более 3,5 Мб.