презентация "Количество информации"

Download Report

Transcript презентация "Количество информации"

Как измерить информацию?

Вопрос этот очень непростой. Ответ на него зависит от того, что понимать под информацией. Но поскольку определять информацию можно по-разному, то и способы измерения тоже могут быть разными.

Измерение информации Содержательный подход Алфавитный подход

Содержательный подход к измерению информации.

Для человека

информация — это знания.

Если п олучение новой информации приводит к расширению знаний, то можно говорить, что

такое сообщение

содержит

информацию

.

Говорят, что

сообщение информативно если оно пополняет знания

человека. Например, прогноз погоды на завтра — информативное сообщение, а сообщение о вчерашней погоде неинформативно, т.к. нам это уже известно.

Основоположником этого подхода является американский учёный Клод Элвуд Шеннон(1916 — 2001).

По Шеннону, информация — уменьшение

неопределенности наших знаний.

Неопределенность некоторого события — это количество возможных исходов данного события.

Так, например, если из колоды карт наугад выбирают карту, то неопределенность равна количеству карт в колоде.

При бросании монеты неопределенность равна 2.

Содержательный подход к измерению информации.

Единица измерения информации была определена в науке, которая называется теорией информации. Эта единица носит название «

бит

». Ее определение звучит так:

Сообщение, уменьшающее неопределенность знаний в два раза, несет 1 бит информации.

Неопределенность знаний о некотором событии — это количество возможных результатов события.

Тогда можно записать формулу:

2

i

= N N -

i

количество событий количество информации одного события

Пример:

На книжном стеллаже восемь полок. Книга может быть поставлена на любую из них. Сколько информации содержит сообщение о том, где находится книга?

Решение: N = 8.

i

2

i

= N

- ?

2

i

= 8

i

2

i

= 2

3

= 3 бита Ответ

: сообщение о том, что книга находится на любой из полок равно 3 бита.

Алфавитный подход к измерению информации

Алфавитный подход к измерению количества информации основан на подсчете числа символов в сообщении.

При алфавитном подходе к определению количества информации

отвлекаются от содержания

информации и рассматривают информационное сообщение как

последовательность знаков

определенной знаковой системы.

Все множество

используемых в языке

символов

будем традиционно называть алфавитом. Обычно под алфавитом понимают только буквы, но поскольку в тексте могут встречаться знаки препинания, цифры, скобки, то мы их тоже включим в алфавит. В алфавит также следует включить и пробел, т.е. пропуск между словами.

Полное количество символов алфавита принято называть мощностью алфавита. В формуле

2

i

= N N -

i мощность алфавита количество информации одного символа

Алфавитный подход к измерению информации

При алфавитном подходе к измерению информации количество информации зависит не от содержания, а от размера текста и мощности алфавита.

Информационный объем текста (I), содержащего K символов вычисляют по формуле:

где I -

i

K -

I=K*i

информационный объем текста , количество символов в тексте, информационный объем одного символа.

Основоположником этого подхода является Андрей Николаевич Колмогоров,(1903-1987), великий российский ученый-математик.

Пример:

 Определите информационный объем страницы книги, если для записи текста использовались только заглавные буквы русского алфавита, кроме буквы Ё.

Решение: N = 32 2 i = N 2 i 2 i = 32 = 2 5 i = 5 бит На странице 3000 знаков,т.е. К=3000, тогда объем информации I =K * i I = 3000 * 5 , I = 15000 бит .

Ответ:

информационный объем страницы книги равен

15000 бит .

Таблица байтов:

1 байт = 8 бит 1 Кб (1

Килобайт

) = 2 10 байт = 2*2*2*2*2*2*2*2*2*2 байт = = 1024 байт (примерно 1 тысяча байт – 10 3 байт) 1 Мб (1

Мегабайт

) = 2 20 байт – 10 6 байт) байт = 1024 килобайт (примерно 1 миллион 1 Гб (1

Гигабайт

) = 2 30 байт – 10 9 байт) байт = 1024 мегабайт (примерно 1 миллиард 1 Тб (1

Терабайт

) = 2 40 байт = 1024 гигабайт (примерно 10 12 Терабайт иногда называют

тонна

.

байт). 1 Pb (1

Петабайт

) = 2 50 байт = 1024 терабайт (примерно 10 15 байт).

1 Eb (

Эксабайт)

= 2 60 байт = 1024 петабайт (примерно 10 18 байт).

1 Zb (

Зеттабайт)

= 2 70 байт = 1024 эксабайт (примерно 10 21 байт).

1 Yb (

Йоттабайт

)= 2 80 байт = 1024 зеттабайт (примерно 10 24 байт).

1) Сколько байт (без кавычек) содержит фраза «Сегодня 7 июля 2011 г.»?

2) Сколько байт (килобайт) занимает одна страница текста, если в одной строке помещается 60 символов, а на странице – 40 строк? Каков объем одной книги, состоящей из 100 подобных страниц?

3) Терабайтник - это внешний жесткий диск, который подключается к компьютеру через разъем USB, и имеет емкость 1 террабайт. В инструкции по его применению написано, что на этот диск может поместиться 250 тыс. музыкальных файлов или 285 тыс. фотографий. Каковы по мнению производителей этого устройства размер одного музыкального файла и размер одной фотографии?

4) Сколько подобных музыкальных файлов может поместиться на одном CD-диске размером 700 мегабайт?

5) Сколько подобных фотографий может поместиться на флешке размером 4 гигабайта?

Решения: 1) «Сегодня » – с пробелом (но без кавычек) 8 байт «7 июля » – с двумя пробелами (без кавычек) 7 байт «2011 г.» – с пробелом и с точкой (без кавычек) 7 байт. Итого: 8 + 7 + 7 =

22 байта

«весит» фраза «Сегодня 7 июля 2011 г.» 2) В одной строке помещается 60 символов, значит, объём одной строки 60 байт. На странице 40 таких строк, в каждой из которых содержится по 60 байт, поэтому объём одной страницы текста 60 x 40 = 2400 байт = 2,4 Килобайта = 2,4 Кб Объём одной книги 2400 x 100 = 240 000 байт = 240 Килобайт = 1000 000 000 : 250 = 4 000 000 байт = 4 Мегабайта = 4 Мб

240 Кб

3) Размер одного музыкального файла, который по мнению производителей можно записать на «терабайтник»: 1 000 000 000 000 : 250 000 = (сокращаем по три нуля в делимом и в делителе) Размер одной фотографии, который по мнению производителей можно записать на «терабайтник»: 1 000 000 000 000 : 285 000 = (сокращаем по три нуля в делимом и в делителе) 1 000 000 000 : 285 = 3 508 771, 93 байта = (округляем) 3,5 Мегабайта = потом выполнять с ними различные арифметические операции.

3,5 Мб

4) На CD-диске размером 700 мегабайт может поместиться 700 Мб : 4 Мб =

175

музыкальных файлов, каждый из которых размером не более 4 Мб. Здесь мегабайты можно сразу делить на мегабайты, а вот при работе с разными объёмами байтов лучше сначала переводить все в байты, а 5) На флешке размером 4 гигабайта может поместиться 4 000 000 000 : 3 508 771, 93 = (сокращаем по три нуля в делимом и в делителе) = 4 000 000 : 3 508 = 1 139,99 фото = (округляем)

1 140 фото

, каждое из которых размером не более 3,5 Мб.

Можно считать и приблизительно. Тогда: На флешке размером 4 гигабайта может поместиться 4 000 000 000 : 3 500 000 = (сокращаем по пять нулей в делимом и в делителе) = 40 000 : 35 = 1 142,86 фото = (округляем в сторону уменьшения) 1 140 фото, каждое из которых размером не более 3,5 Мб.