понедельник, 24 ноября 2014 г.

Информация. Кодирование и измерение информации


Информация - сведения, знания, содержащиеся в сообщении.  Информация – базовое понятие информатики. Не имеет единственно верного определения.
Информация хранится, передается, обрабатывается в символьной (знаковой) форме. Одна и та же информация может быть представлена в разной форме, с помощью различных знаковых систем. Язык - это определенная знаковая система представления информации. Существуют естественные (разговорные) языки и формальные языки. Примеры формальных языков: язык музыки (нотная грамота), язык математики (цифры и математические знаки) и др. В некоторых случаях разговорную речь может заменять язык мимики и жестов, язык специальных знаков (например, дорожные знаки).


Кодирование информации - процесс формирования определенного представления информации. В более узком смысле под термином "кодирование" часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки. Обратное преобразование называется декодированием. Способ кодирования зависит от цели, ради которой оно осуществляется. Такой целью может быть сокращение записи, засекречивание (шифровка) информации, удобство обработки и т. п. Чаще всего кодированию подвергаются тексты на естественных языках (русском, английском и пр.). 

Существуют три основных способа кодирования текста
графический - с помощью специальных рисунков или значков; 
2 числовой - с помощью чисел; 
3) символьный - с помощью символов того же алфавита, что и исходный текст. 
Полный набор символов, используемый для кодирования текста, называется алфавитом или азбукой

Измерение информации
(смотреть) >>

Содержательный подход
Алфавитный подход 
Информация, как увеличение запаса знаний человека.

1 бит – количество информации, которое уменьшает неопределенность знания о некотором событии в два раза
Информация, как набор символов некоторого алфавита.

1 бит – информация, которую несет один символ алфавита, мощностью = 2


Содержательный подход (смотреть)>>
Количество информации, заключенное в сообщении, определяется объемом знаний, который это Сообщение несет получающему его человеку. Сообщение содержит информацию для человека, если заключенные в нем сведения являются для этого человека новыми и понятными и, следовательно, пополняют его знания.
При содержательном подходе возможна качественная оценка информации: полезная, безразличная, важная, вредная. Одну и ту же информацию разные люди могут оценить по раз-ному. Единица измерения количества информации называется битом
Сообщение, уменьшающее неопределенность знания человека в два раза, несет для него 1 бит информации. 
Пусть в некотором сообщении содержатся сведения о том, что произошло одно из N равновероятных событий (равновероятность обозначает, что ни одно событие не имеет преимуществ перед другими). Тогда количество информации, заключенное в этом сообщении, — i битов и число N связаны формулой: 
2i=N
 Если же N не является степенью двойки, то для того, чтобы оценить количество информации, необходимое для кодирования сообщения, применим формулу:
2i-1≤N≤2i
Таким образом сделаем оценку сверху, для числа N.


Алфавитный подход (смотреть)>>
Алфавитный подход к измерению информации позволяет определить количество информации, заключенной в тексте. Алфавитный подход является объективным, т. е. он не зависит от субъекта (человека), воспринимающего текст. 
Множество символов, используемых при записи текста, называется алфавитом. Полное количество символов в алфавите называется мощностью (размером) алфавита
Если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой (равновероятно), то количество информации, которое несет каждый символ, вычисляется по формуле: 
2i=N
где N — мощность алфавита. Следовательно, в 2-символьном алфавите каждый символ * весит 1 бит; в 4-символьном алфавите каждый символ несет 2 бита информации; в 8-символьном - 3 бита (log28 = 3) и т. д. 
Один символ из алфавита мощностью 256(28) несет в тексте 8 битов информации. Такое количество информации называется байтом. Алфавит из 256 символов используется для пред-ставления текстов в компьютере. 
1 байт = 8 битов 
Если весь текст состоит из К символов, то при алфавитном подходе размер содержащейся в нем информации равен: 
I = Кi, 
где i — информационный вес одного символа в используемом алфавите. 
Для измерения информации используются и более крупные единицы: 
1 Кбайт (килобайт) = 210 байт = 1024 байта 
1 Мбайт (мегабайт) = 210 Кбайт = 1024 Кбайта 

1 Гбайт (гигабайт) = 210 Мбайт = 1024 Мбайта