Кодирование текстовой информации - Кодирование информации - Краткий теоретический справочник

Информатика и ИКТ подготовка к ЕГЭ

Кодирование текстовой информации - Кодирование информации - Краткий теоретический справочник

1. Если с каждым символом алфавита сопоставить определённое целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать текстовую информацию. Восьми двоичных разрядов достаточно для кодирования 256 различных символов. Этого вполне хватает, чтобы выразить все символы английского и русского языков, как строчные, так и прописные, а также знаки препинания, символы основных арифметических действий и некоторые общепринятые специальные символы.

2. Институт стандартизации США (ANSI — American National Standard Institute) ввёл в действие систему кодирования ASCII (American Standard Code for Information Interchange — стандартный код информационного обмена США). В системе ASCII закреплены таблицы кодирования некоторых специальных символов, строчных и прописных русских и латинских букв, цифр, знаков препинания, арифметических действий и других.

Каждому символу ASCII соответствует 8-6итовый двоичный код, например, А — 01000001, В — 01000010, С — 01000011, D — 01000100 и т.д. Таким образом, при записи текстового файла на диск каждый символ текста хранится в памяти компьютера в виде набора из восьми нулей и единиц.

3. Windows-1251 — кодировка символов русского языка; используется на некоторых локальных компьютерах, работающих на платформе Windows. Каждому символу в этой кодировке соответствует 8-битовый двоичный код.

4. КОИ-8 (код обмена информацией, восьмизначный); встречается в компьютерных сетях на территории России и в российском секторе Интернета.

5. UNICODE — система, основанная на 16-разрядном кодировании символов. Шестнадцать разрядов позволяют обеспечить уникальные коды для 65536 различных символов. Каждому символу в этой кодировке соответствует 16-битовый (2-байтовый) двоичный код.

Пример 1. Определите количество информационного объёма выражения «Жёсткий диск», записанного в кодировке UNICODE.

Решение. В системе UNICODE каждый символ кодируется двумя байтами. В приведённом выражении 12 символов. Следовательно, информационный объём этого выражения равен 12 ∙ 2 = 24 (байта).

Ответ: 24 байта.


Пример 2. Каждая страница текста состоит из 32-х строк, в каждой строке по 64 символа. Определить максимальное количество страниц такого текста (без учёта символов форматирования), записанного в кодировке КОИ-8 на USB Flash drive (UFD) ёмкостью 512 Мб.

Решение. В кодировке КОИ-8 каждый символ кодируется одним байтом. Информационный объём страницы текста составляет 32 ∙ 64 = 2048 байт. Ёмкость UFD 512 Мб = 512 ∙ 1024 ∙ 1024 = 536870912 байт. Следовательно, максимальное количество страниц указанного текста (без учёта символов форматирования), записанного в кодировке КОИ-8 на UFD ёмкостью 512 Мб, равно 536870912 : 2048 = 262144.

Ответ: 262144 страницы.






Для любых предложений по сайту: [email protected]