[На главную]

Тема урока: "Кодирование текстовой информации"
2006 год
учитель высшей категории Хайманова Татьяна Яковлевна

Цели: 1) углубить знания учащихся о кодировании текстовой информации, в частности, кириллицы;
2) познакомить учащихся с набором текста на русском языке и вставки таблицы в Блокноте с помощью таблиц кодов;
3) показать выходом из ситуации, когда Web-страница на русском языке не читается;
4) развивать умение применять полученные знания в практической работе на компьютере, не забывая правила техники безопасности;
5) воспитывать интерес к информатике и ИКТ.

Ход урока

I. Орг. момент

II. Повторение из курса 9 класса

  • Какова мощность алфавита Windows? (256 символов)
  • Как кодируется каждый символ при мощности алфавита в 256 символов? (Символ - байт)
  • Какую еще кодировку вы помните? (Unicode)

III. Изучение нового материала

1. Человек различает символы по их начертаниям, а компьютер - по кодам. Каждому символу ставится в соответствие уникальный код. В традиционных кодировках для кодирования одного символа используется 8 бит. Такой 8-разрядный код позволяет закодировать 256 различных символов.

Присвоение символу определенного числового кода – это вопрос соглашения. В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange), кодирующая первую половину символов с числовыми кодами от 0 до 127 (коды от 0 до 32 отведены не символам, а функциональным клавишам).

Международная кодировка ASCII

Национальные стандарты кодировочных таблиц включают международную часть кодовой таблицы без изменений, а во второй половине содержат коды национальных алфавитов, символы псевдографики и некоторые математические знаки.

К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows, MS-DOS, Macintosh и ISO), что вызывает дополнительные трудности при работе с русскоязычными документами.

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 ("Код обмена информацией, 8-битный"). Эта кодировка применялась еще в 70-ые годы на компьютерах серии ЕС ЭВМ, а с середины 80-х стала использоваться в первых русифицированных версиях операционной системы UNIX.
Кодировка русских букв КОИ8-Р

Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251 ("CP" означает "Code Page", "кодовая страница").

Кодировка русских букв CP1251

От начала 90-ых годов, времени господства операционной системы MS DOS, остается кодировка CP866.

Кодировка русских букв CP866

Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.

Кодировка русских букв MAC

Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.

Кодировка русских букв ISO 8859-5

В конце 90-ых годов появился новый международный стандарт Unicode, который отводит под один символ не один байт, а два, и поэтому с его помощью можно закодировать не 256, а 65536 различных символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.

Последовательности десятичных кодов слова «ЭВМ» в различных кодировках на основе кодировочных таблиц:

КОИ8-Р 252 247 237
CP1251 221 194 204
CP866 157 130 140
Mac 157 130 140
ISO 205 178 188

Кодовые таблицы при объяснении демонстрируются через проектор.

2. Коды символов можно найти и с помощью MS Word. (Вставка - Символ...). Найти несколько числовых кодов и сравнить их значение со значением в таблице кодов CP1251.

3. Открываю Блокнот и таблицы кодов CP866 и CP1251. Учащиеся называют любое короткое слово и это слово набирается в Блокноте с помощью кодов CP866 и CP1251 при нажатой клавише Alt в одной, затем в другой кодировке. Коды называют учащиеся, отыскивая их в таблице кодов (в кодировке CP866 набирается код, в кодировке CP1251 набирается перед кодом ноль, например, код "Ж" - 198. При нажатой клавише Alt набираем 0198). Буквы всегда можно ввести и без кодов, но если в текстовом редакторе типа Блокнот нужно получить таблицу, то без кодов не обойтись. Элементы таблицы имеются в кодовой таблице .CP866. Показываю пример. Но здесь важно выбрать шрифт. Он указан ниже таблицы.

4. Открываю любую Web-страницу или сайт на русском языке, например, сайт школы. Меняю кодировки, сравниваем вид страницы.

IV. Закрепление

Перед началом выполнения заданий на компьютере вспомним, каким должно быть расстояние от экрана монитора до глаз. (60-70 см.). Как избежать вредного влияния от монитора? (Экран монитора должен быть чистым. Нельзя прикасаться к нему пальцами)

Вопросы и задания:

1. Во сколько раз уменьшится информационный объем страницы текста при его преобразовании из кодировки Unicode (таблица кодировки содержит 65536 символов) в кодировку Windows CP1251(таблица кодировки содержит 256 символов)? (В 2 раза)

2. Каков информационный объем текста, содержащего слово ИНФОРМАТИКА, в 8-ми битной кодировке? в 16-битной кодировке? (11 байтов, 22 байта)

3. Декодируйте следующие тексты, заданные десятичным кодом:
а) 087 111 114 100; (Word)
б) 068 079 083; (DOS)
в) 080 097 105 110 116 098 114 117 115 104. (Paintbrush)

4. Как будет выглядеть слово «диск», записанное в кодировке CP1251, в других кодировках?
( КОИ8-Р: ДХЯЙ ; CP866: фшёъ; Mac: диск ; ISO: фшёъ)

5. В текстовом режиме экран обычно разбивается на 25 строк по 80 символов в строке. Определите объем текстовой информации, занимающей весь экран монитора. (25 х 80 = 2000 байт)

Тексты заданий имеются на каждом компьютере ученика в файле "Кодирование. Задания.doc"

Дополнительно. Создать любую таблицу в Блокноте. Шрифт Lucida Console.

V. Подведение итогов урока.

[Вверх]

Сайт управляется системой uCoz