Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Кодирование информации. Кодирование различных форм представления информации(числовой, текстовой).
А) Кодирование информации - это представление информации в той или иной стандартной форме. Информация всегда хранится и передается в закодированном виде. При разговоре информация кодируется с помощью звуков, комбинации из которых образуют слова, а также с помощью жестов, мимики. При записи слова могут быть закодированы с помощью букв, числа с помощью цифр и т.д. Одна и та же информация может быть закодирована в различных видах. Количество учеников в классе может быть закодировано в виде рисунка, диаграммы, буквенной или числовой записи. При этом сама информация остается неизменной, меняются лишь способы кодирования. Выбор способа кодирования информации зависит от целей кодирования. Если мы хотим найти общее количество учащихся в школе, то для этого удобнее закодировать количество учащихся в каждом классе в виде чисел. А если мы хотим произвести сравнительный анализ количества учащихся по классам, то удобно информацию представить в виде диаграммы. В то же время совершенно разные сведения могут быть представлены в похожей форме. Например, с помощью азбуки Морзе (точек и тире) можно закодировать разную информацию. С помощью отдельных знаков или их наборов можно записывать только дискретные сообщения. Поскольку аналоговая информация непрерывна, то записать ее с помощью вышеперечисленных понятий нельзя. Различные языки служат средством для кодирования информации. Человек в своей практике общения использует много различных языков. Прежде всего это языки устной и письменной речи. Это языки жестов и мимики. Это языки различных указателей, например знаков дорожного движения или пиктограмм олимпийских видов спорта. Кроме того, человек использует ряд языков профессионального назначения. Сюда относятся языки математических формул, обозначений электроники и т.д. Возникновение целого ряда языков было продиктовано необходимостью привлечения технических средств для передачи информации. Примером такого языка является азбука Морзе, изобретенная для передачи телеграфных сообщений. В нем каждый символ обычного алфавита кодируется набором точек и тире (что соответствует передаче коротких и длинных электромагнитных импульсов). Вообще использование двухсимвольного алфавита оказалось столь же естественным в различных технических средствах связи, как десятисимвольного для записи чисел. Дело в том, что технически двухсимвольный алфавит легко реализуется: есть электрический импульс или нет его, есть намагниченность или она отсутствует, проходит свет или не проходит и т.п. Б) Числовой Сходство в кодировании числовой и текстовой информации состоит в следующем: чтобы можно было сравнивать данные этого типа, у разных чисел (как и у разных символов) должен быть различный код. Основное отличие числовых данных от символьных заключается в том, что над числами кроме операции сравнения производятся разнообразные математические операции: сложение, умножение, извлечение корня, вычисление логарифма и пр. Правила выполнения этих операций в математике подробно разработаны для чисел, представленных в позиционной системе счисления. Многовековая история развития математики показывает, что именно позиционный принцип позволяет использовать эти правила как универсальные алгоритмы, справедливые для системы счисления с любым основанием: 2, 3, 8, 10, 16, 60 и пр. Система счисления - совокупность приемов обозначения чисел, способ записи чисел. Все системы счисления делятся на позиционные и непозиционные. Непозиционными системами являются такие системы счисления, в которых каждый символ сохраняет свое значение независимо от места его положения в числе. Примером непозиционной системы счисления является римская система. К недостаткам таких систем относятся наличие большого количества знаков и сложность выполнения арифметических операций. Система счисления называется позиционной, если одна и та же цифра имеет различное значение, определяющееся позицией цифры в последовательности цифр, изображающей число. Это значение меняется в однозначной зависимости от позиции, занимаемой цифрой, по некоторому закону. Примером позиционной системы счисления является десятичная система, используемая в повседневной жизни Количество различных цифр, употребляемых в позиционной системе определяет название системы счисления и называется основанием системы счисления - " p ". В десятичной системе используются десять цифр: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9; эта система имеет основанием число десять.
В ЭВМ применяют позиционные системы счисления с недесятичным основанием: двоичную, восьмеричную, шестнадцатеричную. В аппаратной основе ЭВМ лежат двухпозиционные элементы, которые могут находиться только в двух состояниях; одно из них обозначается 0, а другое - 1. Поэтому основной системой счисления применяемой в ЭВМ является двоичная система Двоичная система счисления. Используется две цифры: 0 и 1. Восьмеричная система счисления. Используется восемь цифр: 0, 1, 2, 3, 4, 5, 6, 7. Употребляется в ЭВМ как вспомогательная для записи информации в сокращенном виде. Для представления одной цифры восьмеричной системы используется три двоичных разряда (триада) (Таблица 1). Шестнадцатеричная система счисления. Для изображения чисел употребляются 16 цифр. Первые десять цифр этой системы обозначаются цифрами от 0 до 9, а старшие шесть цифр - латинскими буквами: 10-A, 11-B, 12-C, 13-D, 14-E, 15-F. Шестнадцатеричная система используется для записи информации в сокращенном виде. Для представления одной цифры шестнадцатеричной системы счисления используется четыре двоичных разряда (тетрада)
Текстовой. В настоящее время большая часть пользователей при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др. Традиционно для того чтобы закодировать один символ используют количество информации равное 1 байту, т. е. I = 1 байт = 8 бит. При помощи формулы, которая связывает между собой количество возможных событий К и количество информации I, можно вычислить сколько различных символов можно закодировать (считая, что символы - это возможные события):
К = 2I = 28 = 256,
т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов.
Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255. Необходимо помнить, что в настоящее время для кодировки русских букв используют пять различных кодовых таблиц (КОИ - 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой кодировке. Наглядно это можно представить в виде фрагмента объединенной таблицы кодировки символов.
Одному и тому же двоичному коду ставится в соответствие различные символы.
Двоичный код Десятичный код КОИ8 СР1251 СР866 Мас ISO 11000010 194 б В - - Т
Впрочем, в большинстве случаев о перекодировке текстовых документов заботится на пользователь, а специальные программы - конверторы, которые встроены в приложения. Начиная с 1997 г. последние версии Microsoft Windows& Office поддерживают новую кодировку Unicode, которая на каждый символ отводит по 2 байта, а, поэтому, можно закодировать не 256 символов, а 65536 различных символов. Чтобы определить числовой код символа можно или воспользоваться кодовой таблицей, или, работая в текстовом редакторе Word 6.0 / 95. Для этого в меню нужно выбрать пункт " Вставка" - " Символ", после чего на экране появляется диалоговая панель Символ. В диалоговом окне появляется таблица символов для выбранного шрифта. Символы в этой таблице располагаются построчно, последовательно слева направо, начиная с символа Пробел (левый верхний угол) и, кончая, буквой " я" (правый нижний угол). Для определения числового кода символа в кодировке Windows (СР1251) нужно при помощи мыши или клавиш управления курсором выбрать нужный символ, затем щелкнуть по кнопке Клавиша. После этого на экране появляется диалоговая панель Настройка, в которой в нижнем левом углу содержится десятичный числовой код выбранного символа.
|
Последнее изменение этой страницы: 2017-03-14; Просмотров: 895; Нарушение авторского права страницы