Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Практические аспекты алгоритмы кодирования информации
Для любой ЭВМ ввод информации и программ должен записываться на «языке» понятном ЭВМ. Таким понятным «языком» является двоичная система, представляемая единичками и нулями в соответствующих ячейках памяти ЭВМ. То есть все операнды и команды запоминаются в виде нулей и единиц в определенной последовательности. Если использовать 8 двоичных разрядов (байт), то легко подсчитать, что число возможных комбинаций допустимых значений «0» или «1» в одном байте равно 28 = 256 (0 до 255). Действительно, максимально возможное двоичное число равно 1111 1111 2. Для представления его в десятичном виде получим 1111 1111 2 =(1111 1111 2 +1) - 1=1000000-1=2^8-1=255. Поэтому каждый символ-буква какого-либо алфавита, цифра, знак пунктуации или арифметического действия кодируется определенной последовательностью двоичных цифр в соответствии с принятой таблицей кодирования. Наиболее распространенными таблицами кодирования информации являются таблицы: ДКОИ, КОИ-8, ASCII. Отличия их состоит в том, что в них для представления символов используется различное количество разрядов. В последнее время для кодирования информации все чаще используется таблица UNICODE, использующая для кодировки 2 байта. То есть в кодировке UNICODE можно закодировать 65536 различных символов. Как видно, в одном байте можно хранить одно из 256 целых чисел от 0 до 255. Этого вполне достаточно для того, чтобы дать уникальное 8-битовое обозначение каждому символу, применяемому в языке программирования. Для представления чисел в памяти ЭВМ выделяется определенное количество битов, независимо от конкретных значений чисел. Такое представление называют кодом числа. Код числа, в зависимости от выбранной формы, всегда имеет фиксированное количество двоичных цифр. В отличие от нумерации разрядов числа, биты в байте нумеруются слева направо от 0 до 7. Каждый байт в памяти ЭВМ имеет свой порядковый номер, который называется абсолютным адресом байта. Байт является основной единицей хранения данных и наименьшей адресуемой единицей обмена информации в оперативной памяти ЭВМ, то есть минимальной единицей обмена информации, имеющей адрес в памяти ЭВМ. Последовательность нескольких смежных байтов образует поле данных. Количество байтов поля называется длиной поля, а адрес самого левого байта поля - адресом поля. Байты нумеруются слева направо, начиная с 0. Обработка информации может вестись либо побайтно, либо полями данных (или форматом данных). Форматы данных показывают, как информация размещается в оперативной памяти и регистрах ЭВМ. Форматы данных различают по-длине, типу данных и структуре. Различают поля фиксированной и переменной длины. Длину формата данных измеряют в машинных словах или целым количестве битов. Минимальным полем фиксированной длины является полуслово. Полуслово состоит из двух последовательных байтов (16 бит, пронумерованных слева направо от 0 до 15). Два полуслова образуют слово. Слово состоит из четырех последовательных байтов (32 бита, пронумерованных слева направо от 0 до 31). Два слова образуют двойное слово (64 бита, пронумерованных слева направо от 0 до 63). В ПЭВМ слово, это, как правило, 2 байта, а двойное слово - 4 байта. Поле переменной длины может быть любой длины в пределах от одного до 256 байтов (нумерация от 0 до 255). Форматы полей данных, используемых в ЭВМ, представлены в таблицах 2.1, 2.2.
Таблица 2. Формат данных фиксированной длины
Таблица 3. Формат данных переменной длины
В ЭВМ для представления чисел в памяти используются следующие две формы: так называемые естественная форма и полулогарифмическая форма (экспоненциальная форма). Если выбрана длина поля данных и форма представления чисел, то независимо от величины числа, его код всегда имеет фиксированное количество двоичных цифр. Длина поля данных, используемая для представления кода чисел, является одной из важнейших характеристик любой ЭВМ. Причем всегда в представлении кода числа присутствует его знак (в отличие от общепринятых обозначений чисел в математике). Под естественной формой обычно понимают представленные числа с фиксированной запятой или точкой. Положение точки (запятой) строго устанавливается в зависимости от типа числа. Для правильных дробей точка ставится перед старшим разрядом, для смешанных дробей в определенном месте, отделяющем целую часть числа от дробной части. Для целых чисел точка ставится после младшего разряда. В настоящее время естественная форма используется в основном для представления целых чисел. Знак числа, во всех формах кодируется 0 (+) и 1 (-) и ставится перед старшим разрядом. Если числа кодируются в формате полуслова (16 бит), то этот формат называют - формат H, если числа кодируются в формате слова (32 бит), то этот формат называют - формат F. Для кодировки формата F используется шестнадцатеричная система счисления, которая позволяет сократить запись чисел. Достоинством естественной формы представления чисел является наглядность и простота, приводящая к высокой скорости выполнения операций. Существенным недостатком является ограниченный диапазон представления величин, что приводит к переполнению разрядной сетки при выходе за допустимые границы и искажению результата. Полулогарифмическая форма (экспоненциальная форма) используется для представления чисел с плавающей точкой или запятой. В электронных устройствах для отделения целой части числа от дробной, в отличие от привычной математической записи, то есть запятой, используется точка. Полулогарифмической (экспоненциальной) формой называется запись числа в виде:
А=± mp^±n,
Где m - мантисса числа, p - основание системы счисления, n - порядок. Представленная запись называется полулогарифмической, так как в логарифмической форме представляется только часть числа, а именно, p±n. Положение запятой определяется значением порядка n. С изменением порядка в ту или другую сторону запятая перемещается (плавает) влево или вправо. Так как ЭВМ для разделения целой и дробной частей числа используется точка, то такую форму представления чисел называют формой числа с плавающей точкой.
Кодирование информации
Код - это набор условных обозначений (или сигналов) для записи (или передачи) некоторых заранее определенных понятий. Кодирование информации - это процесс формирования определенного представления информации. В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки. Обычно каждый образ при кодировании (иногда говорят - шифровке) представлении отдельным знаком. Знак - это элемент конечного множества отличных друг от друга элементов. В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки. Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (например, звуки, изображения, показания приборов и т.д.) для обработки на компьютере должна быть преобразована в числовую форму. Например, чтобы перевести в числовую форму музыкальный звук, можно через небольшие промежутки времени измерять интенсивность звука на определенных частотах, представляя результаты каждого измерения в числовой форме. С помощью программ для компьютера можно выполнить преобразования полученной информации, например «наложить» друг на друга звуки от разных источников. Аналогичным образом на компьютере можно обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов. Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми. Ввод чисел в компьютер и вывод их для чтения человеком может осуществляться в привычной десятичной форме, а все необходимые преобразования выполняют программы, работающие на компьютере.
|
Последнее изменение этой страницы: 2020-02-16; Просмотров: 96; Нарушение авторского права страницы