Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Энтропийный (вероятностный, статистический) подход.



Объёмный подход.

 

В технике, где информацией считается любая хранящаяся, обрабатываемая или передаваемая последовательность знаков, сигналов, часто используют простой способ определения количества информации, который может быть назван объемным. Он основан на подсчете числа символов в сообщении, то есть связан только с длиной сообщения и не учитывает его содержания.

 

В двоичной системе счисления знаки 0 и 1 будем называть битами (от английского выражения BInary digiTs – двоичные цифры). Отдают предпочтение именно двоичной системе счисления потому, что в техническом устройстве наиболее просто реализовать два противоположных физических состояния:

намагничено / не намагничено,

вкл./выкл.,

заряжено / не заряжено и др.

Объём информации, записанной двоичными знаками в памяти компьютера или на внешнем носителе информации, подсчитывается просто по количеству требуемых для такой записи двоичных символов. При этом невозможно нецелое число битов.

Для удобства использования введены и более крупные, чем бит, единицы количества информации. Так:

двоичное слово из восьми знаков содержит один байт информации,

1024 байта образуют килобайт (Кбайт),

1024 килобайта – мегабайт (Мбайт),

1024 мегабайта – гигабайт (Гбайт).

 

 

Энтропийный (вероятностный, статистический) подход.

 

Этот подход принят в теории информации и кодирования. Данный способ измерения исходит из следующей модели: получатель сообщения имеет определённое представление о возможных наступлениях некоторых событий. Эти представления в общем случае недостоверны и выражаются вероятностями, с которыми он ожидает то или иное событие. Общая мера неопределённостей называется энтропией. Энтропия характеризуется некоторой математической зависимостью от совокупности вероятности наступления этих событий.

Количество информации в сообщении определяется тем, насколько уменьшилась эта мера после получения сообщения: чем больше энтропия системы, тем больше степень её неопределённости. Поступающее сообщение полностью или частично снимает эту неопределённость, следовательно, количество информации можно измерять тем, насколько понизилась энтропия системы после получения сообщения. За меру количества информации принимается та же энтропия, но с обратным знаком.

 

 

Американский инженер Ральф Хартли в 1928 г. процесс получения информации рассматривал как выбор одного сообщения из конечного наперёд заданного множества из N равновероятных сообщений, а количество информации I, содержащееся в выбранном сообщении, определял как двоичный логарифм N.

Формула Хартли:

I = log2N,

где I – количество информации, N – равновероятные сообщения.

 

Иначе эту формулу записывают:

N = 2I

 

N – количество возможных исходов, количество возможных событий, количество возможных выборов, количество возможных сообщений.

Например, количество возможных цветов в цветовой палитре рисунка.

 

I – количество информации, количество бит для одного сообщения.

Например, количество бит для ОДНОГО цвета (в цветовой палитре рисунка).

 

Примеры равновероятных сообщений:

при бросании монеты: " выпала решка" , " выпал орел" ;

на странице книги: " количество букв чётное" , " количество букв нечётное" .

 

 

Американский учёный Клод Шеннон предложил в 1948 г. другую формулу определения количества информации, учитывающую возможную неодинаковую вероятность сообщений в наборе.

Формула Шеннона:

I = – ( p1log2 p1 + p2 log2 p2 +... + pN log2 pN),

где pi – вероятность того, что именно i-е сообщение выделено в наборе из N сообщений (не равновероятных).

 

В работах Хартли и Шеннона информация возникает перед нами лишь в своей внешней оболочке, которая представлена отношениями сигналов, знаков, сообщений друг к другу – синтаксическими отношениями. Количественная мера Хартли-Шеннона не претендует на оценку содержательной (семантической) или ценностной, полезной (прагматической) сторон передаваемого сообщения

Эта мера количества информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту.

 

Объем данных VД в сообщении измеряется количеством символов (разрядов) в этом сообщении. В различных системах счисления один разряд имеет различный вес и соответственно меняется единица измерения данных: в двоичной системе счисления единица измерения – бит (bit – binаry digit – двоичный разряд); в десятичной системе счисления единица измерения – дит (десятичный разряд).

 

Количество информации I на синтаксическом уровне невозможно определить без рассмотрения понятия неопределенности состояния системы (энтропии системы). Действительно, получение информации о какой-либо системе всегда связано с изменением степени неосведомленности получателя о состоянии этой системы.

 

 

Коэффициент (степень) информативности (лаконичность) сообщения определяется отношением количества информации к объему данных, т.е.

, причем 0 < Y < 1.

С увеличением Y уменьшаются объемы работы по преобразованию информации (данных) в системе. Поэтому стремятся к повышению информативности, для чего разрабатываются специальные методы оптимального кодирования информации.

 

 

Алгоритмический подход.

Любому сообщению можно приписать количественную характеристику, отражающую сложность (размер) программы, которая позволяет его произвести. Так как имеется много различных вычислительных машин и языков программирования, т.е. разных способов задания алгоритма, то для определённости задаётся некоторая конкретная машина, например машина Тьюринга. Тогда в качестве количественной характеристики сообщения можно взять минимальное число внутренних состояний машины, требующихся для воспроизведения данного сообщения.

 

 

Семантический подход.

 

Новый этап теоретического расширения понятия информации связан с кибернетикой – наукой об управлении и связи в живых организмах, обществе и машинах. Оставаясь на позициях шенноновского подхода, кибернетика формулирует принцип единства информации и управления, который особенно важен для анализа сути процессов, протекающих в самоуправляющихся, самоорганизующихся биологических и социальных системах. Развитая в работах Н. Винера концепция предполагает, что процесс управления в упомянутых системах является процессом переработки (преобразования) некоторым центральным устройством информации, получаемой от источников первичной информации (сенсорных рецепторов) и передачи ее в те участки системы, где она воспринимается ее элементами как приказ для выполнения того или иного действия. По совершении самого действия сенсорные рецепторы готовы к передаче информации об изменившейся ситуации для выполнения нового цикла управления. Так организуется циклический алгоритм (последовательность действий) управления и циркуляции информации в системе. При этом важно, что главную роль играет здесь содержание информации, передаваемой рецепторами и центральным устройством. Информация, по Винеру – это «обозначение содержания, полученного из внешнего мира в процессе нашего приспособления к нему и приспособления к нему наших чувств».

Таким образом, кибернетическая концепция подводит к необходимости оценить информацию как некоторое знание, имеющее одну ценностную меру по отношению к внешнему миру (семантический аспект) и другую по отношению к получателю, накопленному им знанию, познавательным целям и задачам (прагматический аспект).

Попытки построить модели понятия информации, охватывающие семантический аспект знания, содержащегося в некотором высказывании относительно обозначаемого объекта, привели к созданию ряда так называемых логико-семантических теорий (Р. Карнап, И. Бар-Хиллел, Дж. Г. Кемени, Е.К. Войшвилло и др.). В них информация рассматривается как уменьшение или устранение неопределенности. Естественно предположить, что средствами какого-либо языка с помощью создаваемых в нем высказываний можно описать некоторую совокупность возможных ситуаций, состояний, альтернатив. Семантическая информация, содержащаяся в каком-либо высказывании, исключает некоторые альтернативы. Чем больше альтернатив исключает высказывание, тем большую семантическую информацию оно несет. Так, например, одна из возможных совокупностей ситуаций может быть описана следующим образом: «все тела при нагревании расширяются». Высказывание «металлы при нагревании расширяются» исключает все альтернативы, в которых речь может идти о неметаллах. Семантическая сила высказывания может быть оценена отношением все тела (все металлы). Еще более информативным будет высказывание «железо при нагревании расширяется», так как оно исключает все альтернативы, кроме одной.

При всем многообразии логико-семантических теорий им присущи общие черты, они указывают путь решения трех связанных друг с другом проблем:

· определения совокупности возможных альтернатив средствами выбранного языка,

· количественной оценки альтернатив, их относительного сопоставления (взвешивания),

· введения меры семантической информации.

В рассмотренных теоретических конструкциях – статистической и семантической информации – речь шла о потенциальной возможности извлечь из передаваемого сообщения какие-либо сведения. Вместе с тем в процессах информационного обмена очень часто складываются ситуации, в которых мощность или качество информации, воспринимаемое приемником, зависит от того, насколько он подготовлен к ее восприятию.

 

Понятие тезауруса является фундаментальным в теоретической модели семантической теории информации, предложенной Ю.А. Шрейдером и учитывающей в явной форме роль приемника.

 

Согласно этой модели,

тезаурус – это знания приемника информации о внешнем мире, его способность воспринимать те или иные сообщения,

информация – это разность тезаурусов.

 

Представим себе, что до получения телеграммы «Встречай завтра рейс СУ172» мы из вчерашнего разговора по междугороднему телефону уже знали о предстоящем приезде своего родственника или друга, а наведя справки, узнали и номер авиарейса, с которым он может прибыть в город. Наш тезаурус уже содержал информацию, заключенную в телеграмме. Следовательно, он не изменился с ее получением, и семантическая ценность этой информации оказалась нулевой. Очевидно, что к подобной оценке семантического содержания информации примешивается семантический аспект, скрытый в изначальной «установке» тезауруса на осмысление принимаемого сообщения.

 

Для измерения смыслового содержания информации, т.е. её количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Для этого используется понятие «тезаурус пользователя».

 

Тезаурус – это совокупность сведений, которыми располагает пользователь или система.

 

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sp изменяется количество семантической информации Ic воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус.

Характер такой зависимости показан на рисунке. Рассмотрим два предельных случая, когда количество семантической информации Iс равно 0: при Sр » 0 пользователь не воспринимает, не понимает поступающую информацию; при Sр ® ¥ пользователь все знает, и поступающая информация ему не нужна.

 

 

Максимальное количество семантической информации Ic потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом Sр ( = Sр opt), когда поступающая информация понятна пользователю и несёт ему ранее не известные (отсутствующие в его тезаурусе) сведения.

Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.

При оценке семантического (содержательного) аспекта информации необходимо стремиться к согласованию величин S и Sp.

Относительной мерой количества семантической информации может служить коэффициент содержательности С, который определяется как отношение количества семантической информации к ее объему: .

 

 

Прагматический подход.

 

Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цели. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе. Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.

 

§3. Решение задач.

 

Задача 1.

Условие. Выразите 5 242 880 байт в битах, килобайтах и мегабайтах.

Решение:

5 242 880 * 8 = 41 943 040 бит (так как 1 байт = 8 бит)

5 242 880 / 1024 = 5 120 килобайт (так как 1 килобайт = 1024 байт)

5 120 / 1024 = 5 мегабайт (так как 1 мегабайт = 1024 килобайт)

 

 

Примечание:

Если при нахождении килобайт получается дробное число, то ответ надо округлить до сотых долей.

Если при нахождении мегабайт получается дробное число, то ответ надо округлить до десятых долей.

Должно быть написано решение задания, а не только ответ.

Ответ надо выделить.

Задача 2.

Условие. Книга, набранная в текстовом редакторе, содержит 150 страниц. На каждой странице – 40 строк. В каждой строке 60 символов (включая пробелы между словами). Один символ кодируется 1 байтом. Каков информационный объем книги (в байтах, в килобайтах, в мегабайтах)?

Решение.

40 * 60 = 2400 символов (количество символов на 1 странице)

2400 * 1 = 2400 байт (объем одной страницы)

2400 * 150 = 360 000 байт (объем всей книги, в байтах)

360 000 / 1024 = 351, 5625 Кбайт » 351, 56 Кбайт (объем всей книги, в килобайтах)

351, 56 / 1024 = 0, 3433203125 Мбайт » 0, 3 Мбайт (объем всей книги, в мегабайтах)

 

 

Примечание:

Первые три действия можно записать единым действием: 40 * 60 * 150 * 1= 360 000 байт.

НО будет ОШИБКОЙ, если будет написано: 40 * 60 * 150 = 360 000 байт. Правильно тогда указать в ответе единицу измерения: символов.

Должно быть написано решение задания, а не только ответ.

Ответ надо выделить.

 

 

Задача 3.

Условие. Сколько памяти (в байтах, в килобайтах, в мегабайтах) необходимо, чтобы закодировать изображение на экране компьютерного монитора, который может отображать 1280 точек по горизонтали и 1024 по вертикали при 256 цветах.

Решение.

1280 * 1024 = 1310720 (количество точек на экране)

Всего 256 цветов. Узнаем, сколько бит отводится для одного цвета. (Для этого воспользуемся формулой N = 2I. В данном случае N = 256)

2х = 256, значит 2х = 28, значит х = 8

Значит, 1 точка кодируется 8 битами = 1 байтом.

1310720 * 1 = 1310720 байт (объем изображения, в байтах)

1310720 / 1024 = 1280 Кб (объем изображения, в килобайтах)

1280 / 1024 = 1, 25 Мб » 1, 3 Мб (объем изображения, в мегабайтах)

 

 

Примечание:

В задаче должно быть РЕШЕНИЕ, а не только ответ.

Должно быть указано, какое действие надо выполнить («что» на «что» разделить / умножить / сложить / вычесть) и какова единица измерения полученного ответа (пикселей / символов / бит / байт и так далее).

Можно не писать пояснение к действию.

 

 

Задача 4.

Условие. Сколько памяти (в байтах, в килобайтах, в мегабайтах) необходимо, чтобы закодировать изображение на экране компьютерного монитора, который может отображать 1280 точек по горизонтали и 1024 по вертикали при 128 цветах.

Решение.

1280 * 1024 = 1310720 (количество точек на экране)

Всего 128 цветов. Узнаем, сколько бит отводится для одного цвета. (Для этого воспользуемся формулой N = 2I. В данном случае N = 128)

2х = 128, значит 2х = 27, значит х = 7

Значит, 1 точка кодируется 7 битами

1310720 * 7 = 9175040 бит (объем изображения, в битах)

9175040 / 8 = 1146880 байт (объем изображения, в байтах)

1146880 / 1024 = 1120 Кб (объем изображения, в килобайтах)

1120 / 1024 = 1, 09375 Мб » 1, 1 Мб (объем изображения, в мегабайтах)

 

 

§4. Задачи для тренировки.

 

 

Задача 1. Энциклопедия содержит K страниц, S строк на странице, Q символов в строке. Один символ кодируется 1 байтом. Вычислить информационный объем энциклопедии (в байтах, в килобайтах, в мегабайтах)?

 

  K S Q
Задача 1.1.
Задача 1.2.

 

 

Задача 2. Сколько памяти (в байтах, в килобайтах, в мегабайтах) необходимо, чтобы закодировать изображение на экране компьютерного монитора, который может отображать T точек по горизонтали и Y по вертикали при W цветах.

 

  T Y W
Задача 2.1.
Задача 2.2.
Задача 2.3.
Задача 2.4.

 

 

Задача 3. Выразите K байт в битах, килобайтах и мегабайтах.

 

  T
Задача 3.1. 1 572 864
Задача 3.2. 31 457 280
Задача 3.3. 31 981 568

 

§5. Литература, источники

 

http: //marklv.narod.ru/inf/izminf.htm

http: //kspu.ptz.ru/~kafinfor/infproz/toppage51.htm

http: //ivan101.narod.ru/gos/inf/05.htm

http: //book.kbsu.ru/theory/chapter1/1_1_5.html

Методическое пособие по курсу «Информатика». Международный университет природы, общества и человека «Дубна». Дубна. 2000.

Шауцукова Л.З. Информатика 10 - 11

Угринович Н. Информатика и информационные технологии. 10-11 класс

 

 

Глава 2. Кодирование информации

 

§1. Введение.

 

Код – правило (алгоритм) сопоставления каждому конкретному сообщению строго определённой комбинации символов (или сигналов). Кодом также называется отдельная комбинация таких символов. Для различия этих терминов, код в последнем значении ещё называется кодовым словом.

 

Кодирование. Процесс преобразования сообщения в комбинацию символов в соответствии с кодом называется кодированием, процесс восстановления сообщения из комбинации символов называется декодированием.

 

Язык и информация. Кодирование информации. Алфавит кода.

 

Информация, воспринимаемая человеком в речевой или письменной форме, называется символьной, или знаковой информацией.

В письменном тексте содержатся буквы, знаки препинания, цифры и другие символы. Устная речь тоже складывается из знаков. Только эти знаки не письменные, а звуковые – фонемы. Из фонем складываются слова, из слов – фразы. Между письменными знаками и звуками есть прямая связь. Сначала появилась речь, а потом – письменность. Письменность для того и нужна, чтобы зафиксировать на бумаге человеческую речь. Отдельные буквы или сочетания букв обозначают звуки речи, а знаки препинания – паузы, интонацию.

Человеческая речь и письменность тесно связаны с понятием языка. У каждого народа свой национальный разговорный язык. Эти языки – русский, английский, китайский, французский – называются естественными языками. Естественные языки имеют устную и письменную формы.

Кроме разговорных (естественных) языков существуют формальные языки. Как правило, это языки какой-нибудь профессии или области знаний. Например, математическую символику можно назвать формальным языком математики; нотная грамота – формальный язык музыки.

 

Язык – это знаковая система представления информации.

Общение на языках – это процесс передачи информации в знаковой форме.

 

Каждый язык имеет свой алфавит. Например, русские буквы, математические символы, ноты.

Можно привести примеры разных способов знакового обмена информацией, заменяющих речь. Например, глухонемые люди речь заменяют жестикуляцией. Жесты дирижера передают информацию музыкантам. Судья на спортивной площадке пользуется определенным языком, жестов, понятным игрокам.

 

Однако запахи, вкусовые и осязательные ощущения не могут быть переданы с помощью знаков. Безусловно, они несут информацию, поскольку мы их запоминаем, узнаем. Такую информацию будем называть образной информацией. К образной относится также информация, воспринимаемая зрением и слухом: шум ветра, пение птиц, картины природы, живопись.

В живых организмах информация передается и хранится с помощью объектов различной физической природы (состояние нейрона, нуклеотиды в молекуле ДНК), которые могут рассматриваться как знаки биологических алфавитов.

 

ASCII

 

С распространением персональных компьютеров типа IBM PC международным стандартом стала таблица кодировки под названием ASCII (American Standard Code for Information Interchange) – Американский стандартный код для информационного обмена:

Стандартными в этой таблице являются только первые 128 символов, т.е. символы с номерами от нуля (двоичный код 00000000) до 127.(01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.

Остальные 128 кодов, начиная со 128 (двоичный код10000000) и кончая 255 (11111111), используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.

 

Принцип последовательного кодирования алфавита: в кодовой таблице ASCII латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Данное правило соблюдается и в других таблицах кодировки. Благодаря этому и в машинном представлении для символьной информации сохраняется понятие «алфавитный порядок».

 

Mac

 

Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.

 

Кодировка MacCyrillic используется только на компьютерах «Макинтош».

Благодаря отсутствию псевдографики и «верхних» управляющих символов эта кодировка включает довольно много полезных символов; кроме того, присутствуют все дополнительные буквы, необходимые для записи украинского, белорусского, македонского и сербского языков.

Нижняя часть таблицы кодировки (латиница) полностью соответствует кодировке ASCII. Числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.

 

***

 

Кроме того, что пользователь может работать на разных компьютерах, существует работа в компьютерных сетях. При этом отображение страницы интернет не всегда правильное. Часто пользователь вместо ожидаемого текста на родном языке видит «абракадабру» из символов. Данная проблема также связана с применением различных кодировок[1] для текстовой информации.

 

Заметим, что сегодня проходит работа по выработке единого стандарта, единой стандартной кодировки, понимаемой всеми и всегда…

 

§2.1. Основное понятие – «таблица кодировки»

 

Повторим, что:

Таблица кодировки – это таблица, в которой устанавливается соответствие между символами и их порядковыми номерами в компьютерном алфавите.

 

Для записи текстовой информации в компьютерах, как правило, используется кодирование символов последовательностями из восьми бит (что соответствует, как вы помните, одному байту). Один байт – один символ. Иными словами, для записи одной буквы, цифры или заковыристого значка применяется последовательность из восьми нулей и единиц. Какой же конкретно символ соответствует той или иной последовательности? Эти данные распознаются из так называемой «таблицы символов», которая знакома каждой программе, умеющей отображать текст.

Таблица символов (еще она называется «кодовой страницей») может храниться либо в самой программе, либо в операционной системе и предоставляться при каждом запросе. Получив последовательность из восьми бит, программа «смотрит» в таблицу символов и определяет по ней, какому символу эта последовательность бит соответствует.

Нетрудно понять, что таблица символов должна быть строжайшим стандартом – ведь, если текст был написан / закодирован одной таблицей символов, а пользователь читает эту последовательность в соответствии с данными другой кодовой страницы, то прочитать такой текст сможет только человек, долгие годы прослуживший в шифровальном отделе контрразведки. Для английского алфавита (латиницы) это действительно так: во всех существующих таблицах символов, использующихся в компьютерных программах, каждая латинская буква кодируется одной и только одной, твердо и строго определенной международными стандартами последовательностью бит. Такое соответствие байт и отображаемых символов было разработано почти двадцать лет назад на основе последовательности букв в латинском алфавите.

Но с помощью восьми бит можно закодировать до 256 символов – в самом деле, каждый бит может иметь значение 0 или 1, то есть одно из двух, следовательно, всего различных восьмибитовых последовательностей может быть 28=256. Английских же букв – 26, плюс еще столько же заглавных, цифры и служебные символы займут еще мест 50. Поэтому, для возможности адаптации операционных систем к другим алфавитным системам, в качестве международного стандарта было принято строгое соответствие отображаемым символам лишь первых 128 последовательностей восьми бит (от 0 по 127) – то есть первой половины кодовой страницы. А вторую половину отдали «на откуп» производителям регионального программного обеспечения и информационных ресурсов – чтобы они размещали в ней свои алфавиты.

Коды первых 128 символов кодовых страниц, которые должны быть едиными во всех таких страницах, получили название стандарта ASCII. Эти символы также могут кодироваться всего семью битами информации. Первые 32 кода (от 0 до 31) были назначены управляющим символам (например, символ с кодом 13 – это символ конца абзаца), остальные кодировали строчные и прописные латинские буквы, цифры, знаки препинания и математических операций.

Коды второй половины этой 256-символьной кодовой страницы получили название «расширенного» стандарта ASCII. Ими кодировались, как уже было сказано выше, национальные алфавиты, а также символы псевдографики, математические и некоторые другие символы. Вы можете легко отобразить на экране символ с желаемым кодом, набрав, например, в Word его код (десятичный, на цифровой клавиатуре) при удерживаемой клавише Alt.

Появились различные версии кодовых страниц, различающиеся именно своей второй половиной, которым были присвоены определенные номера для отличия их друг от друга. Чтобы пустое место в исходной английской кодовой странице не пропадало, на места, соответствующие кодам символов больше 127, были поставлены гласные буквы латиницы с надстрочными знаками, использующимися в разных европейских языках, а также символы, позволяющие в текстовом режиме создавать простейшие графические изображения – символы псевдографики. В региональных кодовых страницах на этих местах стали располагать символы отличных от английского алфавитов, таких, как русский, турецкий, вьетнамский, тайский и др.

 

§2.2. Российская особенность

 

В большинстве стран была создана одна кодовая страница для своего алфавита. Но Россия всегда шла своим путем.

Сегодня в России используются 5 таблиц кодировок символов, в каждой из которых первые 128 символов совпадают со стандартной кодировкой ASCII (8-битовые кодировки, «знающие» русский язык):

КОИ8,

СР1251,

СР866,

Мас,

ISO

 

Сравнение кодировок.

 

Характеристика KOI-8R (KOI-8) Win1251 (CP1251) Семейство кодировок 8859 (ISO) MAC (MacCyrillic) CP866
Сколько всего символов может закодировать? 28 = 256 символов 28 = 256 символов 28 = 256 символов (для каждой кодировки в семействе) 28 = 256 символов 28 = 256 символов
Сколько бит (байт) отводится для одного символа? 8-битная кодовая страница из серии ISO-8859
Какие символы содержит? 31 прописная и 32 строчных букв русского алфавита, 26 прописных и 26 строчных букв латинского алфавита, 10 цифр, 32 служебных знака и специальные символы, предназначенные для управления устройствами и передачи данных. наличие практически всех символов, использующихся в русской типографике для обычного текста (отсутствует только значок ударения); также содержит все символы для близких к русскому языку языков: украинского, белорусского, сербского и болгарского. стандарт ISO 8859-1 (так называемая Latin-1) стала стандартом для " расширенной" латиницы и содержит практически все символы западноевропейских языков. Так, многие шрифты для Windows соответствуют кодировке ISO 8859-1 начиная с позиции 160 до конца таблицы, а в диапазоне 128-159 содержат дополнительные символы (длинное тире или " торговая марка", например). кодам символов, большим 127, соответствовали русские буквы. Так как их всего 33, а с заглавными - 66, то в кодовой странице осталось место для символов псевдографики. отсутствию псевдографики и «верхних» управляющих символов эта кодировка включает довольно много полезных символов; кроме того, присутствуют все дополнительные буквы, необходимые для записи украинского, белорусского, македонского и сербского языков. Нижняя часть таблицы кодировки (латиница) полностью соответствует кодировке ASCII. Содержит те же символы, что и ISO-8859-5. Но отличалается от ISO-8859-5 порядком следования русских букв до строчной " р", а символы псевдографики кодируются в ней теми же кодами, что и в исходной английской таблице символов.
«Знает» ли русские буквы? да да да да да
Особенности, примечание Ошибка! Ошибка связи. Win1251 (CP1251, Code Page 1251, кодовая страница) – одна из наиболее распространенных в сети Интернет и персональных компьютерах (Windows). Все Windows приложения должны понимать эту кодировку без перевода. не очень удобная кодировка, поскольку в ней отсутствуют многие нужные символы, такие как тире (—), кавычки-ёлочки («»), градус (°) и др. Нет также буквы Ґ, используемой иногда в украинской письменности. Кириллическая кодировка этого семейства не получила широкого распространения Кодировка MacCyrillic используется только на компьютерах «Макинтош» CP866 (Code Page 866, кодовая страница) – MS DOS и OS/2. Её использует сеть ФИДО. иначе называется " альтернативная" кодировка

 

 

Пример.

Задание: Представьте в форме шестнадцатеричного кода слово " ЭВМ" во всех пяти кодировках. Воспользуйтесь таблицами (CP866, Mac, ISO и так далее), а затем переведите числа из десятичной в шестнадцатеричную систему счисления.

 

Последовательности десятичных кодов слова " ЭВМ" в различных кодировках составляем на основе кодировочных таблиц:

КОИ8-Р: 252 247 237

CP1251: 221 194 204

CP866: 157 130 140

Mac: 157 130 140

ISO: 205 178 188

 

Переводим последовательности кодов из десятичной системы в шестнадцатеричную:

КОИ8-Р: FC F7 ED

CP1251: DD C2 CC

CP866: 9D 82 8C

Mac: 9D 82 8C

ISO: CD B2 BC

 

Обратим внимание, что десятичные коды различны!

 

§3. Кодирование графической информации.

 

§3.1. Компьютерная графика. Представление графической информации в ЭВМ.

 

Компьютерная графика

 

Определение: Раздел информатики, занимающийся проблемами создания и обработки на компьютере графических изображений, называется компьютерной графикой.

 

Компьютерная графика сейчас стала основным средством связи между человеком и компьютером, постоянно расширяющим сферы своего применения, т.к. в графическом виде результаты становятся более наглядными и понятными.

Компьютерная графика – это область информатики, занимающаяся проблемами получения различных изображений (рисунков, чертежей, мультипликации) на компьютере.

Работа с компьютерной графикой – одно из самых популярных направлений использования персонального компьютера, причем занимаются этой работой не только профессиональные художники и дизайнеры. На любом предприятии время от времени возникает необходимость в подаче рекламных объявлений в газеты и журналы, в выпуске рекламной листовки или буклета. Иногда предприятия заказывают такую работу специальным дизайнерским бюро или рекламным агентствам, но часто обходятся собственными силами и доступными программными средствами.

Без компьютерной графики не обходится ни одна современная программа. Работа над графикой занимает до 90% рабочего времени программистских коллективов, выпускающих программы массового применения.

Основные трудозатраты в работе редакций и издательств тоже составляют художественные и оформительские работы с графическими программами.

Необходимость широкого использования графических программных средств стала особенно ощутимой в связи с развитием Интернета и, в первую очередь, благодаря службе World Wide Web, связавшей в единую " паутину" миллионы " домашних страниц". У страницы, оформленной без компьютерной графики мало шансов привлечь к себе массовое внимание. Область применения компьютерной графики не ограничивается одними художественными эффектами. Во всех отраслях науки, техники, медицины, в коммерческой и управленческой деятельности используются построенные с помощью компьютера схемы, графики, диаграммы, предназначенные для наглядного отображения разнообразной информации. Конструкторы, разрабатывая новые модели автомобилей и самолетов, используют трехмерные графические объекты, чтобы представить окончательный вид изделия. Архитекторы создают на экране монитора объемное изображение здания, и это позволяет им увидеть, как оно впишется в ландшафт.

«Картинки» на экране – это отображение информации, находящейся в компьютерной памяти (в виде двоичного кода).

 

История компьютерной графики.

 

Результатами расчетов на первых компьютерах являлись длинные колонки чисел, напечатанных на бумаге.

После этого человек вручную производил графическую обработку результатов: чертил графики, диаграммы, чертежи. В таком виде результаты становились более понятными.


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-05-03; Просмотров: 2126; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.143 с.)
Главная | Случайная страница | Обратная связь