Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


И – как мера уменьшения неопределённости знания



• Информацию (антиэнтропию), которую получает человек можно считать мерой уменьшения неопределённости знания.

• Если сообщение приводит к уменьшению неопределённости знания, то оно содержит Информацию. (пример с поступлением, после экзамена была неопределённость, когда вывесили списки, то от незнания к полному знанию).

• Подход к И как к мере уменьшения неопределённости знания позволяет количественно измерить И. (что необходимо для оценки объёма передаваемой И)

ПРИМЕР:

• Пусть имеется монета, которую мы бросаем на ровную поверхность. С равной вероятностью Р произойдёт одно из двух возможных событий: выпадет «Орёл» или «Решка». Можно говорить, что события равновероятны, если при возрастающем числе опытов число выпадений «орла» или «решки» сближаются (и в конце концов сравняются при очень большой серии опытов).

• Перед броском существует неопределённость нашего знания ( возможны 2 события), после броска наступает полная определённость (реализовалось 1 событие).

• Зрительное сообщение приводит к уменьшению неопределённости знания в 2 раза.

• Часто встречаются ситуации, когда может произойти больше, чем 2 равновероятных событий. Так при бросании равносторонней 4-гранной пирамиды существуют 4 равновероятных события, а при бросании игрального кубика – 6 событий. Чем больше начальное количество равновероятных событий, тем больше начальная неопределённость нашего знания, тем большее количество И будет содержать сообщение о результатах опыта.

За единицу количества И принято такое количество И, которое содержит сообщение, уменьшающее неопределённость знания в 2 раза. Такая единица называется бит (Binary digit) – это минимальная единица представления (измерения) И. (такой подход рассматривает И с точки зрения содержания, т.е. образ монеты и слово «Орёл» и фраза: «Монета упала орлом вверх» несут одинаковое количество И, но при обработке и передачи И, И рассматривают как последовательность знаков (букв, цифр, кодов цвета точек изображения…))

• Наименьшая единица передачи И - байт, обработка в процессоре слово. Наименьшая единица хранения (обработки) И на внешних носителях – файл, (по кластерам), в интернете передача данных – пакетами, в БД на уровне записи - обработка данных. Скорость передачи И – количество бит/с, количество кодовых символов, передаваемых в сек – 1символ/с =1 бод – это техническая скорость передачи И.

• 1байт=8бит;

• 1Кбайт=210=1024 байт;

К вопросу теории кодирования

• Информационные биты преобразуются в кодовые символы, которые передаются по каналу связи. На приёмной стороне, принятые кодовые символы преобразуются в принятые информационные биты. Средняя часть формулы- техническая Скорость передачи И, а вся формула –информационная скорость передачи И. I→ CÞ C’→ I’

 

• В опыте с монетой количество полученной И = 1 биту.

• Количество возможных событий (N) и количество Информации (I) связаны формулой: N=2I

• Если мы получили 4 бита И, то количество возможных событий составляло: 24=16

Игра крестики-нолики

 

Если известно количество возможных событий (Например в игре крестики – нолики на поле 8х8 перед 1 ходом – 64 события), то для определения количества И нужно решить показательное уравнение I=6bit

 

Т.е. количество И, полученной 2 игроком после 1 хода = 6бит

 

В.19 Формула Шеннона

 

 

• События могут иметь разные вероятности реализации. Формулу для вычисления количества И для таких событий предложил Шеннон в 1948 г

 

Где: I – Количество И

N – количество возможных событий

Рi – вероятность отдельных событий

 

 

• пусть при бросании несимметричной 4-гранной пирамидки вероятности выпадения граней: р1=1/2; р2 = 1/4; р3 = 1/8; р4 = 1/8;

• Тогда количество И, полученной после бросания такой пирамидки составит:

I= - (1/2*log21/2+1/4*log21/4+2*1/8*log21/8)

Log 21/2=-1; Log21/4=-2; Log21/8=-3;

I=-(-1/2+1/4*(-2)+2*1/8*(-3))=

= ½ +2/4+2*3/8=2/4+2/4+3/4=1.75bit

Для частного случая, когда события равновероятны:

 

Количество И достигает максимума, когда события равновероятны.
При бросании симметричной 4-хгранной пирамидки:

 

ИГРА УГАДАЙ ЧИСЛО.

• Стратегия игры строится на получении максимального количества И ( интервал каждый раз делим пополам, тогда кол-во чисел в каждом интервале одинаково, и их выпадение равновероятно). Пусть загадано число 3 из возможных 16. На каждом шаге ответ игрока будет нести 1 бит И.

В 20. Формы представления И.

• Представление И в различных формах происходит в процессе восприятия мира, а также в процессах обмена И.

• Преобразование И из одной формы в другую (кодирование) нужно для того, чтобы живые организмы, человек или К могли хранить, обрабатывать И в удобной для них форме, на понятном языке.

Представление и кодирование И с помощью знаковых систем.

• Для обмена И с другими людьми человек использует естественные языки. В основе лежит алфавит (набор знаков, которые различаются по начертанию в основе русского лежит кириллица – 33 знака, англ. – латиница – 26 знаков, китайский – 10ки тыс. иероглифов)

• Наряду с естественными языками были разработаны формальные языки (системы счисления, языки программирования, алгебры и др.)

Представление И может осуществляться с помощью языков, которые являются знаковыми системами. Каждая знаковая система строится на основе определённого алфавита и правил выполнения операций над знаками (синтаксис)

 

Кодирование И

Кодирование – это операция преобразования знаков или групп знаков одной знаковой системы в знаки или группы знаков другой с/с.

• В процессе преобразования И из одной формы в др. происходит кодирование и декодирование И (клавиатура, монитор).

Средством кодирования служит таблица соответствия знаковых систем, которая устанавливает взаимно однозначное соответствие между знаками различных систем.

• При обработке и передачи И с помощью технических устройств, И рассматривают как последовательность знаков (букв, цифр, кодов цвета точек изображения). Исходя из вероятностного подхода к определению количества И алфавит можно рассматривать как различные возможные события. Если принять, что появления символов в сообщении равновероятно, то можно узнать какое количество И несёт каждый символ. Информационная ёмкость буквы русского алфавита: N=2I

• 32=2I I=5 bit

Количество И, которое содержит сообщение, закодированное с помощью знаковой системы, равно количеству И, которое несёт 1 знак, умноженному на число знаков в сообщении

В21. Двоичное кодирование текстовой И

• В настоящее время (с 60-х гг.) К используются для обработки текстовой И. Традиционно для кодирования 1 символа используется 1 байт И (8 bit). (при Unicode – 2 byte)

• Если рассматривать символы как возможные события, то можно узнать какое количество символов можно закодировать с помощью 8 битов

• N=2I = 28 =256 символов. Этого достаточно, чтобы закодировать заглавные и прописные буквы лат. и русск. алфавитов, цифры, знаки препинания и спец символы (напр. Псевдографики).

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный 10-ый (0-255) или двоичный от 00000000 до 11111111

• При вводе текст. И (нажатие на клавиатуру) происходит его двоичное кодирование в последовательность из 8 эл. импульсов. Код символа храниться в памяти, где занимает 1 ячейку при выводе символа на экран происходит его декодирование (преобразование кода в изображение)

Присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется в кодовой таблице.

Распределение кодов

• Коды 0 -32 являются служебными и соответствуют действиям

• Коды с 33-127 являются международными и соответствуют лат. Алфавиту, цифрам, знакам препинания, знакам арифметических операций.

• Коды 128-255 явл. национальными (т.е. одному и тому же коду соответствуют разные символы) У нас 5 кодовых таблиц:

• КОИ -8, Win1251, CP866, ISO, Mac

• Тексты, созданные в одной кодировке неверно отображаются в др. 221 194 204 ЭВМ в 1251, в др. хаос (проги конверторы занимаются перекодировками)

 

• Международный стандарт Unicode отводит 2 байта на 1 символ, т.е. можно закодировать 216 =65536 символов (MSOffice) т.е. м. закодировать большие и малые буквы всех нац. Алфавитов и т.д.

• ИГРА!!!

В.22 Двоичное кодирование графической И

• Компьютерная графика позволяет создавать рисунки, схемы, чертежи, видео, обрабатывать фото, слайды…

• В процессе кодирования изображения происходит его пространственная дискретизация. Изображение разбивается на точки, где каждому элементу присваивается значение цвета.

• Качество изображения зависит от размера точки и от количества цветов, а также определяется разрешающей способностью монитора.

Растровая графика

Растровое изображение — это файл данных или структура, представляющая собой сетку пикселей или точек цветов (на практике прямоугольную) на компьютерном мониторе, бумаге и других отображающих устройствах и материалах.

• Важными характеристиками изображения являются:

• количество пикселей. Может указываться отдельно количество пикселей по ширине и высоте (1024*768, 640*480,...) или же, редко, общее количество пикселей (обычно измеряется в мегапикселях);

• количество используемых цветов (или глубина цвета);

• цветовое пространство RGB, CMYK, XYZ и др.

• Растровую графику редактируют с помощью растровых графических редакторов. Создается растровая графика фотоаппаратами, сканерами, непосредственно в растровом редакторе, также путем экспорта из векторного редактора или в виде скриншотов.

Четырёхцветная автотипия (CMYK: Cyan, Magenta, Yellow, Key color) — субтрактивная схема формирования цвета, используемая прежде всего в полиграфии для стандартной триадной печати

CIE XYZ — линейная 3-компонентная цветовая модель, основанная на результатах измерения характеристик человеческого глаза.

 

• Функции чувствительности XYZ для стандартного наблюдателя согласно CIE 1931, в диапазоне от 380 до 780 нм (с шагом 5 нм)

 

Достоинства

• Растровая графика позволяет воспроизвести практически любой рисунок, вне зависимости от сложности, в отличие, например, от векторной, где невозможно точно передать эффект перехода от одного цвета к другому (в теории, конечно, возможно, но файл размером 1 МБ в формате BMP будет иметь размер 200 МБ в векторном формате).

• Распространённость — растровая графика используется сейчас практически везде: от маленьких значков.

• Высокая скорость обработки сложных изображений, если не нужно масштабирование.

• Растровое представление изображения естественно для большинства устройств ввода/вывода графической информации, таких как монитор, принтер, цифровой фотоаппарат, сканер и др.

 

Недостатки

• Большой размер файлов с простыми изображениями.

• Невозможность идеального масштабирования.

• Из‑ за этих недостатков для хранения простых рисунков рекомендуют вместо даже сжатой растровой графики использовать векторную графику.

Форматы

• Растровые изображения обычно хранятся в сжатом виде. В зависимости от типа сжатия может быть возможно или невозможно восстановить изображение в точности таким, каким оно было до сжатия (сжатие без потерь или сжатие с потерями соответственно). Так же в графическом фаиле может храниться дополнительная информация: об авторе фаила, фотокамере и её настройках, количестве точек на дюйм при печати и др.

Сжатие без потерь

• Использует алгоритмы сжатия, основанные на уменьшении избыточности информации.

• PNG(Portable Network Graphics)

• GIF (Graphics Interchange Format) — устаревающий формат, поддерживающий не более 256 цветов одновременно. Всё ещё популярен из‑ за поддержки анимации, которая отсутствует в чистом PNG, хотя ПО начинает поддерживать APNG.

• BMP или Windows Bitmap — обычно используется без сжатия.

• PCX устаревший формат, позволявший хорошо сжимать простые рисованые изображения (при сжатии группы подряд идущих пикселей одинакового цвета заменяются на запись о количестве таких пикселей и их цвете).

 

Сжатие с потерями

• Основано на отбрасывании части информации (как правило наименее воспринимаемой глазом).

• JPEG очень широко используемый формат изображений. Сжатие основано на усреднении цвета соседних пикселей (информация о яркости при этом не усредняется) и отбрасывании высокочастотных составляющих в пространственном спектре фрагмента изображения. При детальном рассмотрении сильно сжатого изображения заметно размытие резких границ и характерный муар вблизи них.

 

• TIFF поддерживает большой диапазон изменения глубины цвета, разные цветовые пространства, разные настройки сжатия (как с потерями, так и без) и др.

• RAW хранит информацию, непосредственно получаемую с матрицы цифрового фотоаппарата без приминения к ней каких-либо преобразований, а так же хранит настройки фотокамеры. Позволяет избежать потери информации при приминении к изображению различных преобразований (потеря информации происходит в результате округления и выхода цвета пикселя за пределы допустимых значений). Используется при съёмке в сложных условиях (недостаточная освещённость, невозможность выставить баланс белого и т.п.) для последующей обработки на компьютере (обычно в ручном режиме). Практически все полупрофессиональные и профессиональные цифровые фотоаппараты позволяют сохранять RAW изображения. Формат фаила зависит от модели фотоаппарата, единого стандарта не существует.

Векторная графика

Ве́ кторная гра́ фика — это использование геометрических примитивов, таких как точки, линии, сплайны и многоугольники, для представления изображений в компьютерной графике. Термин используется в противоположность к растровой графике, которая представляет изображения как матрицу пикселей (точек).

• Современные компьютерные видеодисплеи отображают информацию в растровом формате. Для отображения векторного формата на растровом используются преобразователи, программные или аппаратные, встроенные в видеокарту.

• Кроме этого, существует узкий класс устройств, ориентированных исключительно на отображение векторных данных. К ним относятся мониторы с векторной развёрткой, графопостроители, а также некоторые типы лазерных проекторов.

Способ хранения изображения

• Рассмотрим, к примеру, окружность радиуса r. Список информации, необходимой для полного описания окружности, таков:

• радиус r;

• координаты центра окружности;

• цвет и толщина контура (возможно прозрачный);

• цвет заполнения (возможно прозрачный).

Преимущества

• Минимальное количество информации передаётся намного меньшему размеру файла (размер не зависит от величины объекта).

• Соответственно, можно бесконечно увеличить, например, дугу окружности, и она останется гладкой. С другой стороны, если кривая представлена в виде ломаной линии, увеличение покажет, что она на самом деле не кривая.

• При увеличении или уменьшении объектов толщина линий может быть постоянной.

• Параметры объектов хранятся и могут быть изменены. Это означает, что перемещение, масштабирование, вращение, заполнение и т. д. не ухудшат качества рисунка. Более того, обычно указывают размеры в аппаратно-независимых единицах ((англ.)), которые ведут к наилучшей возможной растеризации на растровых устройствах.

Недостатки.

• Не каждый объект может быть легко изображен в векторном виде. Кроме того, количество памяти и времени на отображение зависит от числа объектов и их сложности.

• Перевод векторной графики в растр достаточно прост. Но обратного пути, как правило, нет — трассировка растра обычно не обеспечивает высокого качества векторного рисунка.


Поделиться:



Последнее изменение этой страницы: 2017-03-14; Просмотров: 393; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.043 с.)
Главная | Случайная страница | Обратная связь