![]() |
Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
И – как мера уменьшения неопределённости знания
• Информацию (антиэнтропию), которую получает человек можно считать мерой уменьшения неопределённости знания. • Если сообщение приводит к уменьшению неопределённости знания, то оно содержит Информацию. (пример с поступлением, после экзамена была неопределённость, когда вывесили списки, то от незнания к полному знанию). • Подход к И как к мере уменьшения неопределённости знания позволяет количественно измерить И. (что необходимо для оценки объёма передаваемой И) ПРИМЕР: • Пусть имеется монета, которую мы бросаем на ровную поверхность. С равной вероятностью Р произойдёт одно из двух возможных событий: выпадет «Орёл» или «Решка». Можно говорить, что события равновероятны, если при возрастающем числе опытов число выпадений «орла» или «решки» сближаются (и в конце концов сравняются при очень большой серии опытов). • Перед броском существует неопределённость нашего знания ( возможны 2 события), после броска наступает полная определённость (реализовалось 1 событие). • Зрительное сообщение приводит к уменьшению неопределённости знания в 2 раза. • Часто встречаются ситуации, когда может произойти больше, чем 2 равновероятных событий. Так при бросании равносторонней 4-гранной пирамиды существуют 4 равновероятных события, а при бросании игрального кубика – 6 событий. Чем больше начальное количество равновероятных событий, тем больше начальная неопределённость нашего знания, тем большее количество И будет содержать сообщение о результатах опыта. • За единицу количества И принято такое количество И, которое содержит сообщение, уменьшающее неопределённость знания в 2 раза. Такая единица называется бит (Binary digit) – это минимальная единица представления (измерения) И. (такой подход рассматривает И с точки зрения содержания, т.е. образ монеты и слово «Орёл» и фраза: «Монета упала орлом вверх» несут одинаковое количество И, но при обработке и передачи И, И рассматривают как последовательность знаков (букв, цифр, кодов цвета точек изображения…)) • Наименьшая единица передачи И - байт, обработка в процессоре слово. Наименьшая единица хранения (обработки) И на внешних носителях – файл, (по кластерам), в интернете передача данных – пакетами, в БД на уровне записи - обработка данных. Скорость передачи И – количество бит/с, количество кодовых символов, передаваемых в сек – 1символ/с =1 бод – это техническая скорость передачи И. • 1байт=8бит; • 1Кбайт=210=1024 байт; К вопросу теории кодирования • Информационные биты преобразуются в кодовые символы, которые передаются по каналу связи. На приёмной стороне, принятые кодовые символы преобразуются в принятые информационные биты. Средняя часть формулы- техническая Скорость передачи И, а вся формула –информационная скорость передачи И. I→ CÞ C’→ I’
• В опыте с монетой количество полученной И = 1 биту. • Количество возможных событий (N) и количество Информации (I) связаны формулой: N=2I • Если мы получили 4 бита И, то количество возможных событий составляло: 24=16 Игра крестики-нолики
Если известно количество возможных событий (Например в игре крестики – нолики на поле 8х8 перед 1 ходом – 64 события), то для определения количества И нужно решить показательное уравнение
Т.е. количество И, полученной 2 игроком после 1 хода = 6бит
В.19 Формула Шеннона
• События могут иметь разные вероятности реализации. Формулу для вычисления количества И для таких событий предложил Шеннон в 1948 г
N – количество возможных событий Рi – вероятность отдельных событий
• пусть при бросании несимметричной 4-гранной пирамидки вероятности выпадения граней: р1=1/2; р2 = 1/4; р3 = 1/8; р4 = 1/8; • Тогда количество И, полученной после бросания такой пирамидки составит: I= - (1/2*log21/2+1/4*log21/4+2*1/8*log21/8) Log 21/2=-1; Log21/4=-2; Log21/8=-3; I=-(-1/2+1/4*(-2)+2*1/8*(-3))= = ½ +2/4+2*3/8=2/4+2/4+3/4=1.75bit • Для частного случая, когда события равновероятны:
Количество И достигает максимума, когда события равновероятны.
ИГРА УГАДАЙ ЧИСЛО. • Стратегия игры строится на получении максимального количества И ( интервал каждый раз делим пополам, тогда кол-во чисел в каждом интервале одинаково, и их выпадение равновероятно). Пусть загадано число 3 из возможных 16. На каждом шаге ответ игрока будет нести 1 бит И. В 20. Формы представления И. • Представление И в различных формах происходит в процессе восприятия мира, а также в процессах обмена И. • Преобразование И из одной формы в другую (кодирование) нужно для того, чтобы живые организмы, человек или К могли хранить, обрабатывать И в удобной для них форме, на понятном языке. Представление и кодирование И с помощью знаковых систем. • Для обмена И с другими людьми человек использует естественные языки. В основе лежит алфавит (набор знаков, которые различаются по начертанию в основе русского лежит кириллица – 33 знака, англ. – латиница – 26 знаков, китайский – 10ки тыс. иероглифов) • Наряду с естественными языками были разработаны формальные языки (системы счисления, языки программирования, алгебры и др.) • Представление И может осуществляться с помощью языков, которые являются знаковыми системами. Каждая знаковая система строится на основе определённого алфавита и правил выполнения операций над знаками (синтаксис)
Кодирование И • Кодирование – это операция преобразования знаков или групп знаков одной знаковой системы в знаки или группы знаков другой с/с. • В процессе преобразования И из одной формы в др. происходит кодирование и декодирование И (клавиатура, монитор). • Средством кодирования служит таблица соответствия знаковых систем, которая устанавливает взаимно однозначное соответствие между знаками различных систем. • При обработке и передачи И с помощью технических устройств, И рассматривают как последовательность знаков (букв, цифр, кодов цвета точек изображения). Исходя из вероятностного подхода к определению количества И алфавит можно рассматривать как различные возможные события. Если принять, что появления символов в сообщении равновероятно, то можно узнать какое количество И несёт каждый символ. Информационная ёмкость буквы русского алфавита: N=2I • 32=2I I=5 bit Количество И, которое содержит сообщение, закодированное с помощью знаковой системы, равно количеству И, которое несёт 1 знак, умноженному на число знаков в сообщении В21. Двоичное кодирование текстовой И • В настоящее время (с 60-х гг.) К используются для обработки текстовой И. Традиционно для кодирования 1 символа используется 1 байт И (8 bit). (при Unicode – 2 byte) • Если рассматривать символы как возможные события, то можно узнать какое количество символов можно закодировать с помощью 8 битов • N=2I = 28 =256 символов. Этого достаточно, чтобы закодировать заглавные и прописные буквы лат. и русск. алфавитов, цифры, знаки препинания и спец символы (напр. Псевдографики). • Кодирование заключается в том, что каждому символу ставится в соответствие уникальный 10-ый (0-255) или двоичный от 00000000 до 11111111 • При вводе текст. И (нажатие на клавиатуру) происходит его двоичное кодирование в последовательность из 8 эл. импульсов. Код символа храниться в памяти, где занимает 1 ячейку при выводе символа на экран происходит его декодирование (преобразование кода в изображение) • Присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется в кодовой таблице. Распределение кодов • Коды 0 -32 являются служебными и соответствуют действиям • Коды с 33-127 являются международными и соответствуют лат. Алфавиту, цифрам, знакам препинания, знакам арифметических операций. • Коды 128-255 явл. национальными (т.е. одному и тому же коду соответствуют разные символы) У нас 5 кодовых таблиц: • КОИ -8, Win1251, CP866, ISO, Mac • Тексты, созданные в одной кодировке неверно отображаются в др. 221 194 204 ЭВМ в 1251, в др. хаос (проги конверторы занимаются перекодировками)
• Международный стандарт Unicode отводит 2 байта на 1 символ, т.е. можно закодировать 216 =65536 символов (MSOffice) т.е. м. закодировать большие и малые буквы всех нац. Алфавитов и т.д. • ИГРА!!! В.22 Двоичное кодирование графической И • Компьютерная графика позволяет создавать рисунки, схемы, чертежи, видео, обрабатывать фото, слайды… • В процессе кодирования изображения происходит его пространственная дискретизация. Изображение разбивается на точки, где каждому элементу присваивается значение цвета. • Качество изображения зависит от размера точки и от количества цветов, а также определяется разрешающей способностью монитора. Растровая графика • Растровое изображение — это файл данных или структура, представляющая собой сетку пикселей или точек цветов (на практике прямоугольную) на компьютерном мониторе, бумаге и других отображающих устройствах и материалах. • Важными характеристиками изображения являются: • количество пикселей. Может указываться отдельно количество пикселей по ширине и высоте (1024*768, 640*480,...) или же, редко, общее количество пикселей (обычно измеряется в мегапикселях); • количество используемых цветов (или глубина цвета); • цветовое пространство RGB, CMYK, XYZ и др. • Растровую графику редактируют с помощью растровых графических редакторов. Создается растровая графика фотоаппаратами, сканерами, непосредственно в растровом редакторе, также путем экспорта из векторного редактора или в виде скриншотов. • Четырёхцветная автотипия (CMYK: Cyan, Magenta, Yellow, Key color) — субтрактивная схема формирования цвета, используемая прежде всего в полиграфии для стандартной триадной печати •
• Функции чувствительности XYZ для стандартного наблюдателя согласно CIE 1931, в диапазоне от 380 до 780 нм (с шагом 5 нм)
Достоинства • Растровая графика позволяет воспроизвести практически любой рисунок, вне зависимости от сложности, в отличие, например, от векторной, где невозможно точно передать эффект перехода от одного цвета к другому (в теории, конечно, возможно, но файл размером 1 МБ в формате BMP будет иметь размер 200 МБ в векторном формате). • Распространённость — растровая графика используется сейчас практически везде: от маленьких значков. • Высокая скорость обработки сложных изображений, если не нужно масштабирование. • Растровое представление изображения естественно для большинства устройств ввода/вывода графической информации, таких как монитор, принтер, цифровой фотоаппарат, сканер и др.
Недостатки • Большой размер файлов с простыми изображениями. • Невозможность идеального масштабирования. • Из‑ за этих недостатков для хранения простых рисунков рекомендуют вместо даже сжатой растровой графики использовать векторную графику. Форматы • Растровые изображения обычно хранятся в сжатом виде. В зависимости от типа сжатия может быть возможно или невозможно восстановить изображение в точности таким, каким оно было до сжатия (сжатие без потерь или сжатие с потерями соответственно). Так же в графическом фаиле может храниться дополнительная информация: об авторе фаила, фотокамере и её настройках, количестве точек на дюйм при печати и др. Сжатие без потерь • Использует алгоритмы сжатия, основанные на уменьшении избыточности информации. • PNG(Portable Network Graphics) • GIF (Graphics Interchange Format) — устаревающий формат, поддерживающий не более 256 цветов одновременно. Всё ещё популярен из‑ за поддержки анимации, которая отсутствует в чистом PNG, хотя ПО начинает поддерживать APNG. • BMP или Windows Bitmap — обычно используется без сжатия. • PCX устаревший формат, позволявший хорошо сжимать простые рисованые изображения (при сжатии группы подряд идущих пикселей одинакового цвета заменяются на запись о количестве таких пикселей и их цвете).
Сжатие с потерями • Основано на отбрасывании части информации (как правило наименее воспринимаемой глазом). • JPEG очень широко используемый формат изображений. Сжатие основано на усреднении цвета соседних пикселей (информация о яркости при этом не усредняется) и отбрасывании высокочастотных составляющих в пространственном спектре фрагмента изображения. При детальном рассмотрении сильно сжатого изображения заметно размытие резких границ и характерный муар вблизи них.
• TIFF поддерживает большой диапазон изменения глубины цвета, разные цветовые пространства, разные настройки сжатия (как с потерями, так и без) и др. • RAW хранит информацию, непосредственно получаемую с матрицы цифрового фотоаппарата без приминения к ней каких-либо преобразований, а так же хранит настройки фотокамеры. Позволяет избежать потери информации при приминении к изображению различных преобразований (потеря информации происходит в результате округления и выхода цвета пикселя за пределы допустимых значений). Используется при съёмке в сложных условиях (недостаточная освещённость, невозможность выставить баланс белого и т.п.) для последующей обработки на компьютере (обычно в ручном режиме). Практически все полупрофессиональные и профессиональные цифровые фотоаппараты позволяют сохранять RAW изображения. Формат фаила зависит от модели фотоаппарата, единого стандарта не существует. • Векторная графика • Ве́ кторная гра́ фика — это использование геометрических примитивов, таких как точки, линии, сплайны и многоугольники, для представления изображений в компьютерной графике. Термин используется в противоположность к растровой графике, которая представляет изображения как матрицу пикселей (точек). • Современные компьютерные видеодисплеи отображают информацию в растровом формате. Для отображения векторного формата на растровом используются преобразователи, программные или аппаратные, встроенные в видеокарту. • Кроме этого, существует узкий класс устройств, ориентированных исключительно на отображение векторных данных. К ним относятся мониторы с векторной развёрткой, графопостроители, а также некоторые типы лазерных проекторов. Способ хранения изображения • Рассмотрим, к примеру, окружность радиуса r. Список информации, необходимой для полного описания окружности, таков: • радиус r; • координаты центра окружности; • цвет и толщина контура (возможно прозрачный); • цвет заполнения (возможно прозрачный). Преимущества • Минимальное количество информации передаётся намного меньшему размеру файла (размер не зависит от величины объекта). • Соответственно, можно бесконечно увеличить, например, дугу окружности, и она останется гладкой. С другой стороны, если кривая представлена в виде ломаной линии, увеличение покажет, что она на самом деле не кривая. • При увеличении или уменьшении объектов толщина линий может быть постоянной. • Параметры объектов хранятся и могут быть изменены. Это означает, что перемещение, масштабирование, вращение, заполнение и т. д. не ухудшат качества рисунка. Более того, обычно указывают размеры в аппаратно-независимых единицах ((англ.)), которые ведут к наилучшей возможной растеризации на растровых устройствах. Недостатки. • Не каждый объект может быть легко изображен в векторном виде. Кроме того, количество памяти и времени на отображение зависит от числа объектов и их сложности. • Перевод векторной графики в растр достаточно прост. Но обратного пути, как правило, нет — трассировка растра обычно не обеспечивает высокого качества векторного рисунка. |
Последнее изменение этой страницы: 2017-03-14; Просмотров: 427; Нарушение авторского права страницы