Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Тема 5. Сжатие данных. Архивация данных.



Позиция 29 Сжатие информации

                   
   
Под сжатием данных понимают такое перекодирование исходной последовательности данных, при котором объем данных уменьшается, а их информационное содержание сохраняется в заданных пределах.
 
   
Сжатие данных основано на избыточности исходных данных. Чем больше избыточность исходных данных, тем в большей степени могут быть сжаты эти данные.
 
   
 
 
 
   
 
   

 

 


Вопросы для самостоятельного изложения

В каких случаях, и для каких целей необходимо сжимать данные?

 

Сжатие данных - Алгоритмическое преобразование данных, производимое с целью уменьшения их объёма. Применяется для более рационального использования устройств хранения и передачи данных.

 

На чем основана возможность сжатия данных? В каких случаях сжатие данных невозможно?

Сжатие основано на устранении избыточности, содержащейся в исходных данных. Простейшим примером избыточности является повторение в тексте фрагментов (например, слов естественного или машинного языка).

Сжатие данных, не обладающих свойством избыточности (например, случайный сигнал или шум, зашифрованные сообщения), принципиально невозможно без потерь.

 

В каких случаях можно использовать сжатие с потерями, в каких — без потерь? Чем различаются обратимые и необратимые методы сжатия данных?

При использовании сжатия без потерь возможно полное восстановление исходных данных, сжатие с потерями позволяет восстановить данные с искажениями, обычно несущественными с точки зрения дальнейшего использования восстановленных данных. Сжатие без потерь обычно используется для передачи и хранения текстовых данных, компьютерных программ, реже — для сокращения объёма аудио- и видеоданных, цифровых фотографий и т. п., в случаях, когда искажения недопустимы или нежелательны. Сжатие с потерями, обладающее значительно большей, чем сжатие без потерь, эффективностью, обычно применяется для сокращения объёма аудио- и видеоданных и цифровых фотографий в тех случаях, когда такое сокращение является приоритетным, а полное соответствие

Под необратимым сжатием подразумевают такое преобразование входного потока данных, при котором выходной поток, основанный на определенном формате информации, представляет, с некоторой точки зрения, достаточно похожий по внешним характеристикам на входной поток объект, однако отличается от него объемом.

Степень сходства входного и выходного потоков определяется степенью соответствия некоторых свойств объекта (т.е. сжатой и несжатой информации, в соответствии с некоторым определенным форматом данных), представляемого данным потоком информации

Обратимое сжатие всегда приводит к снижению объема выходного потока информации без изменения его информативности, т.е. - без потери информационной структуры. Более того, из выходного потока, при помощи восстанавливающего или декомпрессирующего алгоритма, можно получить входной, а процесс восстановления называется декомпрессией или распаковкой, и только после процесса распаковки данные пригодны для обработки в соответствии с их внутренним форматом.

Какой класс программ используется для сжатия данных? На каких принципах эти программы работают? Есть ли универсальные программы сжатия данных, которые оптимальны для данных любого вида?

 

Архиваторы – это программы, позволяющие создавать и обрабатывать архивные копии файлов. При этом архивные копии имеют меньший размер, чем оригиналы. С помощью специальных алгоритмов сжатия из файлов удаляется вся избыточная информация, при применения обратных алгоритмов распаковки архивная копия восстанавливается в первоначальном виде. Принцип работы архиваторов основан на поиске в файле " избыточной" информации и последующем ее кодировании с целью получения минимального объема. Самым известным методом архивации файлов является сжатие последовательностей одинаковых символов. ZIP, RAR

 

В каких случаях эффективно использовать непрерывный архив? Ответ обоснуйте.

Непрерывные архивы. Очень высокий выигрыш в размере (10-50%), особенно при архивировании большого количества малых файлов, получается при использовании опции создания непрерывных архивов. В этом случае все данные будут архивироваться в виде одного большого файла, а не каждый по отдельности. Это значительно увеличивает эффективность сжатия информации

 

 

Какой принцип лежит в основе алгоритма RLE?

 

В основе алгоритма RLE лежит идея выявления повторяющихся последовательностей данных и замены их более простой структурой, в которой указывается код данных и коэффициент повторения.

Чем меньше значение коэффициента сжатия, тем эффективней метод сжатия.

 

Какой принцип лежит в основе алгоритма KWE?

 

В основе алгоритма сжатия по ключевым словам положен принцип кодирования лексических единиц группами байт фиксированной длины. Примером лексической единицы может быть обычное слово. На практике, на роль лексических единиц выбираются повторяющиеся последовательности символов, которые кодируются цепочкой символов (кодом) меньшей длины. Результат кодирования помещается в таблице, образовывая так называемый словарь.

 

Какой принцип лежит в основе алгоритма Хаффмана?

 

В основе алгоритма Хаффмана лежит идея кодирования битовыми группами. Сначала проводится частотный анализ входной последовательности данных, то есть устанавливается частота вхождения каждого символа, встречащегося в ней. После этого, символы сортируются по уменьшению частоты вхождения.

Основная идея состоит в следующем: чем чаще встречается символ, тем меньшим количеством бит он кодируется. Результат кодирования заносится в словарь, необходимый для декодирования.

 

Перечислите, какие типы архивов можно создавать с помощью программы WinRAR? Укажите характерные отличия каждого из перечисленных типов архивов.

RAR — распространённый проприетарный формат сжатия данных и программа-архиватор. Архиватор RAR позволяет разбить сжимаемый файл на несколько томов (частей). Это бывает необходимо для записи архива на носители небольшого объёма (дискеты, CD-R). Например, популярный архиватор ZIP не даёт такой возможности.

Zip - популярный формат сжатия данных и архивации файлов. Файл в этом формате обычно имеет расширение.zip и хранит в сжатом или несжатом виде один или несколько файлов, которые можно из него извлечь путём распаковки с помощью специальной программы.

 


Глоссарий

CMYK

RGB

А

Адресная шина

Архитектура компьютера

Б


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-04-10; Просмотров: 741; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.015 с.)
Главная | Случайная страница | Обратная связь