Программа, которая сжимает файл или группу файлов (каталог) в один архив с целью уменьшения их размера называется архиватор. Архивация файлов поможет существе сэкономить место на диске, с помощью переносного устройства (флешка, дискета) перенести больший объем информации, переслать большие файлы по электронной почте и т.п. Самые распространенные архиваторы – ZIP, ARJ, RAR, GZIP, LHA, HA, ACE. Архивы, созданные тем или иным архиватором, имеют расширение, соответствующее названию архиватора.
На рисунке приведен пример работы архиваторов исходный файл документ Microsoft Word имеет первоначальный размер 2398 Кбайт, после сжатия файла программами архиваторами его размер существе уменьшился почти в 15 раз. Также из примера видно различные программы архиваторы различаются степенью сжатия. Не стоит забывать и тот факт, что разные архиваторы могут работать хорошо с теми или иными типами данных, например одни хорошо сжимают текстовые данные, а другие графику.
К весьма важным особенностям архиваторов относиться создание многотомных архивов, например имеем исходный файл размером 10 Гбайт, нам его необходимо переслать по электронной почте, но возникает существенные трудности это ограничение отправляемых файлов по электронной почте 1 Гбайт. Тут на помощь и придет функция многотомного архива, который разделит исходный файл на небольшие архивы, а потом поможет все эти архивы собрать в один файл без потери данных.
Также у архиваторов есть полезная функция самораспаковывающийся архив, он представляет собой исполняемый файл, который включает в себя заархивированные данные и программу для их распаковки. Коэффициент сжатия таких архивов не большой за счет встроенной программы для распаковки архива, но зато есть уверенность, что его можно распаковать на любом компьютере даже где нет программ архивации.
Как же работает архиватор
Есть строчка символов «АААААААБББББВВВВВВВВВВГГГГГГ», ее длинна составляет 28 символов. Не трудно заметить, в ней много повторяющихся символов, поэтому эту строчку можно записать в виде количества повторений и самого повторяемого символа. В результате строчка приобретет вид «7А5Б10В6Г», и уже занимает всего 9 символов. Вот такой алгоритм сжатия будет применим не для всех данных. Используем тот же алгоритм, но строка будет иметь вид «АБВБГАБГВАВГБАГ» длинна 15 символов, после обработки, получим «1А1Б1В1Б1Г1А1Б1Г1В1А1В1Г1Б1А1Г» длинна строки увеличилась в двое. Вывод – один и тот же алгоритм сжатия для одних исходных данных сокращает их размер, а для других увеличивает.
Поэтому алгоритмов сжатия информации превеликое множество. Одни алгоритмы подходят для одних типов данных, а другие для других.
Хорошо сжимаются растровые изображения (BMP, PSD)
черно-белое чертежное качество – больше чем в 50 раз, цветные – 5-10 раз, цветные высокого качества в 2 раза и более.
Текстовые файлы также имеют высокий коэффициент сжатия от 5 и выше.
Коэффициент сжатия исполняемых файлов (EXE) в среднем равен 3.
Звуковые файлы (WAV, AU) редко дают хороший результат, и размер сокращается всего на 20-40 процентов.
Существует алгоритм сжатия с потерями качества, как правило применим для сжатия изображения или звука. Идея состоит в том, что человеческий глаз или ухо не очень восприимчивы к некоторым мелким деталям изображения или звука, поэтому лишнюю информацию можно просто отбросить. Такой подход используется в файлах формата JPEG, предназначенного для хранения статистических изображений, MPEG предназначен для хранения видео-аудио информации, также на сегодня популярный формат MP3 предназначен для хранения аудиоинформации.
Плохо архивируются, иногда даже бывает увеличиваются в размере файлы, данные которых уже сжаты:
- архивы – RAR, ZIP, ARJ и т.п.;
- графические файлы, которые имеют собственное сжатие – GIF, JPG, PNG другие;
- аудиофайлы – MP3;
- видеофайлы – MPG, AVI и другие;
- самораспаковывающие архивы.
Вам понравилась статья и есть желание помочь моему проекту, можете пожертвовать на дальнейшее развитие воспользовавшись формой ниже. Или достаточно просто открыть пару баннеров с рекламой, это тоже поможет мне, но и не затруднит Вас.