Опубликовано 21 Янв 2011 в 15:16. В рубриках: Архивация данных. Вы можете следить за ответами к этой записи через RSS 2.0. Вы можете оставить отзыв или трекбек со своего сайта.
Поиск по сайту:
21 января 2011
Сжатие данных — самый действенный из способов сокращения места на жестком диске. Хранение и пересылка файлов в том виде, в котором они создаются программами, не представляют для пользователя никаких сложностей, кроме одной: в этих файлах содержится избыточная информация, из-за чего ресурсы ПК могут использоваться нерационально. Например, даже пустой документ Word занимает на диске несколько килобайт данных. Хранить такие файлы в первозданном виде — значит нерационально использовать объемы жесткого диска, а пересылать их по Интернету — увеличивать время и стоимость загрузки.Выход из ситуации подсказывает сама суть проблемы: уменьшив степень избыточности данных, можно уменьшить и размер файла. Помогут это сделать специальные программы-архиваторы, производящие слияние нескольких файлов в один и сокращение объема полученного архива до минимальных размеров (упаковку).
Уменьшение степени избыточности данных осуществляется благодаря использованию специального математического алгоритма. Один из самых известных методов архивирования носит название «кодирование по длинам серий» (Run-Length Encoding). Согласно этому методу сжатия, в исходном файле выделяются последовательности одинаковых символов (серии), которые затем заменяются на два символа: сам повторяющийся элемент и число его повторений. Например, последовательность AAAABBBCCCDD, сжатая с помощью этого алгоритма, будет сохранена так: A4B3C3D2.
Другой стандартный метод архивирования — кодирование с переменной длиной серии (Variable-Length Coding) — подразумевает замену наиболее часто употребляемых последовательностей символов простыми короткими кодами. Чем чаще встречается тот или иной набор знаков, тем более короткий код ему соответствует.
Насколько уменьшится размер данных, зависит от их типа. Стандартным значением для электронных документов является 40—50 % и более. Самые низкие показатели характерны для графических, видео- и аудиофайлов. Но это и неудивительно, ведь хранящаяся в них информация уже, как правило, сжата и практически не содержит избыточности.
Алгоритмы сжатия данных используются не только в архиваторах. Кодирование графической, аудио- и видеоинформации происходит похожим образом. Все алгоритмы сжатия можно разделить на два типа — без потерь и с потерями данных. Первые используются, когда необходимо полное совпадение данных до сжатия и после распаковки, например в случае с архивацией документов.
Алгоритмы второго типа сжатия применяются, если пользователю не требуется полное совпадение входной и обработанной информации, например, для уменьшения избыточности файлов, содержащих изображения и звук. Они основываются на нечувствительности человеческих органов восприятия к небольшим искажениям в представляемой информации. Примерами алгоритмов второго типа являются медиа-форматы МРЗ и MPEG.
Windows располагает встроенным средством для работы с наиболее распространенным стандартом сжатия ZIP, предоставляя пользователю возможность «прозрачного» управления архивами. Передвигаясь в Проводнике по каталогам и файлам, вы можете работать с ZIP-архивом как с обычным каталогом, заходя в него и осуществляя с содержащимися в нем файлами любые операции, доступные и для несжатых файлов. При необходимости создать архив достаточно выделить нужные файлы и/или каталоги, вызвать контекстное меню нажатием правой кнопки мыши и выбрать пункт Отправить. Далее в открывшемся подменю следует указать функцию Сжатая ZIP-папка. Чтобы распаковать архив, в контекстном меню выберите пункт Извлечь все…
комментарии (0)