Студопедия
Новини освіти і науки:
МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах


РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання


ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ"


ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ


Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків


Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні


Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах


Гендерна антидискримінаційна експертиза може зробити нас моральними рабами


ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ


ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів



Контакти
 


Тлумачний словник
Авто
Автоматизація
Архітектура
Астрономія
Аудит
Біологія
Будівництво
Бухгалтерія
Винахідництво
Виробництво
Військова справа
Генетика
Географія
Геологія
Господарство
Держава
Дім
Екологія
Економетрика
Економіка
Електроніка
Журналістика та ЗМІ
Зв'язок
Іноземні мови
Інформатика
Історія
Комп'ютери
Креслення
Кулінарія
Культура
Лексикологія
Література
Логіка
Маркетинг
Математика
Машинобудування
Медицина
Менеджмент
Метали і Зварювання
Механіка
Мистецтво
Музика
Населення
Освіта
Охорона безпеки життя
Охорона Праці
Педагогіка
Політика
Право
Програмування
Промисловість
Психологія
Радіо
Регилия
Соціологія
Спорт
Стандартизація
Технології
Торгівля
Туризм
Фізика
Фізіологія
Філософія
Фінанси
Хімія
Юриспунденкция






Принцип роботи архіваторів

Принцип роботи архіваторів заснований на пошуку у файлі «надлишкової» інформації і наступному її кодуванні з метою одержання мінімального обсягу. Найвідомішим методом архівації файлів є стиснення послідовностей однакових символів.

Наприклад, усередині файла знаходяться послідовності байтів, що часто повторюються. Замість того, щоб зберігати кожен байт, фіксується кількість повторюваних символів та їхня позиція. Файл, що потрібно архівувати займає 15 байт і складається з таких символів: B B B B B L L L L L A A A A A.

У шістнадцятковій системі — 42 42 42 42 42 4C 4C 4C 4C 4C 41 41 41 41 41.

Архіватор може представити цей файл у такому вигляді (шістнадцятковій): 01 05 42 06 05 4C 0A 05 41.

Це означає: з першої позиції п’ять разів повторюється символ “B”, з позиції 6 п’ять разів повторюється символ “L” і з позиції 11 п’ять разів повторюється символ “A”. Для збереження файла в такій формі буде потрібно всього 9 байт, що на 6 байт менше вихідного.

Описаний метод є простим і дуже ефективним способом стиску файлів. Однак він не забезпечує великої економії обсягу, якщо оброблюваний текст містить невелику кількість послідовностей повторюваних символів. Більш витончений метод стиску даних — це оптимальний префіксний код і, зокрема, кодування символами перемінної довжини (алгоритм Хаффмена).

Код перемінної довжини дозволяє записувати символи і групи символів, які найбільш часто зустрічаються лише з декількома бітами, у той час як символи і фрази, що рідко зустрічаються, будуть записані більш довгими бітовими рядками. Наприклад, у будь-якому англійському тексті буква E зустрічається частіше, ніж Z, а X і Q належать до рідко використовуваних. Таким чином, використовуючи спеціальну таблицю відповідності, можна закодувати кожну букву Е меншим числом біт і використовувати довший код для букв, які рідше вживаються.

Широко використовуютьалгоритм Лемпеля-Зіва. Ці архіватори класифікуються як адаптивні словникові кодувальники, у яких текстові рядки замінюються покажчиками на ідентичні їм рядки, що зустрічалися раніше в тексті.

Наприклад, якщо у вихідному потоці вже зустрічалася подібна послідовність байт, причому запис про її довжину й зсув від поточної позиції коротший за цю послідовність, то у вихідний файл записується посилання (зсув, довжина), а не сама послідовність.

Розповсюджений метод стиску RLE (англ. Run Length Encoding) — так зване «кодування повторів», при якому послідовність однакових символів замінюється парою - «код символу + кількість його повторів у ланцюжку». У більшості випадків ланцюжки однакових символів зустрічаються нечасто. Однак, наприклад, при кодуванні чорно-білих растрових зображень, кожен рядок яких складається з послідовних чорних або білих крапок, такий підхід виявляється досить ефективним (він широко застосовується при факсимільної передачі документів).

Розглянемо, наприклад, послідовність “ААААААА”. За допомогою алгоритму RLE вона буде закодована як “(А,7)”, у той же час її можна досить добре стиснути й за допомогою алгоритму LZ77 : “А(-1,6)”.

Дискретна форма подання інформації є найбільш загальною і універсальною. У вигляді сукупності символів, що належать до обмеженого алфавіту, можна представити як текст або масиви чисел, так і оцифровані звук і зображення. З урахуванням цього очевидно, що повинні існувати універсальні методи стиснення даних (цифрової інформації), які можуть бути застосовні до всіх її різновидів. В силу своєї універсальності ці методи повинні виключати втрату інформації (така втрата може бути допустима при передачі, наприклад, дрібної деталі зображення, але неприйнятна, коли йдеться, скажімо, про код програми).

З іншого боку, в ряді програм загальні методи напевно не будуть найбільш ефективними. Наприклад, в силу особливостей зорового і слухового сприйняття деякий «огрубіння» зображення або звуку може виявитися малопомітним, при цьому виграш в обсязі переданих даних виявиться значним. У цих випадках доречно використовувати спеціальні методи стиснення з втратами.

 

При архівації, як і при компресуванні, ступінь стиснення файлів залежить від формату файла. Графічні файли типу TIFF і GIF уже заздалегідь скомпресовані (хоча існує різновид формату TIFF і без компресії) і тут навіть найкращий архіватор мало що знайде для упакування. Зовсім інша картина спостерігається при архівації текстових файлів, файлів PostScript, файлів *.ВМР тощо.

Програм-архіваторів існує безліч. Наведемо деякі розширення імен архівних файлів:ARJ, ZIP, RAR, CAB, LHA, ICE, PAK, HA, ZOO, AIN, YAC, UC2, HAP, PAH, JAR, BOA, ACB, 777, X1, UFA, IMP, BIX, ARI, SQZ, AKT.

Існують архіватори, написані “для себе”, для використання усередині фірми і т.д.

 

До основних функцій архиваторів відносяться:

архівація зазначених файлів або всього поточного каталогу;

витяг окремих або всіх файлів з архіву;

перегляд вмісту архівного файлу;

перевірка цілісності архівів;

відновлення пошкоджених архівів;

ведення багатотомних архівів;

висновок файлів з архіву на екран або на друк;

парольний захист архіву.

 

WINZIP

WinZip — програма-архіватор, яку можна знайти практично на кожному персональному комп’ютері.

Стиск в архів документів Word (doc або rtf) дає дуже значну економію дискового простору (до 95%). Трохи більш скромний результат досягається при стисканні html-файлів (до 80%). Складніше з графічними файлами, bmp можна стиснути до 99%, а от, скажімо, при архівуванні tif, jpg, gif економія становить, відповідно, до 35, 25, 10%. Однак при відправленні файлів електронною поштою необхідно враховувати не лише їхній фізичний розмір, але їхнє число, адже на обробку запиту про відправлення кожного “причепленого” до листа файла теж потрібен час.

WINRAR

На світовому ринку програмних засобів відома як програма-архіватор з одним із кращих алгоритмів стискання даних. Підтримує багатотомне архівування, відновлення «зіпсованих» архівів, блокування їхньої модифікації. На відміну від WinZip, припустимий розмір файла для архівування необмежений (для WinZip – обмеження 4 Gb). У WinRar є присутня можливість скористатися спеціальним алгоритмом мультимедіа-стиснення, що оптимізує компресію оцифрованого звуку і графічних файлів.

WinRar надає можливість архівувати у форматі zip (правда, при цьому істотно обмежує функціональні можливості архівування). WinRar домагається істотно кращих результатів стискання в порівнянні з WinZip. Вам пропонується вибір: або універсальність формату або ефективність компресії. WinRar підтримує так зване «багатотомне» архівування, що значно перевершує за зручністю метод розбивки «на дискети», використовуваний у WinZip.

Проте, на користь останнього свідчить не лише широка розповсюдженність, але і той факт, що в середньому він архівує трохи швидше, ніж WinRar.

Головне в оцінці архіваторів — якість виконання своїх основних задач. А тут ключовими параметрами є якість стискання і швидкість роботи.

ARJ не так давно був одним з найбільш популярних форматів архівації даних. Зараз ARJ так само популярний, як і раніше.

CAB— це стандартний формат упакованих файлів фірми Microsoft. Відповідна програма упакування є одним із самих сучасних і оптимізованих продуктів. Алгоритми не публікуються і не описуються.

JAR— Java-архіватор. Стандартний формат, прийнятий при роботі з засобами Java. Заснований на форматі ZIP.

 


Читайте також:

  1. I. Аналіз контрольної роботи.
  2. II. Вимоги безпеки перед початком роботи
  3. II. Вимоги безпеки праці перед початком роботи
  4. II.ТЕОРЕТИЧНІ ПИТАННЯ КУРСОВОЇ РОБОТИ
  5. III. Вимоги безпеки під час виконання роботи
  6. III. Вимоги безпеки під час виконання роботи
  7. III. Вимоги безпеки під час виконання роботи
  8. III. ПОРЯДОК ПРОВЕДЕННЯ РОЗРАХУНКІВ КУРСОВОЇ РОБОТИ
  9. Internet. - це мережа з комутацією пакетів, і її можна порівняти з організацією роботи звичайної пошти.
  10. IV Етап: Вибір стратегії керування виявленими ризиками й виділення пріоритетних напрямків роботи
  11. IV. Вимоги безпеки під час роботи на навчально-дослідній ділянці
  12. IV. Вимоги безпеки після закінчення роботи




Переглядів: 4552

<== попередня сторінка | наступна сторінка ==>
Теоретичні відомості | Методи стиснення

Не знайшли потрібну інформацію? Скористайтесь пошуком google:

 

© studopedia.com.ua При використанні або копіюванні матеріалів пряме посилання на сайт обов'язкове.


Генерація сторінки за: 0.006 сек.