Архивация vs backup почему они не заменяют друг друга

ЧАстые Вопросы и Ответы

Модераторы: kdv, CyberMax

Ответить
Заказчег Nat'а
Сообщения: 5
Зарегистрирован: 14 сен 2007, 11:55

Архивация vs backup почему они не заменяют друг друга

Сообщение Заказчег Nat'а » 17 апр 2009, 17:04

Имеется в виду уменьшение размера для транспортировки. Используем fb 1.5. Для максимального эффекта приходится бэкапить затем бэкап архивировать.
То что абстрактное сжатие данных не является прямой обязанностью бэкапа это я еще понять могу, но не понимаю почему сжатие базы и сжатие бэкапа дает разные размеры. База содержит не просто избыточную инфу а какую-то которую бэкап теряет навсегда? Или структура хранения настолько заумная что архиватор не усекает закономерностей?
На обывательский взгляд инфы в бэкапе ровно столько же сколько и в БД, а на взгляд математика одинаковое количество информации сжимается в приблизительно одинаковые размеры архивов. Развяжите этот узел в моей голове, спасибо!
PS если дело только в версиях записей, все равно мне этого мало т.к. думаю что архивация всех версий одной записи займет даже меньше чем сама запись т.к. она редко меняется больше чем на 10-20 процентов. Опровергните :)

Спасибо!

kdv
Forum Admin
Сообщения: 6595
Зарегистрирован: 25 окт 2004, 18:07

Re: Архивация vs backup почему они не заменяют друг друга

Сообщение kdv » 17 апр 2009, 17:44

но не понимаю почему сжатие базы и сжатие бэкапа дает разные размеры.
Потому что база это файл страничной организации (блоки размером page size, разные типы блоков вперемешку), а бэкап - "потоковый" файл, в который при бэкапе последовательно льются данные.
База содержит не просто избыточную инфу а какую-то которую бэкап теряет навсегда?
Разумеется. В самом начале статьи
http://www.ibase.ru/devinfo/gbak.htm
написано, что делает утилита gbak при бэкапе.
В бэкапе нет индексов, версий, мусора, страниц состояния транзакций, страниц указателей, и т.д.
На обывательский взгляд инфы в бэкапе ровно столько же сколько и в БД
Отнюдь. Выше я уже сказал, что количество информации разное. "Обывательский взгляд" при работе с СУБД - это очень плохо. Ликбез какой-то нужен, минимальный. А то Вы еще скажете, что вордовский файл и база практически ничем не отличаются. Как минимум они отличаются методами доступа - один файл последовательного доступа, а второй - произвольного.
думаю что архивация всех версий одной записи займет даже меньше чем сама запись т.к. она редко меняется больше чем на 10-20 процентов
версия - это дельта оригинальной записи, как правило сжатая (RLE). Так что архивировать там можно мало чего. И дельта может содержать не только 10-20%, а много больше (это можно увидеть в IBAnalyst), в зависимости от количества обновляемых полей.
Опровергните
Вы лучше посмотрите вот это
http://www.ibphoenix.com/main.nfs?a=ibp ... bp_expert2
здесь как раз описывается в общих чертах структура БД.

Заказчег Nat'а
Сообщения: 5
Зарегистрирован: 14 сен 2007, 11:55

Re: Архивация vs backup почему они не заменяют друг друга

Сообщение Заказчег Nat'а » 17 апр 2009, 18:21

Ну обывателем я скорее прикидывался, а вот за индексы страницы и прочую служебную инфу которая действительно избыточна, но не чисто дублирующая, спасибо :)

Ответить