Как работает дедупликация – Инструкция по эксплуатации Acronis Backup & Recovery 11.5 Advanced Server SBS Edition

Страница 234

Advertising
background image

234

Copyright © Acronis International GmbH, 2002-2012

7.5.7.2. Как работает дедупликация

Дедупликация в источнике

При выполнении резервного копирования в дедуплицирующее хранилище агент Acronis Backup &
Recovery 11.5 вычисляет цифровой отпечаток каждого блока данных. Такой цифровой отпечаток обычно
называют хэш-значением.

Прежде чем отправить блок данных в хранилище, агент запрашивает базу данных дедупликации, нет ли
уже в этом хранилище блока с таким хэш-значением. Если да, то агент отправляет только хэш-значение
элемента. В противном случае отправляется сам блок. Узел хранения сохраняет полученные блоки
данных во временном файле.

Некоторые данные, такие как зашифрованные файлы или дисковые блоки нестандартного размера, не
могут быть дедуплицированы. Агент всегда передает такие данные в хранилище без вычисления их хэш-
значений. Дополнительные сведения об ограничениях дедупликации см. в разделе Ограничения
дедупликации (стр. 238).

По завершении процесса дедупликации хранилище содержит полученную в результате резервную
копию и временный файл с уникальными блоками данных. Временный файл обрабатывается на
следующем этапе. Резервная копия (TIB-файл) содержит хэш-значения и данные, которые не удалось
дедуплицировать. Дальнейшая обработка этой резервной копии не требуется. Она готова для
восстановления данных из нее.

Дедупликация в месте назначения

Когда резервное копирование в дедуплицирующее хранилище завершается, узел хранения запускает
действие индексирования. Это действие дедуплицирует данные в хранилище следующим образом.

1. Блоки данных перемещаются из временного файла в специальный файл в хранилище, при

этом повторяющиеся элементы сохраняются только один раз. Этот файл называется папкой
дедуплицированных данных
.

2. Хэш-значения и ссылки, необходимые для «сборки» дедуплицированных данных,

сохраняются в базе данных дедупликации.

3. После перемещения всех блоков данных временный файл удаляется.

В результате хранилище данных содержит некоторое количество уникальных блоков данных. На каждый
блок указывает одна или несколько ссылок из резервных копий. Эти ссылки хранятся в базе данных
дедупликации. Резервные копии остаются без изменений. Они содержат хэш-значения и данные,
которые не удалось дедуплицировать.

Advertising