Распечатать

Storage News, № 3, 2006

О пользе резервного копирования на диски.

10 октября 2006

О пользе резервного копирования на диски.

В статье рассматриваются варианты использования дисковых систем для решения отдельных задач резервного копирования в крупных информационных системах. Дается оценка преимуществ применения дисковых подсистем совместно с ленточными устройствами.
Введение
В настоящее время распространение и удешевление технологий расширяют возможности по созданию действительно эффективных IT-решений. “Элитарные” функции, которые раньше были представлены только в устройствах высшей лиги – HiEnd – сейчас доступны и для наиболее простых и дешевых решений, ориентированных на обслуживание небольших компаний, отделов и рабочих групп. Это относится и к дисковым массивам (технологии виртуализации, управления томами, репликация), и к ленточным устройствам (модульность, деление на независимые логические устройства, поддержка накопителей разных типов). Уместное использование этих технологий, как правило, позволяет повысить производительность вычислительного комплекса и сэкономить средства.
Рассмотрим далее некоторые перспективные направления развития корпоративных систем резервного копирования (СРК), которые появились в связи с удешевлением дисковых систем, и которые позволяют упростить решение различных типовых задач.
Исторические предпосылки
В течение последних лет технологии резервного копирования данных на дисковые устройства стали обязательным элементом любого проекта. Интерес к таким решениям непрерывно растет. Подобная ситуация связана как с удешевлением соответствующего оборудования и развитием сетей хранения данных, так и с расширением поддержки этой функциональности со стороны основных производителей программного обеспечения резервного копирования.
Сама по себе идея проводить резервное копирование на дисковые устройства совсем не нова. Во многих организациях с небольшими объемами данных этот метод резервирования вообще является единственным. Новым можно считать лишь то, для решения каких задач эта технология теперь применяется.
Для использования технологий резервного копирования на диски в больших информационных системах с большими объемами данных сдерживающим фактором долгое время являлась дороговизна дисковых устройств достаточного объема. Эта ситуация в корне изменилась с развитием рынка модульных RAID-массивов среднего и начального уровней и появлением в них поддержки дисков стандартов ATA/SATA.
Со времен возникновения стандарта диски ATA ориентировались на потребительский рынок и редко использовались в качестве основы для построения промышленных устройств. Там, где нужна скорость и надежность, используются диски Fibre Channel или SCSI. Диски ATA менее надежны, имеют меньшую скорость вращения и их контроллеры не имеют резервирования интерфейсов. В то же время такие характеристики, как дешевизна и большая емкость этих дисков, оказались очень востребованы для хранения резервных копий и других типов данных с меньшими требованиями к доступности. Удешевление RAID-контроллеров позволило компенсировать недостатки надежности и производительности за счет избыточности и использования большого числа дисков.
 
Новые возможности
Преимущества копирования на диски определяются возможностью непосредственного доступа к данным и многопоточностью. Это позволяет закрыть сразу несколько проблем, возникающих при резервном копировании большого числа клиентов – источников данных, таких, как конфликты за использование накопителей, сложность обеспечения равномерной загрузки, неэффективная обработка параллельных потоков.
Одним из применений технологий резервного копирования на диски является оптимизация потоков на устройства хранения. В классической СРК существует проблема копирования “медленных” клиентов – источников данных, которые по каким-либо причинам не могут обеспечить высокую скорость передачи данных. При копировании таких клиентов на быстрые ленточные накопители невозможно обеспечить требуемый поток данных. Накопители оказываются занятыми, но недогруженными, общее время резервного копирования увеличивается, ресурсы СРК используются неэффективно (рис. 1).
Для оптимизации нагрузки при копировании медленных клиентов обычно используют технологию программного мультиплексирования. Потоки данных нескольких таких клиентов агрегируются и пишутся через один ленточный накопитель. При этом на ленту в пределах одного потока записывается последовательность блоков данных разных клиентов. Это приводит к тому, что в процессе восстановления тратится дополнительное время на сбор данных, относящихся к одному клиенту. Использование дисков позволяет писать потоки таких клиентов параллельно в отдельные файлы, обеспечивая простую процедуру восстановления.
Хранение резервных копий на дисках позволяет снизить объем данных, передаваемых в рамках сессий резервного копирования. Обычная практика резервного копирования больших файловых архивов заключается в чередовании полных и инкрементальных копий. При инкрементальном копировании на сервер передаются только данные, изменившиеся со времени создания предыдущей копии – полной или инкрементальной. Такой подход позволяет уменьшить суммарный объем хранимых данных, но увеличивает вероятное время восстановления, так как актуальные данные приходится “собирать” из нескольких последовательных копий. Чем реже производится полное резервное копирование, тем большую работу приходится проделывать при восстановлении. Этого можно избежать, если периодически компоновать новые полные копии из набора “полная копия + несколько инкрементальных”. Такую операцию можно осуществлять и с копиями, расположенными на магнитных лентах, но с дисками это существенно проще и требует меньших ресурсов (рис. 2).
Другим примером удачного применения резервного копирования на диски является  быстрый доступ к резервным копиям мобильных пользователей. Пользователи, чьи данные хранятся на ноутбуках обычно вынуждены самостоятельно заботиться о сохранности таких данных. Это вызвано, в основном, невозможностью планирования сессий резервного копирования и выделения устройств хранения для таких клиентов на основе фиксированных расписаний. В то же время существуют решения, позволяющие использовать дисковые устройства, доступные по сети, для синхронизации данных мобильных пользователей в момент их подключения. Такие решения, с одной стороны,  позволяют обеспечить централизованное управление политиками резервирования и версионностью данных, а, с другой стороны, предоставляют простые средства для самостоятельного доступа пользователей к их архивам.
 
Что-нибудь еще?
Где еще оправдано использование дисков в СРК?
На дисках организуют промежуточные хранилища актуальных резервных копий, которые потом могут переноситься в архив на ленты. Использование дисков для временного хранения резервных копий позволяет ускорить процесс восстановления – диски не надо монтировать и перематывать. А по статистике, 80% заявок на восстановление поступает в течение первой недели. Поэтому использование такого дискового кэш-хранилища позволяет сэкономить массу времени и других ресурсов (рис. 3).
На дисковых массивах под управлением СРК создают репозитории загрузочных образов для быстрого восстановления серверов. Использование для хранения образов дисковых устройств позволяет восстанавливать функционирование серверов за считанные минуты.
СРК все чаще интегрируется в общую систему хранения данных. Ее ресурсы используются для хранения немодифицируемых данных или данных, обращения к которым достаточно редки. В этом случае СРК является основной частью системы управления жизненным циклом информации.
Наиболее распространенным применением технологий управления жизненным циклом информации является создание архивов документов и почтовых сообщений. Интеграция СРК с системами архивирования и с ПО Lotus Notes или Microsoft Exchange позволяет создать правила, определяющие классы хранения данных в зависимости от их ценности и/или актуальности. По созданным правилам, данные переносятся на вторичные устройства под управлением системы архивирования, что позволяет освободить пространство на основной системе хранения и снизить нагрузку на производственные серверы. Пользователи имеют доступ к этим документам так же, как и к данным, расположенным в основном хранилище. При этом полностью (гарантированное поддержание заданных RPO и RTO) может быть обеспечена сохранность и доступность данных за счет интеграции СРК.
Кроме чисто технологических преимуществ, использование для хранения резервных копий дисковых систем позволяет унифицировать набор используемых решений – для продуктивной работы и хранения резервных копий можно использовать одни и те же устройства.
 
“Лента дегтя ”
Как мы убедились, резервное копирование на диски позволяет решить массу проблем. Почему же до сих пор используется копирование на магнитные ленты? Приведем 3 основных аргумента в пользу лент:
l   ленты дешевле – это относится и к носителям и к устройствам сравнимого объема и производительности;
l   ленты быстрее – один накопитель LTO3 способен обработать поток в 80/160 Мбайт/с; накопителей может быть много – столько, сколько необходимо;
l   ленты можно вынимать из библиотеки и хранить отдельно – в другом помещении/здании/городе.
Для организации, не имеющей резервного центра с развитыми коммуникациями, возможность хранить резервные копии вдали от основного вычислительного центра часто является единственным способом застраховаться от потери данных на случай масштабной аварии.
Будет ли развиваться резервное копирование на диски? Конечно, да. Будут ли ленточные устройства целиком вытеснены дисками? Конечно, нет.
Дисковые и ленточные накопители будут и дальше использоваться совместно. У каждой из этих технологий есть свои ниши и области применения.
 
Вместо заключения
Для того чтобы система резервного копирования эффективно выполняла свои функции, необходимо проделать большой объем работы. Результат этой работы зависит от многих факторов, большинство из которых относятся к процессу проектирования, а не к технологиям и оборудованию.
Начиная проект по построению или модернизации системы резервного копирования, очень важно иметь возможность использовать знания и опыт, накопленные при реализации аналогичных проектов, которыми обладают специалисты компаний-интеграторов и производителей оборудования и программных решений.
Владимир Попов, руководитель отдела инфраструктурных решений, "Энвижн Груп"