Распечатать

Современные технологии и тенденции развития систем хранения данных

Валерий Тимошин, эксперт по технологиям хранения данных «Энвижн Груп», выступил в журнале Connect, № 11, 2010 г. с обзором тенденций развития систем хранения данных.

7 декабря 2010

Валерий Тимошин, эксперт по технологиям хранения данных, компания «Энвижн Груп»

По данным IDC за последние 5 лет мировой объем хранимых и обрабатываемых данных вырос вчетверо. За тот же период ИТ-бюджеты росли всего на 2% в год, а численность ИТ-персонала увеличивалась только на 1%. Закономерный вопрос — как справиться с таким ростом потока данных, имея то, что мы имеем сегодня? Что реально нужно предпринять и во что инвестировать, чтобы системы хранения данных (СХД) смогли решать весь необходимый комплекс задач, а ИТ-блок компании в целом поддерживал конкурентоспособность и помогал развитию основного бизнеса?

Можно возразить, что российский рынок развивается по-другому, у наших компаний могут быть другие задачи и другие бюджеты. В целом это так, но до 80% любого из ИТ-бюджетов идет на поддержку имеющейся инфраструктуры. Требования к качеству сервисов становятся выше, а сложность классических инфраструктур начинает бить все рекорды. Рост объемов данных — это не только дополнительное дисковое пространство, но и новая усложняющаяся инфраструктура и соответственно расходы на управление всем комплексом СХД. А развитие затрудненно. Хотелось бы отметить, что основные затраты связанны именно с развитием инфраструктуры, так как стоимость дискового пространства относительно не велика. Очевидно, что снижение стоимости дисков и других накопителей не решает проблемы эффективного доступа к данным, проблемы производительности, а так же контроля целостности информации и безопасности. В итоге, если общую конфигурацию инфраструктуры не изменить, в обозримом будущем просто не хватит никаких сил даже на то, чтобы поддерживать то, что уже развернуто.

Концепция и тренды

Сегодня концепцию Сloud computing многие воспринимают как очередную маркетинговую стратегию, направленную на продвижения новых идей ИТ-рынка и оживление ИТ-бизнеса. И отчасти это правильно. Но! Переход к облачным инфраструктурам и сервисам является закономерным результатом эволюционного развития всей ИТ-отрасли. Концепция Сloud computing вобрала в себя все лучшие технологии без которых уже в ближайшей перспективе функционирование крупных ИТ-инфраструктур станет чрезвычайно затратным.

Сloud computing — это качественный скачок в предоставлении ИТ-сервисов, который стал возможен только при достижении определенного уровня автоматизации управления ИТ-инфраструктурой и виртуализации. Хочу подчеркнуть, что именно виртуализация всех типов ресурсов становится главным технологическим стержнем, вокруг которого сосредоточенны и развиваются все другие технологии для облачных вычислений.

Сейчас хотелось бы рассмотреть частные или приватные облака, так как именно они наиболее интересны с точки зрения развития технологий СХД для бизнеса, а технологиями для публичных облаков будут заниматься провайдеры услуг. Внутренний корпоративный ИТ-блок будет предоставлять сервисы и услуги своим бизнес потребителям, строя инфраструктуру на основе виртуализации. С использованием все той же виртуализации корпоративная инфраструктура будет интегрироваться с внешними облаками провайдеров в поисках наиболее оптимальных по стоимости дополнительных ресурсов, например, дополнительной вычислительной мощности, хранилищ данных или сервисов удаленного резервного копирования.

Получается, что если мы сегодня не внедряем технологии тотальной виртуализации, а это ведет к достаточно серьезным изменениям в общей корпоративной ИТ-инфраструктуре, то мы рискуем завтра не попасть в общий облачный тренд и стать не конкурентоспособными в области использования ИТ-технологий.

Технологии

Стремясь оптимизировать расходы на ИТ, мы ищем продукты и решения, которые уже сегодня позволят нам максимально эффективно использовать существующую ИТ-инфраструктуру. А так же, если мы хотим быть успешными завтра, новые решения и технологии должны быть совместимы с будущей концепцией облачных вычислений.

Сегодня в России еще наблюдается некоторое отставание от самых передовых рынков, но дорога в будущее и эволюционный путь технологического развития будет общим. Понимая это, можно очень точно прогнозировать очертание будущих концептуальных идей и присмотреться к конкретным технологиям и практикам их реализации.

Перечислим основные технологии:

Виртуализация СХД, позволяющая создать пул ресурсов хранения, объединив различные типы СХД, включая территориально распределенные системы. Виртуализация используется для маскировки сложных систем, реализации дополнительной функциональности, совершенствования производительности, увеличения емкости и доступности систем хранения. Виртуализация устраняет «островную» структуру хранения, объединяя емкости различных устройств в общий абстрактный логический пул хранения. Виртуализация значительно уменьшает совокупную стоимость владения СХД, скрывает всю сложность инфраструктуры и обеспечивает простое управление. Средства виртуализации позволяют администратору управлять системой в простых терминах: «хочу выделить этому приложению дополнительно 100 Гигабайт памяти». Данная технология позволяет эффективно использовать все пространство хранения, управляя и, если потребуется автоматически, перераспределяя дисковую емкость нуждающимся приложениям или сервисам.

Несмотря на все преимущества виртуализации, сегодня нет единого подхода к реализации данной технологии у производителей систем хранения. Каждый производитель использует собственные концепции и технологии, в которых всегда есть место преимуществам и определенным недостаткам. Сравнение существующих решений виртуализации от разных производителей является большой и сложной темой, достойной внимательного изучения в момент проектирования комплекса систем хранения.

Решения дедупликации данных, позволяющие не дублировать данные в системе на уровне файлов или блоков. Данные заменяются указателями на первоисточник, и уменьшают объем хранимых и требующих резервного копирования информации. Дедупликация особенно востребована в виртуальных вычислительных средах, где, например, сотни виртуальных машин хранят схожие образы операционной системы. Дедупликация значительно сокращает передаваемый трафик при репликации и удаленном резервном копировании, сокращая расходы на этих операциях. Сегодня это одна из самых востребованных технологий, которая имеет большой коэффициент полезной отдачи от инвестиций. Эксперты Gartner прогнозируют, что к 2012 г. дедупликация будет применяться в 75% процедур резервного копирования. Существуют различные способы аппаратной и программной реализации, а наиболее яркое решение — это семейство продуктов DataDomain от EMC.

«Тонкое» предоставление ресурсов (thin provisioning), которое «обманывает» приложения, сообщая, что в их распоряжении больше емкости хранения, чем реально доступно. Thin provisioning — это интеллектуальная технология эффективного динамического распределения емкости между различными приложениями для максимальной утилизации этой емкости. Реализация данной технологии основана на интеграции интеллектуальной файловой системы и аппаратных ресурсов хранения. У некоторых производителей, например Hitachi Data Systems thin provisioning тесно интегрируется с виртуализацией СХД. У Symantec thin provisioning идет дополнением к Veritas Storage Foundation и ложится программным уровнем, а точнее файловой операционной системой на всю аппаратную инфраструктуру хранения.

Автоматизация миграции данных между уровнями хранения — один из наиболее интенсивно развивающихся отраслевых трендов. Хранение на основе политик, при котором хранение, миграция, резервное копирование и удаление данных выполняется автоматически с учетом конкретных потребностей бизнеса. Предлагается классифицировать бизнес-информацию, прежде чем она попадет в инфраструктуру хранения. Вводятся понятия целевых показателей уровня сервиса (Service Level Objectives — SLO) и  «политик», на основе которых будет осуществляться управление хранением информации. SLO определяет, какие показатели ключевых характеристик сервисов хранения должны обеспечиваться определенной инфраструктурой, а  «политики» определяют набор необходимых действий с конкретными классами информации после возникновения определенных условий, например, при окончании заданного срока жизни информации. Основой для формирования SLO и Policies являются бизнес-требования и бизнес-процессы компании. Наиболее важная на текущий момент информация автоматически перемещаться в самую быструю, надежную и защищенную СХД. Менее важная информация, в свою очередь, перемещается в дешевую и менее скоростную систему. Архивные данные записываются на ленты и удаляются из рабочей системы, чтобы не снижать скорость доступа к самой критичной и важной в данный момент информации. Концепция охватывает все процессы управления размещением, хранением, распределением, миграцией, архивированием и удалением данных в инфраструктуре. Отличной иллюстрацией технологии может служить продукт от EMC FAST (Fully Automated Storage Tiering), обеспечивающий превосходный уровень автоматизации всех своих основных платформ хранения, позволяя наиболее грамотно управлять объемами информации в условиях дефицита ресурсов.

Конвергенции протоколов для сетей СХД и Ethernet. Оба протокола Fibre Channel (FC) для сетей SAN и Ethernet имеют плюсы и минусы и требуют различного набора оборудования и кабельных систем. Унификация позволит в одной сети передавать трафик принципиально разного типа, и использовать единое аппаратное обеспечение, только благодаря этому может быть достигнута колоссальная экономия. Fibre Channel over Ethernet (FCoE) на основе новейшего протокола 10 Гбит/c Ethernet — это инкапсуляция FC в транспорте канала Ethernet, обеспечивает такой же уровень надежности и эффективности, который FC гарантирует для всех приложений ЦОД. Ведущие разработчики выпустили свои продукты, реализующие новую концепцию. У Cisco — это линейка продуктов Nexus с поддержкой протокола Data Сenter Ethernet. У компании Brocade — устройства DCX — платформа, готовая для использования с Fibre Channel over Ethernet (FCoE). В дополнение хочется отметить, что благодаря появлению высокопроизводительных интерфейсов Ethernet 10 Гбит/с повсеместно создаются сети хранения SAN на базе протокола iSCSI — соответствующее оборудование дешевле Fibre Channel и упрощает развертывание SAN.

Флэш-технологии и бездисковое хранение на основе флеш-памяти, которые многократно повышают скорость обмена данными между СХД и вычислительными системами. Сегодня системы корпоративного уровня на основе SSD (Solid State Drive) органично интегрируются в дисковые массивы и быстро падают в цене. Высокопроизводительные решения позволяют создавать совершенно новые ИТ-сервисы, например, в области обработки большого количества транзакций в реальном времени для финансовых и банковских систем. Так же подобные решения находят применение для больших виртуальных пулов вычислительных ресурсов. Сегодня все ведущие производители СХД предоставляют решения на основе надежной и производительной флеш-памяти.

Решения для автоматизации управления — важнейший элемент современной СХД. Первые простые решения Storage Resource Management были предназначены для обнаружения и идентификации ресурсов хранения, мониторинга, визуального отображения, оперативного оповещений о проблемах и генерации соответствующих отчетов. Главной их задачей было предоставить администратору сведения о том, какие ресурсы доступны, где они находятся и как связаны между собой. При этом, несмотря на всю полезность таких решений, системные администраторы были вынуждены вручную выполнять такие важные функции, как увеличение емкости хранения, оптимизацию и реорганизацию пространства хранения, предоставление ресурсов и т. д. Сегодня все ведущие производители ПО управления Storage Resource Management автоматизируют рутинные мероприятия администрирования. К ним относятся: управление активами хранения, планирование емкостей, управление конфигурацией, управление событиями, мониторинг и генерация отчетов касательно обеспечения непрерывности бизнеса и др.

Стоит подчеркнуть, что новые времена накладывают на перечисленный выше функционал задачи управления в развитой, распределенной виртуальной среде, что на самом деле не так просто. Именно здесь сосредоточена главная интеллектуальная начинка, которая определяет успех функционирования не только комплекса СХД, но и дата-центра и всего корпоративного ИТ-блока.

Примером решения может служить новый продукт EMC Ionix Storage Configuration Advisor (SCA), компонент семейства решений EMC Ionix for Data Center Automation and Compliance. Часть компонент семейства Ionix for Data Center Automation and Compliance в настоящее время входит в состав семейства решений VMware. SCA автоматизирует анализ конфигурации систем хранения в физических и виртуальных средах, позволяет без использования агентов осуществлять поиск ресурсов для упрощения развертывания и управления системами хранения и предоставляет подробные отчеты и анализ ситуации для оптимизации процессов изменения систем хранения и управления конфигурацией.

Итоги

При принятии решений об инвестициях в инфраструктуру СХД экономические соображения играют решающую роль. Основная цель пользователей формулируется достаточно просто: «Обеспечить бизнес необходимыми сервисами хранения данных соответствующего качества при минимальных затратах». Если мы хотим, чтобы создаваемая нами инфраструктура органично вошла в будущее, нужно быть готовым ориентироваться на совместимые с Сloud computing технологии и строить СХД в соответствии с этой концепцией. Тем более, что все облачные технологии уже аккуратно создают «желанную» СХД. Будущая «облачная СХД» — это универсальная, полностью автоматизированная, многоуровневая, возможно территориально разнесенная система с низкой стоимостью хранения за единицу данных. «Облачная СХД» будет обладать врожденной виртуализацией, наделена искусственным интеллектом, простая в управлении, и максимально гибкая для реконфигурации и развития. Хотелось бы отметить, что самые сложные и дорогие технологии, такие как виртуализация или поддержка гетерогенных сред, благодаря усилиям производителей становятся все доступнее. У производителей наблюдается миграция дорогих технологий из класса Hi-End в более демократичные подклассы, делая возможным построение высокотехнологичных и эффективных решений для широкого круга зказчиков.

Оригинал статьи в формате PDF (182 Кбайт)