Выбираем СХД для резервного копирования::БИТ 03.2014
 
                 
Поиск по сайту
 bit.samag.ru     Web
Рассылка Subscribe.ru
подписаться письмом
Вход в систему
 Запомнить меня
Регистрация
Забыли пароль?

Календарь мероприятий
апрель    2024
Пн
Вт
Ср
Чт
Пт
Сб
Вс
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

показать все 

Новости партнеров

18.04.2024

Ассоциация разработчиков «Отечественный софт» отметила 15-летие

Читать далее 

17.04.2024

РДТЕХ представил Технологическую карту российского ПО 2023

Читать далее 

16.04.2024

RAMAX Group получила партнерский статус уровня Gold по продукту Tarantool

Читать далее 

12.04.2024

На RIGF 2024 обсудили ключевые вопросы цифрового развития России

Читать далее 

показать все 

Статьи

18.04.2024

5 способов повысить безопасность электронной подписи

Читать далее 

18.04.2024

Как искусственный интеллект изменит экономику

Читать далее 

18.04.2024

Неочевидный САПР: выход ПО за рамки конструкторской деятельности

Читать далее 

18.04.2024

Скоро некому будет делать сайты и заниматься версткой

Читать далее 

18.04.2024

Цифровая трансформация в энергетике: как запустить проект с максимальным финансовым эффектом?

Читать далее 

05.04.2024

Мотивируй, не то проиграешь!

Читать далее 

22.03.2024

В 2024 году в России и мире вырастут объемы применения AR/VR 

Читать далее 

25.02.2024

Цифровые технологии: надежды и риски

Читать далее 

05.02.2024

Будут ли востребованы услуги технической поддержки софта Oracle в России в ближайшие годы?  

Читать далее 

31.01.2024

Здания с признаками интеллекта. Как Сергей Провалихин автоматизирует дома и производства

Читать далее 

показать все 

Выбираем СХД для резервного копирования

Главная / Архив номеров / 2014 / Выпуск №3 (36) / Выбираем СХД для резервного копирования

Рубрика: Тема номера /  Системы хранения и обработки данных (СХД и ЦОД)


Андрей Бирюковсистемный архитектор, ЗАО «НИП Информзащита»

Выбираем СХД
для резервного копирования

Информационные активы – содержимое баз данных, образы операционных систем, конфигурации оборудования и ресурсы файловых серверов – требуют обязательного сохранения в резервной копии

Резервное копирование давно стало неотъемлемой частью процесса обеспечения непрерывности бизнеса. Потеря информации может привести не только к значительным убыткам, но зачастую и к банкротству организации. Поэтому так важно регулярно делать бэкапы.

Большое значение имеет и регулярная проверка сделанных ранее копий. О том, что информация копируется неправильно, лучше знать до того момента, когда произойдет сбой. Дело в том, что многие современные приложения имеют достаточно сложную структуру, и восстановление из резервной копии носит нетривиальный характер. Примерами таких систем являются прежде всего системы управления базами данных. Нередки случаи, когда для того, чтобы восстановленная информация снова стала доступна, приходится выполнить набор дополнительных операций. Регулярная проверка бэкапа необходима для того, чтобы понимать, что у вас действительно все под контролем.

Поговорив о том, как должен делаться бэкап, перейдем к рассмотрению важного вопроса – куда он должен делаться. На сегодняшний день существует два вида систем хранения данных, подходящих для работы с резервными копиями: это хорошо зарекомендовавшие себя ленточные библиотеки и дисковые хранилища. Сразу оговорюсь, что здесь речь идет о физических СХД, и в этом контексте всевозможные облачные хранилища мы будем рассматривать как частный случай дисковой СХД, не вдаваясь в подробности аппаратно-программной реализации самого процесса бэкапирования.

Начнем с ленточных библиотек. Это, пожалуй, старейшее средство для хранения резервных копий, появившееся еще в эпохи мэйнфреймов. Основным достоинством лент является их дешевизна. На сегодняшний день стоимость мегабайта хранения на ленточном носителе по-прежнему меньше стоимости аналогичной единицы на жестком диске.

Также считается, что лента является достаточно надежным носителем информации, срок годности картриджа составляет до десяти лет. Этот довод я бы все-таки оспорил, так как в процессе эксплуатации ленточных архивов неоднократно возникали ситуации, когда при проверке картриджей выяснялось, что информацию невозможно считать из-за дефектов ленты, вызванных продолжительной эксплуатацией, – то, что называется «зажевало ленту».

Стратегии
резервного копирования

Полный бэкап (Full backup) – полная резервная копия всех данных, независимо от того, когда была сделана предыдущая резервная копия.

Дифференциальный бэкап (Differential backup) – резервная копия содержит все изменения данных с момента последнего полного бэкапа.

Инкрементальный бэкап (Incremental backup) – резервная копия содержит все изменения с момента создания последнего инкрементального бэкапа.

Пример: Если у нас делается по воскресеньям полный бэкап, а во все остальные дни недели дифференциальный, то в случае сбоя в четверг нам нужно восстановить последнюю полную копию и последнюю дифференциальную за среду или четверг в зависимости от времени сбоя.

Если же у нас делается по воскресеньям полный бэкап, а во все остальные дни недели инкрементальный, то в случае сбоя в четверг нам нужно восстановить последнюю полную копию и последовательно все инкрементальные копии начиная с понедельника.

Еще одним важным критерием работы СХД, содержащей резервные копии, является быстрота создания резерной копии и ее восстановления. Если со скоростью записи бэкапов у ленточных СХД особых проблем нет, есть возможность создания потокового бэкапа, то с восстановлением дела обстоят сложнее.

Во-первых, чтение данных с ленточного носителя осуществляется последовательно, то есть мы не можем сразу прочитать произвольный файл, не считав до этого все, что записано ранее. Следовательно, поиск занимает значительное время. Это особенно критично при восстановлении небольших файлов, процесс поиска которых занимает больше времени, чем само восстановление.

Во-вторых, учитывая особенности стратегий резервного копирования, представленные во врезке, процесс восстановления для дифференциальных и прежде всего инкрементальных копий может потребовать использования нескольких кассет в определенной последовательности, что, в свою очередь, накладывает некоторые ограничения на требования к маркировке носителей, а также к их надежности. Ведь если инкрементальная копия за среду окажется неисправной, то даже при наличии исправной копии за четверг восстановить потерянные данные мы уже не сможем.

Кроме того, долгий поиск нужных данных для восстановления и замена кассет могут оказаться неприемлемыми для критичных бизнес-приложений, для которых даже получасовой простой является недопустимым.

Все эти недостатки необходимо учитывать при выборе носителя для резервных копий: дешевые, но медленные и не всегда надежные ленты – не лучший выбор для настоящего времени.

Завершая обсуждение ленточных СХД, хотелось бы упомянуть об одном неочевидном на первый взгляд их достоинстве – мобильности. Лучшие практики по информационной безопасности рекомендуют выполнять резервное копирование на носители, находящиеся в другом здании, а лучше даже в другом географическом регионе. Если такой возможности нет, то бэкап должен копироваться на съемный носитель, который затем хранится отдельно от основных систем. Если с дисковым хранилищем выполнить эти рекомендации трудно, то с лентами вполне реально. После выполнения бэкапа их можно отвезти в другой офис или филиал и там хранить с соблюдением надлежащих требований по безопасности. Кассеты должны храниться в запирающемся сейфе, в охраняемом помещении, где имеется система пожарной сигнализации.

Таким образом, ленты могут использоваться для бюджетных, географически распределенных бэкапов.

Теперь перейдем к более современному средству хранения резервных копий – дисковым массивам. Принято считать, что дисковые хранилища являются достаточно дорогим средством хранения. Однако в последние время стоимость одного мегабайта места постепенно снижается. При этом у дисков есть множество преимуществ перед лентами.

Начнем с того, что поиск данных на винчестере во много раз быстрее при выполнении непосредственно операций записи/чтения, чем на ленте. Кроме того, ленту требуется еще найти в архиве, принести, вставить в привод, перемотать и только после этого начать считывание.

Также важным преимуществом дисковых полок является высокая надежность хранения данных. Диски, установленные в СХД для бэкапа, не подвергаются таким интенсивным нагрузкам, как СХД для файловых хранилищ, виртуальных машин или баз данных. Поэтому они смогут работать годами без сбоев.

Для предотвращения потери данных на дисках используется технология RAID (англ. redundant array of independent disks – избыточный массив независимых дисков). Вот различные типы RAID-массивов:

  • RAID 0 – дисковый массив повышенной производительности с чередованием, без отказоустойчивости;
  • RAID 1 – зеркальный дисковый массив;
  • RAID 2 – зарезервирован для массивов, которые применяют код Хемминга;
  • RAID 3 и 4 – дисковые массивы с чередованием и выделенным диском четности;
  • RAID 5 – дисковый массив с чередованием и «невыделенным диском четности»;
  • RAID 6 – дисковый массив с чередованием, использующий две контрольные суммы, вычисляемые двумя независимыми способами;
  • RAID 10 – массив RAID 0, построенный из массивов RAID 1;
  • RAID 50 – массив RAID 0, построенный из массивов RAID 5;
  • RAID 60 – массив RAID 0, построенный из массивов RAID 6.

Современные СХД позволяют собрать массив для большинства этих типов. RAID 0 не является отказоустойчивым и для хранения резервных копий не используется. RAID 1 не слишком эффективно использует дисковое пространство, ведь при зеркалировании из двух дисков мы получаем лишь один.

Наиболее подходящей для хранения бэкапов будет архитектура RAID 5. Объем дискового массива RAID5 рассчитывается по формуле (n-1)*hddsize, где n – число дисков в массиве, а hddsize – размер наименьшего диска [1]. Например, для массива из четырех дисков по 80 Гб общий объем будет (4 – 1) * 80 = 240 Гб. Недостатком RAID 5 является меньшая скорость, особенно при выполнении операции записи в произвольном порядке. Но для хранения резервных копий скорость записи не является критичным параметром, так как бэкапы пишутся последовательно, и скорость записи на диск, как правило, не является самым узким местом по сравнению, например, с пропускной способностью каналов связи и других накопителей.

Помимо прочего, использование RAID непроизвольно увеличивает физическую защищенность хранимых данных – даже если удастся украсть несколько жестких дисков, никакой реальной целостной информации на них не будет, из-за того, что RAID 5 хранит на каждом из дисков лишь определенные фрагменты данных. На этом, я думаю, теоретическую часть можно завершить и перейти к практическому рассмотрению моделей оборудования, которое может быть использовано для хранения резервных копий.

Замечание: все значения емкости хранимых данных рассчитываются в десятичном исчислении (например, 1 Тб = 1 000 000 000 000 байт).

Решения HP

Компания Hewlett Packard является одним из наиболее известных производителей СХД. Для обеспечения резервного копирования она предлагает решение HP StoreOnce [2].

Линейка StoreOnce содержит устройства, предназначенные для работы в организациях различного масштаба. Для небольших компаний подойдет HP StoreOnce 2600: 4 Тб дискового пространства (полезная емкость – 2,5 Тб), пропускная способность – до 670 Гб/ч, одно место в серверной стойке. Хорошо подходит для небольших компаний (порядка 20 пользователей) и филиалов. Стоимость решения – порядка $12 000.

Более мощный двухюнитовый собрат – HP StoreOnce 4210, 
поддерживает расширение дополнительной полкой дисков и может содержать до 9 Тб полезной емкости, а модификация 4220 – до 18 Тб. Возможность расширения дает значительный запас масштабируемости. Рекомендуется для небольших организаций, предполагающих значительное увеличение числа рабочих мест (более 50%) и, как следствие, объема данных для резервного копирования. Стоимость решения начинается от $30 000.

HP StoreOnce 44x0 поддерживает до трех полок расширения, занимает 4U в базовой комплектации и имеет до 76 Тб полезной емкости. Имеется 200 виртуальных приводов и 50 библиотек, аппаратный RAID 6, больше 4,5 Тб/ч пропускной способности и более 10 Тб/ч при использовании HP StoreOnce Catalyst. Это решение можно рекомендовать средним компаниям, также рассчитывающим на значительный рост. Стоимость здесь составит от $82 000.

«Серьезный шкаф» HP B6200: 10U за базовый блок, до шести дополнительных контроллеров, до 32 дисковых полок, скорость записи – до 100 Тб/ч данных и 512 Тб полезной емкости. С учетом дедупликации это уже все 10 Пб. Решение для крупных и очень крупных организаций. Составление бюджета можно начинать от четверти миллиона долларов.

Несколько слов о технологии HP Catalyst, упомянутой чуть выше. Это программный агент, который устанавливается на сервер резервного копирования. На нем работают ПО резервного копирования HP DataProtector или Symantec NetBackup и Backup Exec.

Дедупликацию данных HP Catalyst производит прямо на этих серверах, используя тот функционал, который заложен в соответствующее ПО для бэкапа. Это позволяет снизить нагрузку на устройство резервного копирования, что является немаловажным при больших объемах данных. Например, по информации, представленной в статье [3], топовая система HP B6200 может записывать данные с дедупликацией со скоростью до 40 Тб/ч, а с использованием HP Catalyst – уже до 100 Тб/ч.

Таким образом, HP предлагает широкий спектр решений для компаний различных размеров. Теперь посмотрим, что предлагают конкуренты.

IBM

У IBM набор СХД также достаточно серьезный. Начнем с меньших моделей. IBM Storwize V3500 – решение для малого и среднего бизнеса [4]. IBM Storwize V3500 – это относительно компактное, 2U хранилище, использующее 8Gb оптический канал. Поддерживается до 12 3,5-дюймовых или 24 2,5-дюймовых дисков. Также поддерживается технология IBM FlashCopy, которая выполняет высокопроизводительные операции. Благодаря этой функции можно сразу восстанавливать систему после потери данных или сбоев.

Более мощным устройством является IBM Storwize V3700. Оно поддерживает до 12 3,5-дюймовых или 24 2,5-дюймовых дисков, устанавливается в стойку высотой 2U. Также к основной контроллерной полке можно подключить дополнительно четыре полки расширения. К недостаткам этой модели СХД можно отнести отсутствие компрессии, поддержки NAS и отсутствие возможности объединять системы в кластеры.

Наиболее производительным в линейке IBM Storwize является модель V7000. Система содержит два контроллера и позволяет использовать 12 дисков 3,5 дюйма или 24 диска 2,5 дюйма, максимальное количество – до 240 или 480 дисков для кластеризованной системы. Полки расширения подключаются через SAS 6Gbit и также бывают двух типов – 2U 12HDDx3.5’’ и 24HDDx2.5’’. Количество различных полок произвольно. Каждый контроллер IBM Storwize V7000 включает в себя по 8 Гб кэша и имеет по четыре порта FC 8Gbit и по два порта iSCSI 1Gbit и 10 Gbit.

К сожалению, мне не удалось найти в открытых источниках цены для всех моделей данного оборудования. Для получения полной спецификации необходимо обращаться непосредственно к партнерам IBM. Однако ценник для V7000 начинается от 750 000 рублей.

EMC

Еще одним известным разработчиком является корпорация EMC. Здесь наиболее подходящими для хранения резервных копий являются устройства из линейки EMC DataDomain [5]. Решения данной серии обладают возможностью быстрой дедупликации. Производительность СХД – до 31 ТБ/ч. Система позволяет сокращать требования к емкости резервных копий в 10-30 раз. Сокращение требований к архивной системе хранения в пять раз. Для обеспечения отказоустойчивости используется массив RAID 6 с двойными данными четности дисков. Теперь рассмотрим, какие модели входят в данную линейку.

Младшее устройство EMC DataDomain DD160 обеспечивает до 1,1 Tб/ч пропускной способности и до 80 Тб логической емкости. Стоимость этого решения – порядка $8500.

Решение для организаций среднего уровня EMC DataDomain DD620. Здесь технические характеристики более серьезны по сравнению с предыдущей моделью: до 2,4 Tб/ч пропускной способности и до 415 Тб логической емкости. Примерная стоимость устройства – от $1000.

Для крупных компаний EMC предлагает DataDomain DD670 со следующими характеристиками: 13,4 Tб/ч пропускной способности и до 415 Тб логической емкости. Ценник для этого устройства начинается от $35 000.

Основные характеристики решений по СХД приведены в таблице 1.

Таблица 1. Основные характеристики решений по СХД

  HP StoreOnce IBM Storwize EMC DataDomain
Максимальный объем 10 Пб с учетом дедупликации До 72 Тб на одну полку До 415 Тб
Количество дисков 24 на одну полку 24 на одну полку 12
Скорость работы До 10 Тб/c 10 Гб 13,4 Тб/ч
Дополнительные возможности Технология HP Catalyst    
Примерная стоимость за одну полку $12 000-250 000 От 750 000 руб. $8500-35 000

Как видно из таблицы, разброс цен за максимальную конфигурацию достаточно значительный, однако при этом и предлагаемый функционал существенно различается. В зависимости от объемов резервных копий и требований к скорости восстановления можно выбрать хранилище с наиболее оптимальным соотношением «цена – качество».

  1. Статья о типах RAID – http://ru.wikipedia.org/wiki/RAID.
  2. Описание HP Store Once – http://www8.hp.com/ru/ru/products/data-storage/data-storage-products.html?compURI=1225909#.UzPJDc5pUg4.
  3. Статья о решениях HP – http://habrahabr.ru/company/hp/blog/186430.
  4. Описание IBM Storwize – http://www-03.ibm.com/systems/ru/storage/storwize.
  5. Описание EMC DataDomain – http://russia.emc.com/backup-and-recovery/data-domain/index.htm.

В начало⇑

 

01.04.2015 - 22:11 | Yarsar

А что из этого http://www.depo.ru/category_c1878070.aspx лучше выбрать для организации СХД небольшой компании?

Комментарии могут отставлять только зарегистрированные пользователи

Выпуск №02 (135) 2024г.
Выпуск №02 (135) 2024г. Выпуск №01 (134) 2024г.
Вакансии на сайте Jooble

           

Tel.: (499) 277-12-41  Fax: (499) 277-12-45  E-mail: sa@samag.ru

 

Copyright © Системный администратор

  Яндекс.Метрика