Правильные СХД: оптимизируем под задачи бизнеса::БИТ 09.2013
 
                 
Поиск по сайту
 bit.samag.ru     Web
Рассылка Subscribe.ru
подписаться письмом
Вход в систему
 Запомнить меня
Регистрация
Забыли пароль?

Календарь мероприятий
июль    2022
Пн
Вт
Ср
Чт
Пт
Сб
Вс
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

показать все 

Новости партнеров

06.07.2022

MERLION IT Summit 2022: новый уровень важного отраслевого события

Читать далее 

05.07.2022

Учиться для жизни: специалисты в Оренбургской области решат задачу для образовательной компании

Читать далее 

04.07.2022

Запущена единая база знаний по работе с кириллическими доменными именами и email адресами

Читать далее 

27.06.2022

Три миллиона за искусственный интеллект: в Москве стартовал всероссийский чемпионат по искусственному интеллекту 

Читать далее 

показать все 

Статьи

29.04.2022

Можно ли продолжать цифровую трансформацию сегодня?

Читать далее 

23.03.2022

Дата-центры – 2022

Читать далее 

04.01.2022

Ваш рейтинг перспективных технологий

Читать далее 

11.12.2021

Что повысит конкурентоспособность?

Читать далее 

02.11.2021

Парадокс инвесторов

Читать далее 

13.02.2020

Чат-бот CallShark не требует зарплаты, а работает круглосуточно

Читать далее 

24.12.2019

До встречи в «Пьяном Сомелье»!

Читать далее 

21.12.2019

Искусство как награда Как изготавливали статуэтки для премии IT Stars им. Георгия Генса в сфере инноваций

Читать далее 

04.12.2019

ЛАНИТ учредил премию IT Stars памяти основателя компании Георгия Генса

Читать далее 

04.06.2019

Маркетолог: привлекать, продавать, продвигать?

Читать далее 

показать все 

Правильные СХД: оптимизируем под задачи бизнеса

Главная / Архив номеров / 2013 / Выпуск №9 (32) / Правильные СХД: оптимизируем под задачи бизнеса

Рубрика: Тема номера /  Системы хранения и обработки данных (СХД и ЦОД)


Андрей Бирюковспециалист по информационной безопасности. Работает в крупном системном интеграторе. Занимается внедрением решений по защите корпоративных ресурсов

Правильные СХД:
оптимизируем под задачи бизнеса

Поговорим о том, какие СХД бывают и как их лучше применять в организациях разного масштаба

Cегодня трудно найти организацию, в которой не было бы системы хранения данных (СХД). Относительно низкая стоимость единицы дискового пространства, большой объем хранимой информации и обеспечение отказоустойчивости делают дисковые хранилища привлекательными в использовании. Однако насколько правильно используются СХД? Как оптимизировать расходы на их содержание?

Виды СХД

По своему назначению системы хранения данных делятся на следующие виды:

  • СХД для рабочих данных. Как правило, используется наиболее производительное оборудование.
  • СХД для резервных копий. Это ленточные и дисковые библиотеки.

Процесс обмена информацией между системой хранения данных и конечными пользователями может состоять из множества различных компонентов, прежде всего серверов. В связи с этим возникает требование к инфраструктуре СХД.

Также необходимо помнить о надежности и производительности системы. Если надежность системы определяется различными параметрами, многие из которых связаны скорее с инфраструктурой, чем непосредственно с СХД, то производительность определяется набором параметров самой системы хранения, прежде всего числом и типом накопителей, пропускной способностью внутренних и внешних интерфейсов, а также гибкостью конфигурирования.

Традиционно принято считать, что система хранения данных – это дисковая полка, то есть монтируемое в стойку хранилище, содержащее несколько десятков дисков. Однако в реальности решения по хранению данных достаточно многообразны.

Прежде всего это действительно дисковые массивы, которые объединяются в отказоустойчивую конфигурацию. Как правило, в основу отказоустойчивости положен массив RAID (Redundant Array of Independent Disks). Существует большое количество различных конфигураций RAID: RAID-1 (зеркало), RAID-3, RAID-4 (дисковые массивы с чередованием и выделенным диском четности), RAID-5 (дисковый массив с чередованием и «невыделенным диском четности») и многие другие. Подробное описание типов RAID можно найти в материале [1].

Помимо дисковых массивов, есть также ленточные библиотеки. Они в отличие от дисков используются для резервного копирования, быстрый доступ к сохраненной информации невозможен. Однако для лент стоимость хранения одного гигабайта данных в несколько раз меньше, чем для дисков, поэтому их и используют для бэкапирования.

По аналогии с дисковыми массивами RAID для ленточных библиотек также существуют отказоустойчивые конфигурации – RAIT (Redundant Array of Independent Tapes). И хотя эта технология распространена значительно меньше, чем RAID, стоит упомянуть ее. Дело в том, что при резервном копировании на ленту может возникнуть такая ситуация, когда восстановление данных невозможно, например, порвалась лента.

В случае когда стоимость хранимой информации слишком велика, делается несколько резервных копий для минимизации рисков.

Инфраструктура СХД

Инфраструктура доступа к устройствам хранения – не менее важный, чем диски или ленты, компонент СХД, о котором очень часто забывают. А зря. Дело в том, что при построении системы хранения все, как правило, ориентируются на такие параметры, как скорость и объем информации, хранимой в дисковом хранилище. При этом часто забывают о периферийных устройствах, связывающих сервер и дисковое хранилище. А ведь от этого устройства зависит скорость передачи данных между сервером и дисками. Мне приходилось сталкиваться с ситуацией, когда помещенное в виртуальную среду приложение стало демонстрировать крайне низкую производительность. При этом дисковое хранилище отвечало требованиям разработчика приложения по производительности. Однако контроллер, использовавшийся для подключения «дисковой полки», был неверно настроен, в результате чего появилось «бутылочное горлышко» в обмене информацией между СХД и системой. Так что об этом важном компоненте тоже не стоит забывать.

Возможны несколько вариантов подключения устройств и жестких дисков: SCSI, Serial Attached SCSI (SAS), Serial ATA (SATA), Fibre Channel (FC) и Infiniband. Не вдаваясь в технические подробности работы каждого из них, стоит отметить, что наиболее распространенным является FC.

Еще одним вариантом подключения дисковых хранилищ является использование Network Attached Storage (NAS).Основная задача этих систем – упрощение совместного использования файлов. Как правило, устройства NAS – это оборудование, которое подключается непосредственно к локальной сети.

Устройства NAS, как правило, значительно дешевле, чем описанные выше решения, они не требуют для работы дополнительных контроллеров и наличия необходимых интерфейсов. Однако обмен данными также во много раз медленнее и ограничивается пропускной способностью локальной сети.

В последнее время NAS-устройства получили большое распространение в SOHO (малый и домашний офис) сегменте. Эти бюджетные решения вполне справляются с ролью небольших файловых серверов. В качестве одного из примеров таких хранилищ можно привести решения Synology, стоимость самой младшей модели без дискового накопителя составляет немногим более 100 долларов.

Но промышленным решением, обеспечивающим высокую производительность и масштабируемость в СХД, являются сети хранения данных – SAN. Это оборудование недешево, вряд ли его использование будет оправдано в небольших организациях. Но SAN может эффективно расширяться как по вертикали, когда добавляются дополнительные диски к уже существующему хранилищу, так и по горизонтали, когда разворачиваются новые системы хранения. Существенным преимуществом SAN является то, что они используют собственную сеть, не нагружая при этом локальную сеть организации.

Средства мониторинга и управления

Мы рассмотрели аппаратные компоненты СХД и соответствующую инфраструктуру, однако немаловажное значение имеет и используемое программное обеспечение по управлению и мониторингу систем хранения. Как правило, приложения для управления дисковыми хранилищами поставляются вместе с самим оборудованием. Управлять устройством можно с помощью веб-интерфейса. Для бюджетных моделей дисковых полок для управления необходимо подключение к работающему серверу. Для более дорогих моделей это не требуется, они позволяют осуществлять все управление по локальной сети.

Для работы с ленточными библиотеками может использоваться стороннее ПО, например, Symantec Netbackup, которое управляет выполнением задач по резервному копированию на ленту.

Программное обеспечение по управлению СХД должно в обязательном порядке уметь отправлять администратору уведомления о результатах выполнения задач. В качестве транспорта может использоваться электронная почта или SNMP. Нелишним будет наличие инструментов диагностики производительности.

Что к чему?

Итак, мы кратко рассмотрели основные технические характеристики СХД. Теперь необходимо определиться, как наиболее эффективно распорядиться всем этим функционалом.

Начнем с небольших организаций. Размер предлагаю определять не столько по количеству сотрудников, сколько по объему обрабатываемой информации. Если общий объем информации, хранимой в СХД, не превышает 500 Гб, а объем ежедневной разностной резервной копии – 1-2 Гб, то в качестве СХД вполне можно использовать бюджетный NAS. При этом необходимо обеспечить зеркалирование жестких дисков RAID-1. Однако надо в обязательном порядке настроить регулярное резервное копирование данных. Желательно использовать бэкапирование на ленту, хотя можно, конечно, и копировать на переносной диск.

Стоимость внедрения СХД с NAS+2 жестких диска RAID-1 + ленточная библиотека на одну кассету начинается от 60 000 рублей. В качестве возможных решений можно рассмотреть ленточную библиотеку, например, Tandberg Data VXA320 и Synology DS212j в качестве NAS.

Однако не стоит забывать о необходимости разработки регламентов по обслуживанию СХД. Конечно, речь не идет о полноценных многостраничных документах, где описываются всевозможные действия, выполняемые СХД (как правило, в небольших организациях на такое просто ни у кого нет времени). Однако расписание резервного копирования, виды квотирования для различных групп пользователей и прочие базовые вещи должны быть задокументированы. Даже если систему обслуживает один человек.

Средний сегмент

С ростом компании увеличивается и объем обрабатываемых данных. Средней будем считать организацию, в которой суммарный объем информации, хранимой в СХД, не превышает 20 Тб. Объем разностных копий измеряется десятками гигабайт. Лучшим решением для построения СХД в таких компаниях является привлечение системного интегратора, то есть компании, профессионально занимающейся внедрением и сопровождением ИТ-решений. Но привлечение сторонней организации приведет к существенному удорожанию внедрения СХД. Поэтому многие руководители ИТ стараются внедрять все новые системы собственными силами. С разным результатом.

Чтобы не столкнуться в итоге с проблемами производительности, необходимо правильно определить приоритеты, которые важны для данной СХД.

Приведу несколько примеров для лучшего понимания проблемы. Допустим, ваша дисковая СХД будет использоваться базой данных. Как известно, СУБД требуется вести журнал транзакций. На выполнение каждой операции жесткие диски, входящие в состав хранилища, затрачивают определенное время.

Соответственно, если одни и те же диски будут использоваться и для работы с таблицами и для ведения журнала транзакций, это займет значительное время. Для борьбы с этим обычно используют один раздел для таблиц и второй для журнала. В идеале лучше использовать отдельное хранилище для каждой из задач.

Другой вариант: ваша дисковая «полка» используется в качестве файлового хранилища, доступного по сети, которому не требуется высокая скорость работы, так как узким местом все равно будет пропускная способность каналов связи.

Какие выводы можно сделать из приведенных выше примеров? Первый – правильная конфигурация, оптимизированная под прикладную задачу, может существенно увеличить производительность СХД.

Второй вывод – при выборе хранилища стоит обращать внимание не только на максимальный объем, но и на скорость обмена данными. Не нужно переплачивать, если вам не требуется высокая скорость обмена данными (файловое хранилище или резервные копии), то не следует брать самую скоростную «полку», лучше максимизировать объем. Но если у вас база данных или хранилище для почтовой системы, то тут необходимо найти приемлемый баланс между скоростью и производительностью.

Хорошим решением для второго варианта может стать HP D2700. Это хранилище обладает достаточно быстрым интерфейсом обмена данными до 6 Гб/c и максимальным объемом хранилища до 11 Тб (25 SAS дисков 2,5 объемом 450 Гб). Однако при покупке устройства необходимо также приобрести соответствующий контроллер. Список совместимых с хранилищем моделей представлен на странице [3]. Стоимость хранилища и контроллера составляют порядка 500 000 рублей.

Настоятельно советую также приобрести несколько запасных дисков того же типа, что и используемые в «полке». Дело в том, что, хотя хранилище и будет на гарантии, производитель бесплатно пришлет вам в течение гарантийного срока новые диски, процесс замены может занять значительное время – до нескольких недель.

В случае если вышли из строя сразу несколько дисков (в моей практике бывало и такое!), вы рискуете не обеспечить бизнесу доступность его информации даже при наличии резервных копий, так как их просто будет некуда восстанавливать. Наличие запасных дисков позволит вам обеспечить работоспособность хранилища в течение того времени, пока будут меняться диски по гарантии.

Все по-взрослому

Если ваш бизнес уже перешел в разряд крупных и даже каскад из дисковых полок не позволяет уместить все данные, то необходимо думать о более вместительном решении. Здесь я категорически не рекомендую даже пытаться что-то изобретать и уж тем более приобретать самостоятельно.

Для создания высокопроизводительной СХД необходимо обращаться в системные интеграторы. Только их сертифицированные специалисты смогут рекомендовать вам наиболее подходящее под ваши задачи решение. Да, это будет стоить еще дороже, чем самостоятельное внедрение. Но, приобретая компоненты СХД самостоятельно, вам необходимо уметь досконально ориентироваться в спецификациях всех возможных интерфейсов обмена и даже элементах крепежа. Иначе есть риск что-то не дозаказать или заказать лишнее.

А еще не стоит забывать о подводных камнях, о которых обычно не пишут производители, но которые знают специалисты, внедряющие СХД. Например, как та или иная модель хранилища работает с СУБД или с тем или иным гипервизором? Какие возможны проблемы с совместимостью решений от различных компаний? Как оказывается поддержка? И многое другое. При самостоятельной покупке есть риск потратить значительные суммы если не впустую, то по крайней мере не слишком эффективно.

И еще не стоит забывать о документации. Специалисты интегратора смогут грамотно расписать, что к чему и как подключено и как все это работает. Вряд ли у системных администраторов, загруженных текущей работой, найдется время хотя бы на составление журнала коммутации оптики или зон коммутаторов.

Надеюсь, я не сильно разочаровал тех, кто ожидал увидеть в этом разделе расчет СХД с восьми-девятизначным ценником.

Новинки рынка СХД

Рассмотрим несколько новинок рынка СХД в качестве примеров возможных решений для средних и крупных компаний.

IBM Storwize V3700 предлагает эффективные конфигурации начального уровня, разработанные специально для малых и средних предприятий. Отличительными особенностями этого решения являются возможность консолидации данных и организация их совместного использования. Программный интерфейс позволяет создавать различные варианты RAID, многие из которых обычно доступны в более дорогих моделях СХД [4].

Компания EMC разработала целое семейство VMAX – линейка решений, предназначенных для предприятий различных размеров – от небольших компаний до высокопроизводительных облачных инфраструктур. Модель VMAX 40K обеспечивает троекратное увеличение производительности и двукратную емкость по сравнению с аналогами на рынке. VMAX 40K предлагает также новые конфигурации, используя 2,5” SAS-накопители и Flash-накопители типа MLC (eMLC) [5].

Еще одной новинкой на рынке СХД является решение от HP MSA 2040. Данная СХД базируется на новом контроллере, использующем специальную процессорную архитектуру. Также каждый контроллер системы хранения оснащается 4 Гб кэша на основе быстрой памяти DDR3. (C8S57A, C8S55A, E7V89AM, C8R14A, C8R15A, C8R17A) [6].

Компания также представила решение NetApp EF540 flash array, оно в большей степени ориентировано на транзакционные приложения, прежде всего базы данных, для которых основным приоритетом является быстрое реагирование. СХД корпоративного класса NetApp EF540 построена на базе твердотельных накопителей, работающих со скоростью 15 000 об/мин [7].

Если представленные выше решения являются дисковыми массивами, то СХД Dell PowerVault – это не только дисковые, но и ленточные системы хранения данных. Эти системы способны обеспечивать максимальную функциональность и высокую производительность.

Ленточные системы хранения Dell PowerVault – эти устройства имеют несколько другой принцип работы, вся важная информация резервируется на специальных дата-картриджах, такие системы, как правило, дешевле дисковых, однако по функциональным возможностям не уступают им [8].

Виды резервного копирования [2]

Полное резервное копирование (Full backup)

Полное копирование – это копирование всех данных. Используется тогда, когда необходимо максимально быстро восстановить нужную информацию.

Дифференциальное резервное копирование (Differential backup)

При разностном (дифференциальном) резервном копировании каждый файл, который был изменен с момента последнего полного резервного копирования, копируется каждый раз заново.

Инкрементное резервное копирование (Incremental backup)

При добавочном (инкрементном) резервном копировании происходит копирование только тех файлов, которые были изменены с тех пор, как в последний раз выполнялось полное или добавочное резервное копирование. Последующее инкрементное резервное копирование добавляет только файлы, которые были изменены с момента предыдущего.

Клонирование

Клонирование позволяет скопировать целый раздел или носитель (устройство) со всеми файлами и директориями в другой раздел или на другой носитель. Если раздел является загрузочным, то клонированный раздел тоже будет загрузочным.

***

В своей статье я постарался прояснить ряд моментом, связанных с эффективностью использования систем хранения данных.

На рынке присутствует множество моделей от различных разработчиков, так что найти подходящую под необходимые вам условия не составит большого труда. При грамотном внедрении затраты могут окупиться за два-три года.

  1. http://ru.wikipedia.org/wiki/RAID – статья по типам RAID.
  2. http://ru.wikipedia.org/wiki/Резервное копирование – статья в Википедии по видам резервного копирования.
  3. http://h30094.www3.hp.com/product/sku/10213509#specsContent – спецификация HP D2700.
  4. http://www-03.ibm.com/systems/ru/storage/disk/storwize_v3700 – описание IBM Storwize V3700.
  5. www.emc.com/campaign/global/hybridcloud/index.htm – описание решения EMC.
  6. http://www8.hp.com/ru/ru/products/disk-storage/product -detail.html?oid=5386548#!tab=features – описание HP MSA 2040.
  7. http://www.netapp.com/ru/products/storage-systems/flash-ef540 – решение от NetApp.
  8. http://www.dell.com/ru/business/p/powervault-md1200/pd – описание Dell.

В начало⇑

 

Комментарии отсутствуют

Комментарии могут отставлять только зарегистрированные пользователи

Выпуск №04 (117) 2022г.
Выпуск №04 (117) 2022г. Выпуск №03 (116) 2022г. Выпуск №01 (114) 2022г. Выпуск №02 (115) 2022г.
Вакансии на сайте Jooble

           

Tel.: (499) 277-12-41  Fax: (499) 277-12-45  E-mail: sa@samag.ru

 

Copyright © Системный администратор

  Яндекс.Метрика