Почему отказывают ИT-сервисы?::БИТ 07.2012
 
                 
Поиск по сайту
 bit.samag.ru     Web
Рассылка Subscribe.ru
подписаться письмом
Вход в систему
 Запомнить меня
Регистрация
Забыли пароль?

Календарь мероприятий
апрель    2024
Пн
Вт
Ср
Чт
Пт
Сб
Вс
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

показать все 

Новости партнеров

22.04.2024

Сообщество цифровых управленцев «я-ИТ-ы» проводит ЗАКРЫТУЮ встречу в рамках выставки «Связь-2024»!

Читать далее 

18.04.2024

Ассоциация разработчиков «Отечественный софт» отметила 15-летие

Читать далее 

17.04.2024

РДТЕХ представил Технологическую карту российского ПО 2023

Читать далее 

16.04.2024

RAMAX Group получила партнерский статус уровня Gold по продукту Tarantool

Читать далее 

показать все 

Статьи

18.04.2024

5 способов повысить безопасность электронной подписи

Читать далее 

18.04.2024

Как искусственный интеллект изменит экономику

Читать далее 

18.04.2024

Неочевидный САПР: выход ПО за рамки конструкторской деятельности

Читать далее 

18.04.2024

Скоро некому будет делать сайты и заниматься версткой

Читать далее 

18.04.2024

Цифровая трансформация в энергетике: как запустить проект с максимальным финансовым эффектом?

Читать далее 

05.04.2024

Мотивируй, не то проиграешь!

Читать далее 

22.03.2024

В 2024 году в России и мире вырастут объемы применения AR/VR 

Читать далее 

25.02.2024

Цифровые технологии: надежды и риски

Читать далее 

05.02.2024

Будут ли востребованы услуги технической поддержки софта Oracle в России в ближайшие годы?  

Читать далее 

31.01.2024

Здания с признаками интеллекта. Как Сергей Провалихин автоматизирует дома и производства

Читать далее 

показать все 

Почему отказывают ИT-сервисы?

Главная / Архив номеров / 2012 / Выпуск №2 (20) / Почему отказывают ИT-сервисы?

Рубрика: ИТ-инфраструктура


Александр Тетюшевк.т.н., доцент кафедры АВТ, Вологодского Государственного Технического Университета (ВоГТУ)

Почему отказывают ИT-сервисы?

Только на основе функционального коэффициента готовности можно говорить о сервисном обслуживании. Если вам предлагают лишь техническое обслуживание и восстановление в случае краха, – это не сервис, а периодические разовые услуги

Начнем с простого. Что такое ИТ-сервис? Замечено, что в зависимости от компании и занимаемой должности определение ИТ-сервиса сильно видоизменяется. Для кого-то это «оказываемая услуга», для кого-то «сопровождение», для кого-то «аудит и консалтинг». Как отметил Дженни Дагмор, «менее чем за 25 лет, индустрия ITSM превратилась во множество противоречивых стандартов, методов и правил для «лучших практик сервис-менеджмента». Каждая коммерческая компания (Microsoft, Cisco, RedHat и т.д.) вкладывает в ИТ-сервис свои методики, поскольку только так их можно продать наиболее выгодно. ИТ-сервис, построенный на массовых продуктах, сам стал массовым продуктом, для которого вместо принципа «что нужно», работает принцип «что можно» [1]. Отличие в этих принципах в том, что первый диктуется регламентирующими документами, такими как техническое задание или ГОСТ, а второй определяется исключительно потребительским спросом. А в нашей стране потребительский спрос исконно крайне нетребовательный. В результате получается отвратительный сервис за большие деньги.

Однако формальное описание ИТ-сервиса было дано еще в 90-м году прошлого века (ГОСТ 34.003-90). В то время ИТ-сервис назывался более понятным словосочетанием «автоматизированная система». Итак, ИТ-сервис (автоматизированная система) – это система, состоящая из персонала и комплекса средств автоматизации его деятельности, реализующая информационную технологию выполнения установленных функций. Как любое формальное определение ГОСТ не несет конкретики, но он четко определяет состав (персонал и комплекс средства автоматизации) и назначение (выполнение определенных функций). Функциональный анализа затрагивает комплекс средств автоматизации (КСА), включающий как технические, так и программные средства, поэтому позволю себе сделать небольшое отступление и попытаться объяснить их функциональное различие.

Проведем небольшую аналогию между дарвиновской теорией эволюции и развитием ИТ-индустрии. В них, если приглядеться, есть много общего. Сначала были арифмометры – простейшие вычислительные системы специального назначения. Подобно простейшим организмам, эти системы могли поглощать информацию только определенного типа. Потом появились аналоги червей – универсальные вычислительные машины с пакетной обработкой данных. Для них потребовалось создать шину данных (простейшую пищеварительную систему) и центральный процессор (сердце). Но их эффективность оказалась крайне мала, поскольку техническая составляющая (ТС) этих вычислительных машин была не способна разбирать входную информацию (пищу) и часто работала вхолостую. Все стало значительно легче, когда технические средства покрылись жестким каркасом программных средств (ПС) и появилась накопительная система (желудок).

Я сравниваю ПС с жестким каркасом, поскольку многие его особенности очень хорошо ассоциируются с костным скелетом живых организмов. Вот только некоторые из них:

  • ПС существует практически вечно по сравнению с информационной системой, для которой оно создавалось. То же самое можно сказать о скелетах организмов древних морей.
  • ПС с внесенными исправлениями становится совершенно новым объектом, с новыми свойствами. Целые и сросшиеся кости ведут себя по-разному.
  • Отказы ПС носят периодический характер, если не изменить тип информационной нагрузки. Если кость сломалась, то она снова сломается в том же месте при тех же операциях.
  • Если известно обходное решение для определенной ошибки ПС, она перестает быть ошибкой. Если вы знаете, как уберечь кость от повреждения, она не будет повторно сломана.

ПС, как и скелет в живом организме, служит связующим звеном для различных компонентов ТС, позволяя перераспределить между ними информационную нагрузку и увеличивая время функционирования всей информационной системы за счет разбора входной информации и подстройки. Другими словами, вычислительная система с ПС может сортировать входную информацию и перенастраивать аппаратуру для ее более эффективной обработки, тем самым уменьшая аппаратный износ.

К слову, сегодняшний этап «эволюции» КСА я бы отнес к эре ракообразных или жуков, поскольку современные ПС, подобно хитину или раковинам, полностью покрывают «аппаратную плоть» информационных систем. Только недавно появились прототипы «летающих жуков» (ChromeOS или FirefoxOS), у которых сплошной панцирь ПС раскрывается, давая прямой доступ браузера (крыльев) к оборудованию. Надеюсь, что в недалеком будущем мы увидим, как внутреннее программное обеспечение, представленное пока на уровне микрокода процессоров, контролеров жестких дисков или графических адаптеров, сформирует «скелеты» новых информационных систем. Такие системы не будут ограничивать рост «аппаратной плоти», но и потребуют совершенно новых принципов программирования.

Методика функционального анализа предприятия

Сделанное отступление требуется для того, чтобы показать, что ТС и ПС выполняют разные функции в КСА. Технические средства превалируют в классах задач по обработке информации, а программные средства в классах задач по разбору данных. Оба класса являются основными характеристиками современных вычислительных систем, и вопрос о том, что из них важнее, некорректен, поскольку также можно сравнивать «шире и глубже». Однако на базе этих классов мы можем сформировать четыре функциональных типа информационных систем:

  • Системы, для которых не критична ни скорость разбора данных, ни скорость обработки. К этому типу относятся десктопные вычислительные системы, консоли, планшеты и т.д. Временные задержки, возникающие при работе с данными, на этих устройствах считаются приемлемыми, и с функциональной точки зрения основным для этих систем является их исправность.
  • Скорость обработки данных критична, а скорость разбора нет. К этой категории относятся телекоммуникационные устройства, терминальные серверы, веб-серверы и т.д. Эти вычислительные системы хорошо работают с определенным типом данных (сетевыми пакетами, информационными потоками, специальными файлами). С функциональной точки зрения важна их безостановочная работа. Поскольку вычислительная составляющая здесь имеет значение, системы этого типа размещаются на системах с наиболее мощными вычислительными ресурсами.
  • Скорость разбора данных важна, а время выполнения нет. К этой категории можно смело отнести системы хранения, файл-, принт-, факс-серверы. Эти системы отлично работают с большим количеством входной информации, поступающей из нескольких источников, поскольку имеют многоуровневые подсистемы хранения и сортировки. Функционально для этого типа систем важна обработка всех поступающих данных. Их целостность и актуальность. Поэтому для систем этого типа следует выбирать оборудование с наиболее надежной и емкой системой хранения и памятью.
  • Скорость разбора и время выполнения критичны. К этой категории относятся реляционные базы данных, системы моделирования, экспертные системы и т.д. Длительные временные задержки или потеря данных для них просто недопустимы. Функционально для такого класса систем требуются максимальные вычислительные и емкостные ресурсы. Резервирование таких систем наиболее дорого и сложно.

Исходя их этого типового разбиения, мы можем сформировать функциональные группы информационных систем и провести для них резервирование.

Функциональный анализ

Проведем групповое разбиение ИТ-инфраструктуры предприятия (см. рис. 1 в техническом анализе). Для этого нужно определить все сервисы предприятия и разместить их по функциональному типу в группы. Поскольку нас интересует только анализ, а не точный расчет, выделим небольшую часть ИТ-сервисов (по одному сервису в каждой функциональной группе).

Таблица 1. Сервисное разбиение

# ИT-сервис Тип и описание технических средств
1 Делопроизводство 1-й тип. Рабочие станции для чтения и редактирования электронных документов
2 Интернет 2-й тип. Рабочие станции, прокси-сервер #3, телекоммуникационное оборудование
3 Документооборот 3-й тип. Рабочие станции, файловые и принт-серверы #2 для хранения документов и печати
4 Бухгалтерия 4-й тип. Рабочие станции, сервер 1С #1 для формирования бухгалтерской отчетности

Первый функциональный тип

Единственным критерием для устройств первого функционального типа является их работоспособность, поэтому функциональное резервирование этих систем аналогично техническому резервированию. В самом простом случае это дублирование (установка КСА на двух или более технических системах). Таким образом, на функциональном уровне мы получим восстанавливаемые элементы с горячей заменой, для которых можно определить коэффициент готовности (1).

Формула 1

В данной формуле:

  • Тнараб – время работы ИT-сервиса;
  • Тсмен – время, затрачиваемое на переход с основной системы на резервную систему.

Отмечу, что данный тип функционального резервирования наиболее прост и дешев. Время, затрачиваемое на смену рабочего места, значительно меньше, чем время восстановления рабочей станции, поэтому коэффициент функциональной готовности значительно выше технического коэффициента готовности. Если в среднем переход на резервное рабочее место составляет около 20 минут, коэффициент функциональной готовности (2).

Формула 2

Что соответствует 18 минутам простоя в год. Именно поэтому, чем больше компьютеров попадает под первый функциональный тип, тем дешевле и проще общее резервирование предприятия. Именно поэтому техническая надежность рабочих станций не столь критична. На рис. 1 показано, как работает сервис «Делопроизводство» в случае функционального резервирования.

Рисунок 1. Резервирование КСА первого функционального типа

Рисунок 1. Резервирование КСА первого функционального типа

Задача установки резервных вычислительных систем для функционального резервирования первого типа решается довольно просто. Достаточно разместить резервную КСА как можно ближе к рабочей, чтобы уменьшить время перехода пользователя с основной системы на резервную и обратно.

Второй функциональный тип

При резервировании систем второго функционального типа мы можем «пожертвовать» частью данных, но не временем обработки. В общем случае функциональное резервирование второго типа включает раздающее устройство и несколько систем обработки. Тогда при выходе из строя одной системы обработки ее данные теряются, но другие системы продолжают работать. Для восстановления потерянной информации используются различные механизмы переповторов из раздающего устройства. Так работает большинство сетевых служб. Функционально мы получаем восстанавливаемую пару с горячим резервом в виде раздающей системы. Если обрабатывающие системы одинаковы, коэффициент функциональной готовности ИT-сервиса определяется как (3).

Формула 3

где:

  • Тнараб – время работы сервиса;
  • Тпер – время переповтора утраченных данных из раздающей системы.

Поскольку время переповтора данных напрямую зависит от их объема и пропускной способности сети, всегда предпочтительны раздающие системы с небольшими порциями данных и сети с максимальной пропускной способностью. Этим, кстати, объясняется предпочтение скачивания больших файлов через торренты, чем «напрямую» с сервера.

Для сервиса «Интернет» раздающим устройством будет сеть провайдера. Таким образом, для функционального резервирования нам достаточно продублировать прокси-сервер (сервер №3) и добавить еще один ADSL-модем. Схема ИT-сервиса «Интернет» показана на рис. 2.

Рисунок 2. Резервирование КСА второго функционального типа

Рисунок 2. Резервирование КСА второго функционального типа

Если бы ИT-служба второго типа была внутренней службой, пришлось бы дополнительно развертывать обрабатывающую и раздающую системы. Например, в случае развертывания MS Active Directory первый контролер домена работает как раздающее устройство, и, следовательно, для функционального резервирования должно быть установлено как минимум два дополнительных контролера AD, которые будут выполнять функции обрабатывающих систем. Установка только одного дополнительного контролера чревата тем, что в случае программной ошибки или применения неверной политики безопасности невозможно будет определить, какой из доменов работает неверно.

Для примера, у вас два компаса и оба показывают в разные стороны. Чтобы выяснить какой из них «врет», вам нужен третий компас. Раздающая система для систем второго функционального типа является тем самым третьим компасом.

Третий функциональный тип

При резервировании систем третьего функционального типа мы может «пожертвовать» временем обработки, но не данными. В общем случае для организации функционального резервирования третьего типа данные размещаются централизовано, и доступ к ним организовывается через очередь. Классический пример КСА третьего типа – файловый сервер. Поскольку лучшим резервом при длительной эксплуатации является усиление элементов, все элементы файлового сервера должны быть максимально усилены. Это усиление включает не только техническое усиление, но и программное усиление в виде копирования данных. Отмечу, что процесс копирования данных – это задача второго функционального типа, и, следовательно, должно быть не менее двух устройств резервирования данных. Функционально мы получаем восстанавливаемый объект с коэффициентом готовности (4).

Формула 4

где:

  • Тнараб – время работы системы;
  • Тзадер – средняя длительность задержек при обработке данных в очереди.

Рисунок 2. Резервирование КСА второго функционального типаРисунок 3. Резервирование КСА третьего функционального типа

Рисунок 3. Резервирование КСА третьего функционального типа

Четвертый функциональный тип

Как вы уже, наверное, догадались, практически невозможно обеспечить функциональную отказоустойчивость без потери данных или времени обработки. Поскольку четвертый функциональный тип не может пожертвовать ни тем, ни другим, наилучшим решением будет сведение его к трем предыдущим. Следовательно, мы должны разделить сервис «Бухгалтерия» на три части: две рабочие станции и с терминальным клиентом (первый функциональный тип), два сервера приложений 1С (второй функциональный тип) с раздающим устройством в виде централизованной отказоустойчивой системы хранения (третий функциональный тип).

Для каждой части необходимо провести свое резервирование. На рис 4. показана схема такого резерва. В его основе лежит отказоустойчивый кластер с выделенной системой хранения, на которой размещены все данные. Каждый узел кластера используется как терминальный сервер и сервер приложений 1С. Рабочие станции используются как терминальные клиенты.

Рисунок 4. Резервирование КСА четвертого функционального типа после разделения

Рисунок 4. Резервирование КСА четвертого функционального типа после разделения

Существуют системы четвертого функционального типа, сведение которых невозможно. Для функционального резервирования таких систем используются еще более сложные аппаратно-программные комплексы, уменьшающие потери данных и времени обработки, но сами потери в них неизбежны.

Функциональный анализ

Финальная схема ИТ-инфраструктуры предприятия с учетом функционального резервирования показана на рис. 5. Две рабочие станции 43 и 44 используются в качестве резерва (одна станция на этаж) для сервисов «Делопроизводство» и «Бухгалтерия». Этот выбор сделан только из соображений скорости перехода сотрудника с основной системы на резервную систему, поскольку вероятность одновременного отказа двух рабочих станций маловероятна. Отмечу, что эти резервные станции должны содержать все клиентское программное обеспечение, используемое на предприятии, поэтому для их организации необходимо либо применять мощную вычислительную систему с несколькими виртуальными десктопными системами внутри, либо провести уменьшение используемого программного обеспечения на рабочих станциях (ввести регламентируемое программное обеспечение), перенеся основную информационную нагрузку на серверы. Результат будет одинаков, но во втором случае можно сэкономить на оборудовании.

Рисунок 5. Часть типового дерева отказов ИТ-инфраструктуры

Рисунок 5. Часть типового дерева отказов ИТ-инфраструктуры

Два сервера №3 и дополнительный ADSL-модем формируют отказоустойчивое соединение для сервиса «Интернет». Каждый из серверов имеет подключение к обоим маршрутизаторам.

Отказоустойчивый кластер из двух серверов №1 и 2 с выделенной подсистемой хранения данных формирует отказоустойчивое хранилище для сервисов «Документооборот» и «Бухгалтерия». Оба узла кластера используются как серверы приложений для сервиса «Бухгалтерия».

Отмечу, что полученный результат не является единственно правильным, поскольку, как уже отмечалось, для сложных систем возможны варианты решений, и все они могут быть верными, поскольку зависят от метода решения.

Дерево отказов

С ростом ИТ-сервисов увеличивается количество резервных систем, поэтому соблюдение всех рекомендаций по надежности может привести к обратному эффекту (уменьшить надежность функционирования ИТ-инфраструктуры) за счет увеличения сложности или стоимости ИТ-инфраструктуры. Для баланса между рекомендациями и стоимостью используются всевозможные стоимостные модели, отражающие зависимость стоимости владения от требуемой надежности. При этом обычно учитывается, что ИT-сервисы одного функционального типа резервируются одинаково и могут размещаться на одном и том же оборудовании. Таким образом, в целях экономии средств можно провести установку принт-серверов на кластер, а веб-сервер установить на прокси-серверах (см. рис. 4). Еще большего удешевления можно добиться, если развертывать виртуальные серверы вместо физических.

Другой путь связан с упрощением функционального резервирования ИТ-инфраструктуры с применением дерева отказов [2], в котором определяются значимость того или иного сервиса, их взаимозависимость и роль персонала (в данном контексте рассматривается обычный пользователь, а не ИТ-специалист). Дерево отказов регламентирует работу пользователей в случае неожиданного отказа одного из сервисов, уменьшая неопределенность в принятии решений. Другими словами, дерево отказов не позволяет ему производить хаотических действий, приводящих обычно к тяжелым последствиям.

На рис. 5 показано типовое дерево отказов ИТ-инфраструктуры и расписана часть дерева, отвечающая за сервис электроснабжения. Как не трудно заметить, дерево отказов позволяет уменьшить количество резервных подсистем за счет работы персонала. Попробуйте заменить действия персонала некой автоматической вычислительной системой, и вы сразу убедитесь в этом.

Как видите, функциональный анализ позволяет создать разумную избыточность ресурсов и строить на их основе отказоустойчивые сервисы предприятия. Дерево отказов позволяет выявить слабые места ИТ-инфраструктуры, задействовать персонал для экономии ресурсов и функционального упрощения резервирования.

Кроме этого, функциональный анализ позволяет оценить стоимость и вид работы персонала по стоимости сервисов, которые он в состоянии сопровождать и резервировать. Например, услуги электрика позволяют функционально продублировать существующую электрическую сеть. Если стоимость исправной электросети предприятия больше суммарной зарплаты электрика на протяжении времени ее эксплуатации, он нужен на постоянной основе. Если нет, достаточно оплачивать его разовые услуги.

В этом плане понятно, почему аутсорсинг до сих пор не прижился в России. У нас системный администратор занимается не только обслуживанием оборудования и программного обеспечения. Он и электрик, и специалист по кондиционерам, и грузчик, и еще бог знает кто. Суммарная стоимость сервисов, которые он резервирует, значительно превосходит выгоду, получаемую от «узких» специалистов.

Вместо заключения по функциональному анализу

В заключение я бы хотел еще раз вернуться к ИТ-сервисам. Каждый из них характеризуется функциональным коэффициентом готовности, а не скоростью восстановления. Это принципиально важно. Только на основе функционального коэффициента готовности можно говорить о сервисном обслуживании. Если вам не могут его предоставить, предлагая только техническое обслуживание и восстановление в случае краха, – это не сервис, а периодические разовые услуги. (А вот ваши ежемесячные платежи – это сервис, поскольку они гарантированы во времени.)

ИТ-сервис определяется прежде всего функциями (задачами, которые он решает), а не аппаратно-программным набором, поэтому для него необходим функциональный, а не технический резерв. Функциональное резервирование включает резервные системы и документацию, в которой описаны действия персонала для перехода на резервные системы. Если таких систем нет или персонал не знает, что делать, чтобы перейти на резервную систему, сервиса нет.

ИТ-сервис – это процесс во времени. Поэтому он должен включать средства диагностики. Пользователи сервиса вправе знать, в каком состоянии находится предоставляемый ИТ-сервис в любой момент времени. Нет мониторинга – нет сервиса.

***

Почему отказывают ИТ-сервисы? Основная причина, очевидно, в том, что большинство из них сервисами не является. Вторая причина – отсутствие или чрезмерная экономия при функциональном резервировании (подмена его техническим резервом). И, безусловно, техническая и информационная безграмотность персонала, приводящая порой к парадоксальным ситуациям.

  1. Дзиркал Э.В. Задание и проверка требований к надежности сложных изделий – М.: «Радио и связь», 1981.
  2. Диллон Б., Синг Ч. Инженерные методы обеспечения надежности систем – М.: «Мир», 1983.

В начало⇑

 

Комментарии отсутствуют

Комментарии могут отставлять только зарегистрированные пользователи

Выпуск №02 (135) 2024г.
Выпуск №02 (135) 2024г. Выпуск №01 (134) 2024г.
Вакансии на сайте Jooble

           

Tel.: (499) 277-12-41  Fax: (499) 277-12-45  E-mail: sa@samag.ru

 

Copyright © Системный администратор

  Яндекс.Метрика