Олег Гиацинтов: Мир еще только пробует Большие Данные
 
                 
Поиск по сайту
 bit.samag.ru     Web
Рассылка Subscribe.ru
подписаться письмом
Вход в систему
 Запомнить меня
Регистрация
Забыли пароль?

Календарь мероприятий
апрель    2024
Пн
Вт
Ср
Чт
Пт
Сб
Вс
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

показать все 

Новости партнеров

22.04.2024

Сообщество цифровых управленцев «я-ИТ-ы» проводит ЗАКРЫТУЮ встречу в рамках выставки «Связь-2024»!

Читать далее 

18.04.2024

Ассоциация разработчиков «Отечественный софт» отметила 15-летие

Читать далее 

17.04.2024

РДТЕХ представил Технологическую карту российского ПО 2023

Читать далее 

16.04.2024

RAMAX Group получила партнерский статус уровня Gold по продукту Tarantool

Читать далее 

показать все 

Статьи

18.04.2024

5 способов повысить безопасность электронной подписи

Читать далее 

18.04.2024

Как искусственный интеллект изменит экономику

Читать далее 

18.04.2024

Неочевидный САПР: выход ПО за рамки конструкторской деятельности

Читать далее 

18.04.2024

Скоро некому будет делать сайты и заниматься версткой

Читать далее 

18.04.2024

Цифровая трансформация в энергетике: как запустить проект с максимальным финансовым эффектом?

Читать далее 

05.04.2024

Мотивируй, не то проиграешь!

Читать далее 

22.03.2024

В 2024 году в России и мире вырастут объемы применения AR/VR 

Читать далее 

25.02.2024

Цифровые технологии: надежды и риски

Читать далее 

05.02.2024

Будут ли востребованы услуги технической поддержки софта Oracle в России в ближайшие годы?  

Читать далее 

31.01.2024

Здания с признаками интеллекта. Как Сергей Провалихин автоматизирует дома и производства

Читать далее 

показать все 

Олег Гиацинтов: Мир еще только пробует Большие Данные

Главная / Интервью / Олег Гиацинтов: Мир еще только пробует Большие Данные


БИТ: Как известно, по степени упоминаемости в ИТ Большие Данные уже идут вторыми вслед за проблемой безопасности. Но характерно, что чаще всего это происходит в связи с финансовой сферой. Чем это вызвано и сохранится ли подобное лидерство в перспективе?

ОГ: Сама по себе технология (а Большие Данные влекут за собой технологии хранения их, извлечения и управления) никогда не является первичной. Все исходит из задач. Если у заказчика есть насущная проблема с теми объемами, которые ведут к необходимости применять технологию БД, он будет это использовать. Указанная отрасль такие проблемы генерирует чаще, чем другие. В финансовой сфере, а еще в телекоммуникационной очень высокая конкуренция. У них кровная необходимость развиваться быстрее, особенно, банкам. Наконец, банков просто больше. Несмотря на все слияния и поглощения. При всех подобных операциях никуда не девается тренд, выраженный в том, что работать приходится с множеством разных данными, у предприятий этой отрасли реально больше задач, кроме того, свои объемы данных они не успевают  обрабатывать со скоростью, которой требует их бизнес. На одной из презентаций я приводил пример с объемом данных всего в 1 Терабайт. Обрабатывались они  в течение часа минимум, а до того еще несколько часов стояли в очереди на обработку – отчетность, таким образом, была готова лишь на другой день, а требовалась – сейчас! Если представить, что число запросов сократилось, результат появился бы скорее. Но при любом раскладе все равно есть необходимость в технологии, дающей результат быстрее, как минимум в части «распараллеливания» отчетов. Соответственно, первое и главное условие работы с Большими Данными – необходимо  верное позиционирование (или целеполагание). 

БИТ: А не может ли технология сама собой генерировать (подтягивать к своему развитию) и спрос тоже?

ОГ: Я думаю, что этот уровень развития БД придет. Подобное продвижение мы видели, работая с BI, ЕTL, у них все же «стаж» существования больше. Имеется еще одна особенность: на рынке все смотрят друг на друга и часто внедряют новую технологию не потому, что так надо бизнесу, а потому, что у кого-то подсмотрели, поняли, что иначе отстанешь. «У соседа есть, почему бы и нам не внедрить?». Но картина, которую вижу я,- пока что такова: во-первых, производители не понимают, куда бы эти БД продвинуть и все кончается «пилотом», заказчики не понимают, куда бы это применить, хотя проблемы есть, но куда новинку «приткнуть»? Фаза развития технологии Больших Данных, при которой заказчику придется поспевать за ними в генерировании задач  с точки зрения реализованного функционала, непременно настанет, я уверен. Однако сейчас этого нет ни здесь, ни за рубежом. Работая в компании дистрибьюторе корпорации Informatica в РФ и на территории СНГ, я пришел к выводу, что мы недалеко ушли от развитых стран…

БИТ: Может, они от нас?

ОГ: Или они от нас. Никто пока не вырвался. Весь мир сейчас лишь пробует Большие Данные. Есть разовые проекты и нет их лавины, как в свое время было с BI.

БИТ: А пересекаются BI с Big Data?

ОГ: Пересекаются, но важнее другое: аналитика, которая строится для бизнеса, требует совершенно различных данных и, соответственно, расчетов. Чем сложней расчет, чем больше данных он требует, тем расчет строится медленнее. Опять же, крупные вендоры, в основном, предлагают applines (софт, отвечающий за технологию работы с БД Hadoop) и железо, позволяющее быстро создать витрину и быстро продемонстрировать на базе этой витрины отчет (например, у Oracle это ExadataMashine). В этой связи нельзя не учитывать бытующего мнения, что БД приводят к большим затратам…

БИТ: Это неправда?

ОГ: С какой стороны на это посмотреть. Со стороны продвигающей решение ИТ-компании? Ей выгодно предложить свое железо для хранения объема данных заказчика. Заказчику же, разумеется, хочется сэкономить, тем более, что изначально было известно, что БД – технология Оpensourse (условно говоря, бесплатная). Определенный диссонанс в этом есть. Но я считаю, что у каждого рынок будет свой. Ни эти рынки, ни опять же условно говоря, общий рынок пока не сформированы. Технология БД, в частности, уже упомянутая Hadoop, состоит в том, что умножая число серверов и компьютеров, которые включены в единую сеть, вы получаете резкий скачок производительности, отказоустойчивости, возможностей хранению данных и т.д. А при увеличении объема уже работающего железа (памяти, дисковое пространство) такого прироста не добиться.

БИТ: Но это же странно!

ОГ: Странно лишь на первый взгляд. Ведь тот же Hadoop и разрабатывался для максимального использования всех имеющихся ресурсов. Соответственно, если прибавить еще одну-две машины, это сильно поможет распараллелить те же расчеты.

БИТ: Как известно, каждые 5, а теперь уже и 3 года объем данных удваивается, причем, архивные физически не исчезают и там, где прогностический процесс от них зависит сильнейшим образом, новые технологии должны пригодиться, например, метеорология - она просто создана для БД, ей просто «грозит» безошибочность…

ОГ: Пример удачный, есть много сфер, буквально созданных для акцепции БД. Однако в чем «но»? Любая компания состоит, прежде всего, из людей, технологии продвигают конкретные люди. А их,  способных придумать параметры, годные к использованию, мало. Заинтересованных в продвижении больше, но это разные категории людей. В новой информации, которая поможет что-то решить, или развить бизнес в еще одном направлении, заинтересовано хотя бы руководство. Способных нащупать фронт продвижения крайне мало. Справедливо, что масса неструктурированных БД растет быстрее структурированных. Но почти никто не знает – что из этой быстро набухающей массы можно извлечь. К тому же число знающих не может расти, процент генераторов идей (их потолок) неизменен. То есть, оптимальное сочетание топ-менеджмента и людей, у которых, попросту говоря, «шило чуть пониже спины», дает возможность продвигать сначала небольшой проектик, а по мере успеха, продвигать его усложненные варианты. Далее подтянутся наблюдатели, «болельщики». У той жеInformatica уже лет 10 существуют технология по работе с неструктурированными данными.

БИТ: А не приведет ли экспоненциальное накопление БД к тому, что сами они «от своего избытка»  перейдут в разряд советчиков? То есть не мы их будем выбирать и архивировать, а нас – они?

ОГ: Очень возможно. Почему вообще БД возникли? Откуда взялись технологии по управлению ими? От нашей лени (откуда и прогресс как таковой). Мы ведь стараемся облегчить себе жизнь. То же касается и принятия решений. Зачем принимать решение самому, если тебе могут его подсказать? Не помню, кто сказал: «Мы опасаются этого, потому делаем все, чтобы ЭТО пришло».

БИТ: Изменяются ли, растут ли качественно внедряемые вами технологии БД, либо еще не выработали свой ресурс?

ОГ: Технологии пока что растут преимущественно вширь. Компания начинает набирать себе больше функциональностей. Появляются онлайн-решения, решения для работы с соцсетями и прочее. Informatica выросла на технологии ETL, которая не сильно меняется. Меняется позиционирование: рынок подобными решениями уже во многом насыщен, идет сдвиг применения этих технологий в составе пакетов. Однако я пока не вижу задач, которые стимулировали бы заказчика технологии развивать. Превалирует желание справляться имеющимися  решениями. А развитие возможно с появлением больших проблем.

БИТ: А велика ли конкуренция на рынке внедрений?

ОГ: Надо разделить дистрибьютеров и вендоров. Informatica - вендор, наша DIS Group– дистрибьюторы. Хотя и занимаемся технологиями БД не только с Informatica, а видя еще и возможность работы не только с большими объемами данных или с большой параллелизацией, но и как возможность работы с данными на внешних ресурсах. Не думаю, что в этом смысле у Informatica большая конкуренция – у каждого игрока есть свой набор решений – у IBM, у Oracle, у Microsoft будет что-то. Но никто пока свой рынок не нашел. Пока боятся заказчики, боятся и ИТ-компании.

БИТ: Напоминает лунную поверхность, еще не всю изрытую посадочными модулями.

ОГ: Не совсем. Мы в глубоком тумане, и откуда бы ни подул ветер – туман исчезнет.

Беседовал Александр Коднир

В начало⇑

Выпуск №02 (135) 2024г.
Выпуск №02 (135) 2024г. Выпуск №01 (134) 2024г.
Вакансии на сайте Jooble

           

Tel.: (499) 277-12-41  Fax: (499) 277-12-45  E-mail: sa@samag.ru

 

Copyright © Системный администратор

  Яндекс.Метрика