Олег Гиацинтов: Мир еще только пробует Большие Данные
 
                 
Поиск по сайту
 bit.samag.ru     Web
Рассылка Subscribe.ru
подписаться письмом
Вход в систему
 Запомнить меня
Регистрация
Забыли пароль?

Календарь мероприятий
декабрь    2020
Пн
Вт
Ср
Чт
Пт
Сб
Вс
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

показать все 

Новости партнеров

03.12.2020

Ведущие российские хостеры в шорт-листе Премии Рунета

Читать далее 

02.12.2020

В декабре состоится ежегодная Открытая конференция ИСП РАН

Читать далее 

30.11.2020

OS Day 2020: Российские операционные системы перспективны и безопасны 

Читать далее 

30.11.2020

MERLION Digital Day 2020 посмотрели более 5000 человек

Читать далее 

показать все 

Статьи

12.11.2020

Технология определяет успех

Читать далее 

11.10.2020

Soft skills или hard skills?

Читать далее 

10.09.2020

Как и чему учить будущих звезд ИТ?

Читать далее 

12.08.2020

Господдержка ИТ-отрасли

Читать далее 

11.08.2020

Интернет-маркетинг: второе дыхание

Читать далее 

13.02.2020

Чат-бот CallShark не требует зарплаты, а работает круглосуточно

Читать далее 

24.12.2019

До встречи в «Пьяном Сомелье»!

Читать далее 

21.12.2019

Искусство как награда Как изготавливали статуэтки для премии IT Stars им. Георгия Генса в сфере инноваций

Читать далее 

04.12.2019

ЛАНИТ учредил премию IT Stars памяти основателя компании Георгия Генса

Читать далее 

04.06.2019

Маркетолог: привлекать, продавать, продвигать?

Читать далее 

показать все 

Олег Гиацинтов: Мир еще только пробует Большие Данные

Главная / Интервью / Олег Гиацинтов: Мир еще только пробует Большие Данные


БИТ: Как известно, по степени упоминаемости в ИТ Большие Данные уже идут вторыми вслед за проблемой безопасности. Но характерно, что чаще всего это происходит в связи с финансовой сферой. Чем это вызвано и сохранится ли подобное лидерство в перспективе?

ОГ: Сама по себе технология (а Большие Данные влекут за собой технологии хранения их, извлечения и управления) никогда не является первичной. Все исходит из задач. Если у заказчика есть насущная проблема с теми объемами, которые ведут к необходимости применять технологию БД, он будет это использовать. Указанная отрасль такие проблемы генерирует чаще, чем другие. В финансовой сфере, а еще в телекоммуникационной очень высокая конкуренция. У них кровная необходимость развиваться быстрее, особенно, банкам. Наконец, банков просто больше. Несмотря на все слияния и поглощения. При всех подобных операциях никуда не девается тренд, выраженный в том, что работать приходится с множеством разных данными, у предприятий этой отрасли реально больше задач, кроме того, свои объемы данных они не успевают  обрабатывать со скоростью, которой требует их бизнес. На одной из презентаций я приводил пример с объемом данных всего в 1 Терабайт. Обрабатывались они  в течение часа минимум, а до того еще несколько часов стояли в очереди на обработку – отчетность, таким образом, была готова лишь на другой день, а требовалась – сейчас! Если представить, что число запросов сократилось, результат появился бы скорее. Но при любом раскладе все равно есть необходимость в технологии, дающей результат быстрее, как минимум в части «распараллеливания» отчетов. Соответственно, первое и главное условие работы с Большими Данными – необходимо  верное позиционирование (или целеполагание). 

БИТ: А не может ли технология сама собой генерировать (подтягивать к своему развитию) и спрос тоже?

ОГ: Я думаю, что этот уровень развития БД придет. Подобное продвижение мы видели, работая с BI, ЕTL, у них все же «стаж» существования больше. Имеется еще одна особенность: на рынке все смотрят друг на друга и часто внедряют новую технологию не потому, что так надо бизнесу, а потому, что у кого-то подсмотрели, поняли, что иначе отстанешь. «У соседа есть, почему бы и нам не внедрить?». Но картина, которую вижу я,- пока что такова: во-первых, производители не понимают, куда бы эти БД продвинуть и все кончается «пилотом», заказчики не понимают, куда бы это применить, хотя проблемы есть, но куда новинку «приткнуть»? Фаза развития технологии Больших Данных, при которой заказчику придется поспевать за ними в генерировании задач  с точки зрения реализованного функционала, непременно настанет, я уверен. Однако сейчас этого нет ни здесь, ни за рубежом. Работая в компании дистрибьюторе корпорации Informatica в РФ и на территории СНГ, я пришел к выводу, что мы недалеко ушли от развитых стран…

БИТ: Может, они от нас?

ОГ: Или они от нас. Никто пока не вырвался. Весь мир сейчас лишь пробует Большие Данные. Есть разовые проекты и нет их лавины, как в свое время было с BI.

БИТ: А пересекаются BI с Big Data?

ОГ: Пересекаются, но важнее другое: аналитика, которая строится для бизнеса, требует совершенно различных данных и, соответственно, расчетов. Чем сложней расчет, чем больше данных он требует, тем расчет строится медленнее. Опять же, крупные вендоры, в основном, предлагают applines (софт, отвечающий за технологию работы с БД Hadoop) и железо, позволяющее быстро создать витрину и быстро продемонстрировать на базе этой витрины отчет (например, у Oracle это ExadataMashine). В этой связи нельзя не учитывать бытующего мнения, что БД приводят к большим затратам…

БИТ: Это неправда?

ОГ: С какой стороны на это посмотреть. Со стороны продвигающей решение ИТ-компании? Ей выгодно предложить свое железо для хранения объема данных заказчика. Заказчику же, разумеется, хочется сэкономить, тем более, что изначально было известно, что БД – технология Оpensourse (условно говоря, бесплатная). Определенный диссонанс в этом есть. Но я считаю, что у каждого рынок будет свой. Ни эти рынки, ни опять же условно говоря, общий рынок пока не сформированы. Технология БД, в частности, уже упомянутая Hadoop, состоит в том, что умножая число серверов и компьютеров, которые включены в единую сеть, вы получаете резкий скачок производительности, отказоустойчивости, возможностей хранению данных и т.д. А при увеличении объема уже работающего железа (памяти, дисковое пространство) такого прироста не добиться.

БИТ: Но это же странно!

ОГ: Странно лишь на первый взгляд. Ведь тот же Hadoop и разрабатывался для максимального использования всех имеющихся ресурсов. Соответственно, если прибавить еще одну-две машины, это сильно поможет распараллелить те же расчеты.

БИТ: Как известно, каждые 5, а теперь уже и 3 года объем данных удваивается, причем, архивные физически не исчезают и там, где прогностический процесс от них зависит сильнейшим образом, новые технологии должны пригодиться, например, метеорология - она просто создана для БД, ей просто «грозит» безошибочность…

ОГ: Пример удачный, есть много сфер, буквально созданных для акцепции БД. Однако в чем «но»? Любая компания состоит, прежде всего, из людей, технологии продвигают конкретные люди. А их,  способных придумать параметры, годные к использованию, мало. Заинтересованных в продвижении больше, но это разные категории людей. В новой информации, которая поможет что-то решить, или развить бизнес в еще одном направлении, заинтересовано хотя бы руководство. Способных нащупать фронт продвижения крайне мало. Справедливо, что масса неструктурированных БД растет быстрее структурированных. Но почти никто не знает – что из этой быстро набухающей массы можно извлечь. К тому же число знающих не может расти, процент генераторов идей (их потолок) неизменен. То есть, оптимальное сочетание топ-менеджмента и людей, у которых, попросту говоря, «шило чуть пониже спины», дает возможность продвигать сначала небольшой проектик, а по мере успеха, продвигать его усложненные варианты. Далее подтянутся наблюдатели, «болельщики». У той жеInformatica уже лет 10 существуют технология по работе с неструктурированными данными.

БИТ: А не приведет ли экспоненциальное накопление БД к тому, что сами они «от своего избытка»  перейдут в разряд советчиков? То есть не мы их будем выбирать и архивировать, а нас – они?

ОГ: Очень возможно. Почему вообще БД возникли? Откуда взялись технологии по управлению ими? От нашей лени (откуда и прогресс как таковой). Мы ведь стараемся облегчить себе жизнь. То же касается и принятия решений. Зачем принимать решение самому, если тебе могут его подсказать? Не помню, кто сказал: «Мы опасаются этого, потому делаем все, чтобы ЭТО пришло».

БИТ: Изменяются ли, растут ли качественно внедряемые вами технологии БД, либо еще не выработали свой ресурс?

ОГ: Технологии пока что растут преимущественно вширь. Компания начинает набирать себе больше функциональностей. Появляются онлайн-решения, решения для работы с соцсетями и прочее. Informatica выросла на технологии ETL, которая не сильно меняется. Меняется позиционирование: рынок подобными решениями уже во многом насыщен, идет сдвиг применения этих технологий в составе пакетов. Однако я пока не вижу задач, которые стимулировали бы заказчика технологии развивать. Превалирует желание справляться имеющимися  решениями. А развитие возможно с появлением больших проблем.

БИТ: А велика ли конкуренция на рынке внедрений?

ОГ: Надо разделить дистрибьютеров и вендоров. Informatica - вендор, наша DIS Group– дистрибьюторы. Хотя и занимаемся технологиями БД не только с Informatica, а видя еще и возможность работы не только с большими объемами данных или с большой параллелизацией, но и как возможность работы с данными на внешних ресурсах. Не думаю, что в этом смысле у Informatica большая конкуренция – у каждого игрока есть свой набор решений – у IBM, у Oracle, у Microsoft будет что-то. Но никто пока свой рынок не нашел. Пока боятся заказчики, боятся и ИТ-компании.

БИТ: Напоминает лунную поверхность, еще не всю изрытую посадочными модулями.

ОГ: Не совсем. Мы в глубоком тумане, и откуда бы ни подул ветер – туман исчезнет.

Беседовал Александр Коднир

В начало⇑

Выпуск №08 (101) 2020г.
Выпуск №08 (101) 2020г. Выпуск №09 (102) 2020г. Выпуск №07 (100) 2020г. Выпуск №06 (99) 2020г. Выпуск №05 (98) 2020г. Выпуск №04 (97) 2020г. Выпуск №03 (96) 2020г. Выпуск №02 (95) 2020г. Выпуск №01 (94) 2020г.
Вакансии на сайте Jooble

           

Tel.: (499) 277-12-41  Fax: (499) 277-12-45  E-mail: sa@samag.ru

 

Copyright © Системный администратор

  Яндекс.Метрика