Олег Гиацинтов: Мир еще только пробует Большие Данные
 
                 
Поиск по сайту
 bit.samag.ru     Web
Рассылка Subscribe.ru
подписаться письмом
Вход в систему
 Запомнить меня
Регистрация
Забыли пароль?

Календарь мероприятий
декабрь    2019
Пн
Вт
Ср
Чт
Пт
Сб
Вс
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

показать все 

Новости партнеров

06.12.2019

100-тысячную консультацию Центра услуг для бизнеса в Москве получила руководитель экологически важного проекта

Читать далее 

05.12.2019

ИСП РАН и Huawei открыли совместную R&D-лабораторию по развитию средств разработки программного обеспечения

Читать далее 

04.12.2019

Определилась победительница московского этапа федерального проекта «Мама-предприниматель»

Читать далее 

04.12.2019

НОРБИТ начинает внедрять системы для автоматизации закупок  на платформе Creatio

Читать далее 

показать все 

Статьи

04.12.2019

ЛАНИТ учредил премию IT Stars памяти основателя компании Георгия Генса

Читать далее 

26.11.2019

Осторожно: данные!

Читать далее 

26.10.2019

Что делать, чтобы тебя услышали?

Читать далее 

19.09.2019

Онлайн-обучение: кризис жанра?

Читать далее 

19.09.2019

Битва за электронику: кто кого?

Читать далее 

31.08.2019

Кадры для цифровой среды

Читать далее 

04.06.2019

Маркетолог: привлекать, продавать, продвигать?

Читать далее 

04.06.2019

Бонусы за лояльность

Читать далее 

04.06.2019

Прощайте, доктора?

Читать далее 

04.06.2019

Между В2В и В2С – сплошная двойная

Читать далее 

показать все 

Олег Гиацинтов: Мир еще только пробует Большие Данные

Главная / Интервью / Олег Гиацинтов: Мир еще только пробует Большие Данные


БИТ: Как известно, по степени упоминаемости в ИТ Большие Данные уже идут вторыми вслед за проблемой безопасности. Но характерно, что чаще всего это происходит в связи с финансовой сферой. Чем это вызвано и сохранится ли подобное лидерство в перспективе?

ОГ: Сама по себе технология (а Большие Данные влекут за собой технологии хранения их, извлечения и управления) никогда не является первичной. Все исходит из задач. Если у заказчика есть насущная проблема с теми объемами, которые ведут к необходимости применять технологию БД, он будет это использовать. Указанная отрасль такие проблемы генерирует чаще, чем другие. В финансовой сфере, а еще в телекоммуникационной очень высокая конкуренция. У них кровная необходимость развиваться быстрее, особенно, банкам. Наконец, банков просто больше. Несмотря на все слияния и поглощения. При всех подобных операциях никуда не девается тренд, выраженный в том, что работать приходится с множеством разных данными, у предприятий этой отрасли реально больше задач, кроме того, свои объемы данных они не успевают  обрабатывать со скоростью, которой требует их бизнес. На одной из презентаций я приводил пример с объемом данных всего в 1 Терабайт. Обрабатывались они  в течение часа минимум, а до того еще несколько часов стояли в очереди на обработку – отчетность, таким образом, была готова лишь на другой день, а требовалась – сейчас! Если представить, что число запросов сократилось, результат появился бы скорее. Но при любом раскладе все равно есть необходимость в технологии, дающей результат быстрее, как минимум в части «распараллеливания» отчетов. Соответственно, первое и главное условие работы с Большими Данными – необходимо  верное позиционирование (или целеполагание). 

БИТ: А не может ли технология сама собой генерировать (подтягивать к своему развитию) и спрос тоже?

ОГ: Я думаю, что этот уровень развития БД придет. Подобное продвижение мы видели, работая с BI, ЕTL, у них все же «стаж» существования больше. Имеется еще одна особенность: на рынке все смотрят друг на друга и часто внедряют новую технологию не потому, что так надо бизнесу, а потому, что у кого-то подсмотрели, поняли, что иначе отстанешь. «У соседа есть, почему бы и нам не внедрить?». Но картина, которую вижу я,- пока что такова: во-первых, производители не понимают, куда бы эти БД продвинуть и все кончается «пилотом», заказчики не понимают, куда бы это применить, хотя проблемы есть, но куда новинку «приткнуть»? Фаза развития технологии Больших Данных, при которой заказчику придется поспевать за ними в генерировании задач  с точки зрения реализованного функционала, непременно настанет, я уверен. Однако сейчас этого нет ни здесь, ни за рубежом. Работая в компании дистрибьюторе корпорации Informatica в РФ и на территории СНГ, я пришел к выводу, что мы недалеко ушли от развитых стран…

БИТ: Может, они от нас?

ОГ: Или они от нас. Никто пока не вырвался. Весь мир сейчас лишь пробует Большие Данные. Есть разовые проекты и нет их лавины, как в свое время было с BI.

БИТ: А пересекаются BI с Big Data?

ОГ: Пересекаются, но важнее другое: аналитика, которая строится для бизнеса, требует совершенно различных данных и, соответственно, расчетов. Чем сложней расчет, чем больше данных он требует, тем расчет строится медленнее. Опять же, крупные вендоры, в основном, предлагают applines (софт, отвечающий за технологию работы с БД Hadoop) и железо, позволяющее быстро создать витрину и быстро продемонстрировать на базе этой витрины отчет (например, у Oracle это ExadataMashine). В этой связи нельзя не учитывать бытующего мнения, что БД приводят к большим затратам…

БИТ: Это неправда?

ОГ: С какой стороны на это посмотреть. Со стороны продвигающей решение ИТ-компании? Ей выгодно предложить свое железо для хранения объема данных заказчика. Заказчику же, разумеется, хочется сэкономить, тем более, что изначально было известно, что БД – технология Оpensourse (условно говоря, бесплатная). Определенный диссонанс в этом есть. Но я считаю, что у каждого рынок будет свой. Ни эти рынки, ни опять же условно говоря, общий рынок пока не сформированы. Технология БД, в частности, уже упомянутая Hadoop, состоит в том, что умножая число серверов и компьютеров, которые включены в единую сеть, вы получаете резкий скачок производительности, отказоустойчивости, возможностей хранению данных и т.д. А при увеличении объема уже работающего железа (памяти, дисковое пространство) такого прироста не добиться.

БИТ: Но это же странно!

ОГ: Странно лишь на первый взгляд. Ведь тот же Hadoop и разрабатывался для максимального использования всех имеющихся ресурсов. Соответственно, если прибавить еще одну-две машины, это сильно поможет распараллелить те же расчеты.

БИТ: Как известно, каждые 5, а теперь уже и 3 года объем данных удваивается, причем, архивные физически не исчезают и там, где прогностический процесс от них зависит сильнейшим образом, новые технологии должны пригодиться, например, метеорология - она просто создана для БД, ей просто «грозит» безошибочность…

ОГ: Пример удачный, есть много сфер, буквально созданных для акцепции БД. Однако в чем «но»? Любая компания состоит, прежде всего, из людей, технологии продвигают конкретные люди. А их,  способных придумать параметры, годные к использованию, мало. Заинтересованных в продвижении больше, но это разные категории людей. В новой информации, которая поможет что-то решить, или развить бизнес в еще одном направлении, заинтересовано хотя бы руководство. Способных нащупать фронт продвижения крайне мало. Справедливо, что масса неструктурированных БД растет быстрее структурированных. Но почти никто не знает – что из этой быстро набухающей массы можно извлечь. К тому же число знающих не может расти, процент генераторов идей (их потолок) неизменен. То есть, оптимальное сочетание топ-менеджмента и людей, у которых, попросту говоря, «шило чуть пониже спины», дает возможность продвигать сначала небольшой проектик, а по мере успеха, продвигать его усложненные варианты. Далее подтянутся наблюдатели, «болельщики». У той жеInformatica уже лет 10 существуют технология по работе с неструктурированными данными.

БИТ: А не приведет ли экспоненциальное накопление БД к тому, что сами они «от своего избытка»  перейдут в разряд советчиков? То есть не мы их будем выбирать и архивировать, а нас – они?

ОГ: Очень возможно. Почему вообще БД возникли? Откуда взялись технологии по управлению ими? От нашей лени (откуда и прогресс как таковой). Мы ведь стараемся облегчить себе жизнь. То же касается и принятия решений. Зачем принимать решение самому, если тебе могут его подсказать? Не помню, кто сказал: «Мы опасаются этого, потому делаем все, чтобы ЭТО пришло».

БИТ: Изменяются ли, растут ли качественно внедряемые вами технологии БД, либо еще не выработали свой ресурс?

ОГ: Технологии пока что растут преимущественно вширь. Компания начинает набирать себе больше функциональностей. Появляются онлайн-решения, решения для работы с соцсетями и прочее. Informatica выросла на технологии ETL, которая не сильно меняется. Меняется позиционирование: рынок подобными решениями уже во многом насыщен, идет сдвиг применения этих технологий в составе пакетов. Однако я пока не вижу задач, которые стимулировали бы заказчика технологии развивать. Превалирует желание справляться имеющимися  решениями. А развитие возможно с появлением больших проблем.

БИТ: А велика ли конкуренция на рынке внедрений?

ОГ: Надо разделить дистрибьютеров и вендоров. Informatica - вендор, наша DIS Group– дистрибьюторы. Хотя и занимаемся технологиями БД не только с Informatica, а видя еще и возможность работы не только с большими объемами данных или с большой параллелизацией, но и как возможность работы с данными на внешних ресурсах. Не думаю, что в этом смысле у Informatica большая конкуренция – у каждого игрока есть свой набор решений – у IBM, у Oracle, у Microsoft будет что-то. Но никто пока свой рынок не нашел. Пока боятся заказчики, боятся и ИТ-компании.

БИТ: Напоминает лунную поверхность, еще не всю изрытую посадочными модулями.

ОГ: Не совсем. Мы в глубоком тумане, и откуда бы ни подул ветер – туман исчезнет.

Беседовал Александр Коднир

В начало⇑

Выпуск №09 (92) 2019г.
Выпуск №09 (92) 2019г. Выпуск №08 (91) 2019г. Выпуск №07 (90) 2019г. Выпуск №06 (89) 2019г. Выпуск №05 (88) 2019г. Выпуск №04 (87) 2019г. Выпуск №03 (86) 2019г. Выпуск №02 (85) 2019г. Выпуск №01 (84) 2019г.
Вакансии на сайте Jooble

           

Tel.: (499) 277-12-41  Fax: (499) 277-12-45  E-mail: sa@samag.ru

 

Copyright © Системный администратор

  Яндекс.Метрика