Большие данные не прощают ошибок::БИТ 03.2016
 
                 
Поиск по сайту
 bit.samag.ru     Web
Рассылка Subscribe.ru
подписаться письмом
Вход в систему
 Запомнить меня
Регистрация
Забыли пароль?

Календарь мероприятий
апрель    2024
Пн
Вт
Ср
Чт
Пт
Сб
Вс
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

показать все 

Новости партнеров

22.04.2024

Сообщество цифровых управленцев «я-ИТ-ы» проводит ЗАКРЫТУЮ встречу в рамках выставки «Связь-2024»!

Читать далее 

18.04.2024

Ассоциация разработчиков «Отечественный софт» отметила 15-летие

Читать далее 

17.04.2024

РДТЕХ представил Технологическую карту российского ПО 2023

Читать далее 

16.04.2024

RAMAX Group получила партнерский статус уровня Gold по продукту Tarantool

Читать далее 

показать все 

Статьи

18.04.2024

5 способов повысить безопасность электронной подписи

Читать далее 

18.04.2024

Как искусственный интеллект изменит экономику

Читать далее 

18.04.2024

Неочевидный САПР: выход ПО за рамки конструкторской деятельности

Читать далее 

18.04.2024

Скоро некому будет делать сайты и заниматься версткой

Читать далее 

18.04.2024

Цифровая трансформация в энергетике: как запустить проект с максимальным финансовым эффектом?

Читать далее 

05.04.2024

Мотивируй, не то проиграешь!

Читать далее 

22.03.2024

В 2024 году в России и мире вырастут объемы применения AR/VR 

Читать далее 

25.02.2024

Цифровые технологии: надежды и риски

Читать далее 

05.02.2024

Будут ли востребованы услуги технической поддержки софта Oracle в России в ближайшие годы?  

Читать далее 

31.01.2024

Здания с признаками интеллекта. Как Сергей Провалихин автоматизирует дома и производства

Читать далее 

показать все 

Большие данные не прощают ошибок

Главная / Архив номеров / 2016 / Выпуск №03 (56) / Большие данные не прощают ошибок

Рубрика: Тема номера /  Большие данные в задачах бизнеса


Большие данные не прощают ошибок

Поэтому управление задачами в подобных проектах должно быть на высшем уровне. Готовы ли к этому игроки отечественногоИТ-рынка?

На вопросы «БИТа» отвечают эксперты ведущих компаний

  1. Каковы сегодня тренды в Больших данных и перспективы их развития?
  2. Что необходимо для успеха проекта в области Больших данных?
  3. Применяете ли вы в своей компании технологии Big Data?
  4. Поделитесь примером эффективного использования Больших данных для бизнеса компании.
  5. Почему в России рынок технологий и услуг для Больших данных развивается медленнее, чем на глобальном рынке? Как можно изменить эту ситуацию?

Владимир Громов

«Очень скоро использование технологий Big Data станет вопросом выживания»

Владимир Громов, руководитель направления внедрения и развития аналитических систем «Ренессанс Кредит»

1. До недавнего времени подходы и технологии, объединенные разрекламированным понятием Big Data, воспринимались исключительно через призму знаменитых трех V: Volume (большой объем), Velocity (быстрое накопление), Variety (разнообразие). Основные перспективы Больших данных в широком бизнес-применении в нашей стране связаны с всеобщим осознанием, что на самом деле не хватает еще как минимум двух V: Value (ценность для бизнеса) и Veracity (достоверность данных). Иными словами, сейчас происходит смещение восприятия Big Data – от технологии, которая позволяет справляться с обработкой и хранением большого массива слабоструктурированных данных, к реальному бизнес-инструменту, приносящему прибыль.

2. Успех будет в том случае, если есть позитивный баланс между затратами на проект и бизнес-выгодами, которые получает компания от его реализации. Нужно очень четко представлять себе, за счет чего организация заработает деньги.К сожалению, в области Больших данных именно этот вопрос для многих компаний зачастую является камнем преткновения.

Вторым по порядку, но не по значимости, фактором являются люди. В организации должен появиться человек, который «заболеет» идеей внедрения подобного проекта и начнет фанатично продвигать его.

3. Да, применяем. Например, использование внешних данных в кросс-продажах является частью нашей продуктовой стратегии. Мы прекрасно понимаем, что пока еще время есть, но очень скоро использование технологий Big Data станет вопросом выживания. Поэтому сейчас находимся в стадии пилотирования, стараясь оценить финансовую сторону запуска полноценного проекта.

5. Эта проблема проявляется не только в данной области. В принципе весь российский ИТ-рынок сейчас развивается с оглядкой на лучшие зарубежные практики, поэтому определенное запаздывание вполне логично. Для того чтобы поверить во что-то и начать тратить на это время и средства, нам нужно увидеть чужой положительный опыт. Готового рецепта, как это поменять, нет. Очевидно, что если мы не хотим отставать, то должны научиться быстрее реагировать на новые технологические веяния, а еще лучше – вообще стать их источником.

 

Ольга Горчинская

«На рынке Больших данных наблюдается преобладание западных компаний в сегменте инфраструктурных решений, но среди поставщиков аналитических технологий есть и российские»

Ольга Горчинская, директор по исследовательским проектам и руководитель направления по Большим данным компании «ФОРС»

1. В качестве основных трендов развития технологий Больших данных можно указать следующие:

  • Широкое распространение технологии Hadoop, которая используется для решения различных задач хранения и обработки больших объемов неструктурированной информации. Hadoop играет ключевую роль в архитектурах хранилищ данных с использованием озер данных. После многочисленных экспериментов и пилотных Hadoop-проектов в банках, телекоме, ретейле и других индустриях компании переходят к промышленному внедрению. Hadoop становится стандартным элементом любой ИТ-инфраструктуры.
  • Повышение роли машинного обучения в аналитических приложениях и системах. Интерес к этому направлению растет очень высокими темпами, сфера применения методов и программных средств машинного обучения расширяется столь же быстро. По прогнозным оценкам, к 2020 году более половины всех BI-систем будут включать углубленную аналитику, основанную на машинном обучении и data mining.
  • Формирование типовых решений в области Больших данных. Уже появляются «стандартные» решения для различных индустрий – например, в области клиентской аналитики на основе анализа данных социальных сетей.
  • Слияние технологий Больших данных и бизнес-анализа. Новые технологии Больших данных существенно обогащают классические системы бизнес-анализа. Использование Hadoop повышает производительность имасштабируемость хранилищ данных, а внедрение в BI-систему средств углубленной аналитики, включая предиктивный анализ и статистические методы, существенно расширяет ее функциональность.
  • Среди других трендов – повышение роли облачных сервисов и услуг по Большим данным, формирование рынка покупки и продажи данных, расширение сферы практического применения методов и технологий анализа изображений и видео.

2. Во-первых, заинтересованность бизнеса – очень важно сохранять такую мотивацию в течение всего проекта. Во-вторых, четкое понимание целей, правильная постановка задачи, выбор методов и технологий уже на старте проекта. В-третьих, профессиональная и правильно подобранная команда, в которой обязательно должны быть специалисты по работе с данными, владеющие разнообразными методами их анализа.

3. Мы сами являемся разработчиками и поставщиками решений в области Больших данных для разных индустрий. С 2012 года это направление стало отдельным подразделением, где работают сертифицированные специалисты потехнологиям Hadoop, эксперты по машинному обучению, data mining, лингвистической обработке и статистическим исследованиям. Кроме проектов по разработке и внедрению систем на основе Больших данных, «ФОРС» предлагает готовое решение для получения новых знаний о клиентах на основе анализа данных социальных сетей – ForSMedia. Специалисты компании занимаются и образовательной деятельностью в области Больших данных – проводят семинары для заказчиков и партнеров, читают курсы в учебном центре «ФОРС», лекции в Высшей школе экономики и других учебных заведениях.

4. В одном из крупнейших банков были внедрены технологии Hadoop с целью обеспечить возможность использования больших объемов неструктурированной информации для решения различных задач по управлению рисками икредитному скорингу. В ходе этого проекта было создано централизованное хранилище данных с гибкой настройкой на изменение форматов исходной информации и поддержкой ad-hoq доступа ко всем историческим данным. Важная особенность проекта – использование программно-аппаратного комплекса Oracle Big Data Apppance.

Создание системы оценки стоимости объектов недвижимости для компании РОСЭКО по заказу Российского общества оценщиков. Система обеспечивает сбор данных об объектах из интернет-источников, обработку этой информациис использованием лингвистических технологий, обогащение данных с помощью геоаналитики и применение методов машинного обучения для оценки стоимости. В качестве основных технологий использовались Cloudera Hadoop Distribution, средства лингвистического анализа компании RCO, среда статистических исследований R и платформа исследования данных Oracle Endeca.

5. С точки зрения поставщиков услуг и продуктов на этом рынке наблюдается безусловное преобладание западных компаний в сегменте инфраструктурных решений, но среди поставщиков отдельных аналитических технологий есть ироссийские. К примеру, в последнем отчете Gartner из всех производителей средств data mining в мире было выбрано всего 16 компаний, и среди них есть российская – «Прогноз». А вот Oracle Data Mining в этом году не вошла в этот список.

Внедрение новых технологий в России происходит действительно медленнее, ощущается острая нехватка инвестиций. Это связано с особенностями российского бизнеса, недостаточной востребованностью аналитических решений вцелом, нереализованностью потенциала классического BI. Кроме того, не все готовы к повышенным рискам в проектах по внедрению Больших данных и к трудностям оценки экономической эффективности таких проектов.

Изменить ситуацию смогут перемены на бизнес-уровне – повышение грамотности руководителей в области аналитики, снижение уровня ручного управления, сближение аналитики с принятием управленческих решений и увеличение числа успешных проектов.

 

Алексей Смирнов

«Сейчас мы сконцентрированы на разработке аналитических решений, которые могут быть применены сразу в нескольких направлениях, с которыми мы работаем»

Алексей Смирнов, технический директор ИТ-компании «Нетрика»

1. В сфере Больших данных выделяется тренд «Интернет вещей» (Internet of Things, IoT) как более узкая область применения «Интернета всего». Большую популярность завоевали свободные инструменты работы с данными: такие решения, как Apache Hadoop и Apache Spark, стали практически стандартом даже в больших корпорациях. В хранении данных происходит не только переход в облачные системы хранения, но также и перевод инфраструктуры нанереляционные (NoSQL) базы данных, там, где этого требует бизнес. Если в предыдущие годы считалось, что «чем больше данных, тем лучше», и все пытались ответить на вопрос «Как же это все хранить?», то сейчас наблюдается тенденция к развитию интеграционной инфраструктуры разработанных ранее решений, а также делается акцент на разработке более быстродейственных алгоритмов обработки накопленных данных.

2. Прежде всего вы должны четко понимать, с какими данными вам предстоит работать, нужны ли они вам вообще, и если нужны, то что с ними делать и для каких целей использовать. В компании должны быть специалисты по анализу данных и специалисты по управлению большими объемами данных. Большие данные не прощают ошибок. Небольшое колебание вектора разработки нового программного решения может обернуться большими трудозатратами иплатой за чрезмерно разросшуюся инфраструктуру. Поэтому управление задачами в таких проектах должно быть на высшем уровне.

3. В своих проектах – разработке государственных информационных систем – мы регулярно сталкиваемся с обработкой больших объемов данных. При этом для нас важно не столько само количество данных, сколько качество поставляемых аналитических решений. Поэтому ключевая задача в проектах – это качественная алгоритмизация наших разработок. Сейчас мы сконцентрированы на разработке аналитических решений, которые могут быть применены сразу в нескольких направлениях, с которыми мы работаем, – например, в здравоохранении, образовании или госуправлении.

4. Среди проектов «Нетрики» с использованием аналитики Больших данных, которые уже показали свою эффективную работу, можно назвать федеральный сегмент информационной системы «Контингент», реализованный по заказу Минкомсвязи РФ. Это первый в России опыт сбора и всестороннего анализа данных об образовании российских детей по всем регионам страны. Проект несет важную социальную составляющую. С помощью создаваемой системы федеральные органы власти рассчитывают значительно повысить качество образования в РФ и решить такие проблемы, как, например, очереди в детские сады и школы.

Второй интересный проект – это система «N3.Индекс пациентов», решение по идентификации пациентов лечебных учреждений. Система анализирует поступающие из разных медицинских организаций данные пациентов и может свысокой степенью точности отнести те или иные записи к правильному пациенту, даже в случае ошибочной записи. В результате обеспечивается корректная идентификация пациента и формируется интегрированная электронная медицинская карта, в которой хранится информация обо всех обращениях пациента за медицинской помощью в разные учреждения города. Система адаптирована к процессам российского здравоохранения и способна заменить зарубежные аналоги. Использование сервиса не ограничено жестко отраслью здравоохранения, он может применяться везде, где нужно идентифицировать человека.

5. Не все сферы бизнеса в России отстают в своем технологическом развитии от мирового рынка. К примеру, банковские системы с точки зрения оснащенности передовыми технологиями сейчас мало в чем уступают, а зачастую даже превосходят западных игроков. Ретейл также старается активно внедрять эффективные решения, особенно на фоне кризиса. Спрос на экспертов по большим данным есть, однако в целом российский рынок еще недостаточно развит, нопотенциал его огромен, и в ближайшие годы темпы его развития будут в разы выше, чем на глобальном рынке.

 

Константин Суслов

«Надо с умом использовать новые технологии обработки данных, не рассматривая их как «волшебную пилюлю»

Константин Суслов, генеральный директор ГК ХОСТ

1. Big Data – модный, но непонятный широкой публике термин. С него только-только слетает налипшая рекламная шелуха, под которой появляется конкретная польза. Ее будущее зависит от ее применения в реальной жизни и адекватной оценки результатов внедрений.

2. Для успеха нужны два компонента: инженеры-аналитики по этой технологии и менеджеры-профессионалы, которые знают, как и зачем будут использовать результаты. Пока все упирается в степень зрелости управления российских компаний – менеджеры не готовы использовать эту технологию.

3. У нас проектный бизнес, он не накапливает достаточного объема данных для использования Big Data, в отличие от однотипных операций в ретейле, телекоме или банках. Однако мы следим за развитием технологии и периодически анализируем целесообразность ее включения в наш продуктовый портфель. Пока мы не видим на рынке достаточного спроса, чтобы инвестировать в развитие этого направления.

4. Недавно вышел фильм «Игра на понижение», в котором описываются события ипотечного и финансового кризиса в США 2007-2008 годов. Финансисты, которые принимали решения на основании общей статистики о рынке, неуглубляясь в суть происходящих процессов, стали основными жертвами кризиса.

Опасность Больших данных в том, что их завеса, снабженная неоспоримыми математическими выкладками, мешает увидеть зарождающихся «черных лебедей» и несет риски бизнесу. Надо с умом использовать новые технологии обработки данных, не рассматривая их как «волшебную пилюлю».

5. Основная проблема – незрелость технологий управления бизнесом. Российские менеджеры зачастую не готовы использовать сложные инструменты и не понимают, как автоматизация бизнес-процессов и управление по целям поможет им повысить эффективность.

Специализация нашей компании – информационные системы управления эффективностью бизнеса – быстро развивающаяся в мире технология управления. Но когда мы приходим к клиенту, то сначала вынуждены рассказывать методологию и только потом переходить к тому, нужны ли такие системы в их бизнесе. Исправит положение только популяризация и профессиональное обсуждение новых технологий работы с данными.

 

Артем Засурский

«Собранные воедино Большие данные не стали панацеей при решении бизнес-проблем. Закономерно, что Gartner в августе 2015 года убрала Big Data из числа прорывных технологий»

Артем Засурский, генеральный директор ООО «Стрим»

1. Big Data сегодня переживает определенный кризис. Предложения вендоров и консультантов «Big Data решит проблемы вашего бизнеса», как показала практика, остаются красивыми слайдами в презентациях. Собранные воедино Большие данные не стали панацеей при решении бизнес-проблем. Закономерно, что Gartner, ведущая мировая компания в области исследований информационных технологий, в августе 2015 года убрала Big Data из числа прорывных технологий и удалила ее с графика Hype Cycle.

2. Для успеха проекта нужна четко поставленная задача – какие цели и каким образом будет преследовать применение Big Data. Надо отдавать отчет в том, что Big Data – это инструмент, и следует умело его использовать.

Необходимо освоить анализ Больших данных, чтобы научиться отделять массивы бесполезных данных от полезных. Нужно появление аналитиков, которые будут «читать» Big Data и ориентироваться в ней, руководствуясь математическими моделями. Время интуитивного подхода – в прошлом.

3. Big Data – большое подспорье в развитии мобильной рекламы, которой активно занимается наша компания. Big Data позволяет сделать рекламу глубоко таргетированной, специализированной именно для тех, кто может быть заинтересован именно в данном виде товара или услуги.

Таргетированность рекламы основывается именно на анализе массива Больших данных и переводит рекламу из разряда назойливой коммуникации в полезную информацию.

Мобильная реклама, которой мы в компании занимаемся, – очевидный пример эффективного использования Больших данных. Big Data помогает нам сделать все наши сервисы и услуги наиболее соответствующими моделям потребления пользователей.

5. Думается, что ситуация с Big Data примерно одинаковая сегодня повсюду. Основные силы, на мой взгляд, должны быть сосредоточены на разработке методов и принципов анализа Больших данных и соблюдении всех юридических аспектов их использования.

Мода на «дата ученых», которая появились недавно в индустрии, также быстро сходит на нет. Но сами «дата ученые», хочется верить, сумеют оправдать эти звания и предложат решение по чтению и использованию Big Data. Может быть, эти ученые пока еще учатся в вузе или даже школе.

 

Дмитрий Шепелявый

«Эффективность деятельности предприятия определяется вполне измеримыми группами показателей, и проект по Big Data должен являться частью корпоративной стратегии»

Дмитрий Шепелявый, заместитель генерального директора SAP СНГ

1. Объем рынка технологий в сфере Больших данных ежегодно увеличивается как в России, так и в мире. Мы видим, что за последние два года интерес к системам в области Big Data значительно возрос. Подобные решения сегодня вбольшинстве своем востребованы в ретейле, телекоме, транспорте и финансовом секторе. В то же время увеличилось количество запросов и со стороны нефтегазовой, металлургической, химической и дискретной индустрий, а также стартапов.

Вместе с интересом возросли и требования. Клиентам уже недостаточно решений Big Data, которые способны лишь хранить и быстро обрабатывать данные объемом более 1 Pb. Поэтому современные инструменты работы с Большими данными также позволяют строить прогнозы и оснащены удобным интерфейсом. Появились запросы на интеграцию промышленных систем с открытой технологией Hadoop, стремительно набирающей популярность среди клиентов.

Для того чтобы удовлетворить большие требования на хранение и обработку информации клиентов, в прошлом году мы представили наше новое решение – SAP HANA Vora для анализа Больших данных, расширяющее возможности Apache Hadoop и увеличивающее скорость обработки от 10 до 100 раз за счет использования технологии Apache Spark.

2. Большие данные как любая инфраструктурная технология оказывают влияние на всю цепочку создания стоимости через новые и усовершенствованные бизнес-процессы, снижение издержек и повышение прибыльности, формирование конкурентных преимуществ и окупаемость инвестиций. Однако в конечном итоге эффективность деятельности предприятия определяется вполне измеримыми группами показателей, такими как ликвидность, оборачиваемость, рентабельность, финансовая устойчивость, т.е. проект по Big Data должен являться частью корпоративной стратегии компании.

Если новая или усовершенствованная производственная функция, реализованная с помощью Big Data, в конечном итоге позволила улучшить эти показатели, то можно сказать, что это и есть экономический эффект. К примеру, если технология помогает ускорить формирование отчета о материально-производственных запасах с 3 часов до 16 секунд, то это, в свою очередь, позволяет получить максимальную отдачу от оборотных средств, т.е. повысить рентабельность собственного капитала.

3. Активно применяем, практически на всех стадиях работы – от разработки решения до поддержки уже реализованных проектов.

4. Можно привести пример Wikimart, одного из лидеров российского рынка электронной коммерции. В продуктивную эксплуатацию был запущен комплекс решений на платформе SAP, для того чтобы перевести бизнес-процессы Wikimart на новый уровень автоматизации и помочь развитию торговой онлайн-площадки и выходу в сегмент офлайн-торговли. Перевод бизнес-процессов в единое информационное пространство на базе решений SAP позволит Wikimart предоставлять покупателям товары не только из собственного ассортимента, но и от партнеров: более 2 млн товаров будет доступно во всей сети, включающей 41 собственный и 1439 партнерских пунктов выдачи заказов. Ранее такая возможность была только для 100 тыс. товаров из собственного ассортимента Wikimart.

 

Алексей Алексеев

«Рынок Больших данных в России будет развиваться быстрее общемирового. По прогнозу EMC, доля российского сегмента вырастет с 1,8 до 2,2% от мирового объема данных к 2020 году»

Алексей Алексеев, руководитель отдела разработки интегрального профиля компании Digital Society Laboratory

1. Первый тренд – это развитие аналитики и машинного обучения. Сейчас технологии сбора и хранения Больших данных достигли зрелости, но извлечение ценности из данных по-прежнему остается сложной задачей.

Второй тренд – интернет вещей. Эксперты Cisco и Ericsson прогнозируют, что к 2020 году будет 50 млрд подключенных единиц, из которых устройства интернета вещей составят больше половины, что существенно повлияет на рынок Больших данных.

Поскольку объем генерируемых данных удваивается каждые два года, в перспективе спрос на Большие данные будет только расти.

2. Во-первых, бизнес должен уметь правильно ставить цели и просчитывать эффект от использования Больших данных. Во-вторых, желательно использовать облачные технологии. Они дают гибкость и уменьшают капитальные затраты. В-третьих, необходимо правильно подобрать инструменты обработки Больших данных среди огромного количества.

3. Наша компания специализируется на рекламе и исследовании социальных сетей, поэтому технологии обработки Больших данных – это одна из основных наших компетенцией. Социальный портрет целевой аудитории брендов, анализ конкурентной среды, динамика потребительских предпочтений и многие другие направления исследований Digital Society Laboratory (DSL) невозможно представить без технологий сбора и обработки Больших данных.

4. Поскольку наша компания изначально ориентирована на работу с Большими данными, приведу пример по работе с одним из наших клиентов – «Велес Девелопмент» и его проектами «Лес и Река» и «Марк Твен». Для них мы вели рекламную кампанию в соцсетях и превзошли результаты по контекстной рекламе в поисковых системах «Яндекс» и Google.

Мы выделили три сегмента и провели на них рекламную кампанию: владельцы бизнеса, предприниматели, руководители и топ-менеджеры, люди, интересующиеся покупкой загородной недвижимости, финансово обеспеченные люди.По итогам рекламной кампании стоимость целевого действия (звонки, заявки на просмотр, обращения в чат и т.п.) снизилась в два раза по сравнению с другими каналами из-за точного таргетирования и за счет большого количества данных о пользователях. Например, с 2900 руб. при размещении контекстной рекламы до 1360 руб., когда использовали профилированную рекламу.

5. Этому есть несколько причин:

  • новые технологии запаздывают на развивающихся рынках по сравнению с развитыми;
  • российские компании мало доверяют облачным технологиям, что удорожает проекты и уменьшает гибкость;
  • развитие рынка тормозят законы по сбору и обработке персональных данных.

В будущем рынок Больших данных в России будет развиваться быстрее общемирового. По прогнозу EMC, доля российского сегмента больших данных вырастет с 1,8 до 2,2% от мирового объема данных к 2020 году.

 

Вячеслав Коган

«Ретейл – это насыщенный игроками рынок, и любые трудновоспроизводимые конкурентами технологии, позволяющие повысить конверсию, а значит, и прибыль, будут востребованы»

Вячеслав Коган, директор по развитию бизнеса направлений E-Commerce, Loyalty & Mobipty ГК «КОРУС Консалтинг»

1. Классической характеристикой Больших данных являются три V: Volume (объем данных), Velocity (скорость их накопления), Variety (многообразие – данные могут быть структурированными и неструктурированными). Всем этим характеристикам отвечают несколько отраслей, среди которых – телеком, розничная торговля, финансовая (банковская) и страховая отрасли. Большое количество стартапов по части Больших данных, появляющихся для этих отраслей, тому подтверждение. Перспективы развития таких технологий очень велики: к примеру, ретейл – это очень насыщенный игроками рынок, и любые трудновоспроизводимые конкурентами технологии, позволяющие повысить конверсию, а значит, и прибыль, будут сильно востребованы.

Для телекома интересны решения в области fraud detection (выявления мошенничества), для розницы – next best offer (лучшее следующее предложение), для банков – опять же в области fraud detection и онлайн-расчета кредитного скоринга. Продолжающие набирать бизнес-популярность SMM с помощью технологий Больших данных можно будет использовать, например, по части выявления лидеров мнений. Все вышеперечисленные бизнес-процессы подразумевают обработку данных гигантских объемов, имеющих разный характер, неструктурируемых и накапливающихся с очень большой скоростью – это и есть основная задача, решаемая посредством технологий Big Data.

На данный момент особенно большое количество решений в этой области разрабатывается для сферы ретейла – например, инструменты сегментации и персонализации на основе совокупной базы данных клиентов и истории покупок, причем некоторые технологии позволяют обрабатывать данные даже на кассах. Примеры подобных специализированных решений – RichRelevance , Prudsys, G-Stat. Кроме того, существуют и российские аналогичные системы, например, Rees46, RetailRocket, Yandex Data Factory.

 

Валерий Щукин

«Будет появляться все больше некрупных, в том числе «любительских» проектов и стартапов, основанных на анализе Больших данных»

Валерий Щукин, генеральный директор компании TEGRUS

1. Если говорить о технологиях, то можно отметить, что полуструктурированные данные в формате NoSQL в ближайшее время окончательно займут свое место в ИТ-ландшафтах, основной реализацией MapReduce станет Apache Spark, а Hadoop окажется скорее всего «музейным экспонатом» (из-за серьезного проигрыша в производительности по сравнению со Spark).

Что касается рыночных ниш, то популярность Big Data продолжит расти в крупном корпоративном сегменте, при этом будет появляться все больше некрупных, в том числе «любительских» проектов и стартапов, основанных на анализе Больших данных.

Это повлечет за собой резкое расширение круга профильных ИТ-специалистов. Кроме того, специалистам в области веб-разработки и администраторам реляционных баз данных придется тратить все большую часть своего рабочего времени на поддержание разного рода проектов, связанных с Big Data.

2. Проблема в том, что значимость технологии Big Data могут в каких-то случаях переоценивать – в силу новизны и отсутствия опыта реализации такого рода проектов.

5. Ответ заключается в термине – «Большие данные». В России по сравнению с глобальным рынком существенно меньше предприятий с объемом данных, оправдывающим применение технологий Больших данных.

 

Владимир Княжицкий

«Наличие огромных объемов информации позволяет создавать искусственному разуму схемы зависимостей, которые недоступны для человека»

Владимир Княжицкий, генеральный директор ГК «Фаст Лейн» в России и СНГ

1. Основной тренд – использование искусственного интеллекта в связке с Большими данными. Наличие огромных объемов информации позволяет создавать искусственному разуму схемы зависимостей, которые недоступны длячеловека. Это может получить широкое применение в различных отраслях – медицине, торговле, рекламе и т.д.

2. Не могу сказать, что проект в области Big Data чем-то отличается от любых других проектов. Главное – четкое понимание того, что мы хотим получить в результате.

3. Мы не применяем, но я прибегаю к услугам компаний в области интернет-рекламы, которые используют эти технологии для изучения аналитики поведения пользователей.

4. За рубежом большой успех получила обработка данных о клиентах в ретейле – в розничных, продуктовых сетевых магазинах. Обработка в реальном времени корреляции величины среднего чека, времени суток, типа рекламы в зале, аудиорекламы, освещения, времени нахождения покупателя в той или иной зоне магазина позволяет значительно увеличить выручку и число покупок высокомаржинальных товаров. Я, кстати, в свое время реализовывал проект аналитики поведения покупателей в связке с аудиорекламой.

5. Наш рынок развивается с нормальной скоростью для стран с таким проникновением технологий, как Россия. То есть развивается он по законам рынка. Чтобы что-то изменить, нужно вообще менять условия игры на ИТ-рынке. Внашем случае закономерен вопрос: почему тяжелые ИТ вообще развиваются в России медленнее, чем в развитых странах? Ответ будет таков: их сдерживает много факторов – и система подготовки кадров, и особенности привлечения длинных инвестиций (особенно из-за рубежа), и даже вопрос престижности того или иного вида деятельности.

Уверенно можно сказать, что информационные технологии в России находятся далеко не в худшем состоянии, возможности для их развития есть и их нужно использовать и поддерживать.

 

Георгий Шатиров

«Для того чтобы активно применять технологии Больших данных, основной бизнес компании должен основываться на обработке этих самых данных»

Георгий Шатиров, начальник отдела продуктизации аналитических решений компании «Техносерв»

1. Инструменты для in-memory-вычислений сегодня развиваются быстрее остальных, так как стала более доступной оперативная память в серверах, которая используется для расчетов. Как один из примеров, Spark – экосистема продуктов in-memory-решений с быстро растущим количеством библиотек, в том числе и для машинного обучения. Также уверенно развивается технология Hive на базе движка Tez, недавно получив наиболее стабильный результат тестов в сравнении с остальными решениями Больших данных.

2. Сегодня это эксперты, глубоко понимающие свою область и активно интересующиеся технологиями. Человеку должно нравиться то, чем он занимается. Только тогда результаты анализа и внедрения можно назвать успешными.

3. Конечно. Несмотря на то что мы разрабатываем продукты и решения в сфере интеллектуальной аналитики для своих клиентов, мы внутри компании активно пробуем и применяем различные технологии Больших данных. Например, используем собственную аналитическую платформу для анализа графов. Очень часто в результате таких активностей рождаются идеи для новых продуктов.

5. Для того чтобы активно применять технологии Больших данных, основной бизнес компании должен основываться на обработке этих самых данных. Это такие компании, как, например, Facebook, Twitter, «Яндекс», Mail.Ru и другие. Сегодня в России рынок таких компаний только развивается. На мой взгляд, необходимо на экономическом уровне стимулировать развитие ИТ-бизнеса в России.

 

Дмитрий Куликов

«Вдумчивый подход к проектированию позволяет компании с обширной географией иметь компактную ИТ-инфра-структуру, управляемую из одной точки и рассчитанную на дальнейший рост»

Дмитрий Куликов, руководитель отдела инфраструктурных решений «Тринити»

4. Любой бизнес планирует свои затраты, прибыль, а также рост объема данных. В большинстве случаев можно прогнозировать этот рост и понимать масштабы расширения ИТ-инфраструктуры. В случае возникновения нештатных ситуаций (например, ухода основного конкурента или скачкообразного роста товарной категории) бывает достаточно усилить имеющиеся системы хранения данных (СХД). В практике «Тринити» было много проектов модернизации СХД в связи с территориальной экспансией – для ретейлеров удобнее собирать финансовую информацию и работать с бухгалтерскими документами централизованно.

Например, в торговой компании «Улыбка Радуги» существующая ИТ-сеть перестала отвечать потребностям в аналитике. Бухгалтерии была необходима единая база данных с корректным расчетом себестоимости товара.

В ретейле большое значение имеет быстрое управление ценообразованием товаров, которые исчисляются тысячами наименований, с учетом программ лояльности: скидок, акций и т.п., а также бизнес-аналитика. Поэтому было решено приобрести систему SAP, а перед ее внедрением – развернуть SAP-совместимую и масштабируемую ИТ-инфраструктуру. Для обеспечения высокой скорости работы и катастрофоустойчивости специалисты «Тринити» предложили совместить горизонтально и вертикально масштабируемые системы на базе Blade серверов Power 6, Power 7, кластерного ПО и серверов IBM. Готовая система решает задачи управления документооборотом и резервным копированием, управленческого и бухгалтерского учета, обеспечения непрерывности бизнеса.

При вдумчивом подходе к проектированию даже компания с обширной географией может позволить себе компактную ИТ-инфраструктуру, управляемую из одной точки и рассчитанную на дальнейший рост. Например, такую инфраструктуру мы создали для национальной торговой сети «Центр». Компания «Тринити Урал» выполнила поставку и пусконаладку комплексной системы IBM FLEX SYSTEM и двух систем хранения данных IBM STORWIZE V7000 для основных сервисов, средств бизнес-анализа и учетных систем, включая онлайн-учет складских запасов в торговых точках по всей России.

 

Андрей Черногоров

«Большие данные – это постоянная динамика, информационные сигналы, анализируемые в режиме реального времени и еще не оформленные в виде прогноза или тенденции»

Андрей Черногоров, генеральный директор компании Cognitive Technologies

1. Продуктовая кастомизация, зародившаяся как мощный международный тренд на потребительском рынке в начале нулевых годов, переживает второе рождение в эпоху Больших данных. Следует понимать, что современным корпоративным ИТ-решениям, в том числе CRM- и ERP-системам, с каждым годом придется иметь дело со все большим количеством параметров и метрик, на которых базируется их data mining, направленный на формирование, поддержание и развитие клиентской лояльности. При глубинном анализе становится видно, что задача импортозамещения в ИТ-сфере представлена гораздо шире, чем простая необходимость постепенной замены в отечественных госструктурах того или иного западного ПО.

Отчасти вынужденная, но давно назревшая диверсификация экономики; федеральная целевая программа «Электронная Россия», давшая мощный толчок капитализации крупнейшим системным интеграторам России и к 2010 году сформировавшая базовый контур технологий «электронного правительства». Все эти и многие другие явления, как нам кажется, выводят страну на мощный маневр с амбициозной задачей: в масштабах целого государства постепенно перейти от транзакционного маркетинга к маркетингу отношений.

Ключевым вопросом в новой системе ценностей становится фактор клиентского сервиса и технологий управления лояльностью конечных потребителей. На практике это означает, что ключевое значение в современной коммуникациис клиентами имеет индивидуальная подстройка под специфические личные запросы конкретного человека.

2. Правильно составленная маршрутная карта для работы с проектами в области Big Data – половина успеха. Вы должны четко понимать, что анализируете конкретные действия, итерации, транзакции. В то же время нужно правильно подходить к планированию конечных целей таких проектов и осознавать всю специфику Больших данных. Ни в коем случае не следует жестко ограничивать конечную точку ваших проектов в области Big Data.

Нельзя забывать о том, что если структурированные данные всегда изучаются заранее спроектированными формулами, то неструктурированные – большие – данные исследуются более общими алгоритмами, которые пытаются найтив них закономерности, о которых еще ничего не известно. До момента нахождения тренда или неожиданной новой корреляции данных невозможно предсказать, о чем будет этот тренд. Вся работа с данными происходит автоматизировано и в режиме реального времени.

Большие данные направлены на бу-дущий анализ и предсказания. «Обычные» же данные так или иначе ретроспективны, они уже получены, добыты, и их можно изучать, прекрасно понимая, что к концу исследования этот массив данных останется в том же виде, в каком изначально попал на изучение. Большие данные – это постоянная динамика, информационные сигналы, анализируемые в режиме реального времени и еще не оформленные в виде прогноза илитенденции.

3. Мы не применяем, но я прибегаю к услугам компаний в области интернет-рекламы, которые используют эти технологии для изучения аналитики поведения пользователей.

4. Нашей компании часто приходится работать с Большими данными. Например, недавно у нас был крупный федеральный проект, нужно было выстроить закупочную систему для целого мегаполиса, чтобы абсолютно все позиции нагосударственных торгах, от метлы для дворника до сталелитейной формы, автоматически обрабатывались, а данные, «добываемые» в результате этих итераций, сразу анализировались для моделирования прогнозов и гипотез.

Для многостороннего анализа Больших данных мы используем систему OLAP (onpne analytical processing). Она позволяет рассматривать различные срезы данных, в том числе временные, выявлять различные тренды и зависимости (по регионам, продуктам, клиентам, отраслям, типам компаний и т.п.). В систему анализа и обработки Больших данных нам удалось внедрить модуль интеллектуального анализа (data mining). Он основан на сканировании истатистической обработке больших массивов данных и позволяет облегчить принятие верных стратегических решений, проанализировав весь комплекс вариантов развития событий. Таким образом, мы шаг за шагом стараемся приблизить роботизированные алгоритмы data mining к уровню логики и мышления живого бизнес-аналитика: ведь при работе с данными он вынужден учитывать не только все возможные сценарии и прогнозы развития событий, но иконъюнктуру рынка, а также все неожиданные обстоятельства, которые эта конъюнктура порождает. Например, при анализе данных в банковском секторе России такие прогнозы должны сегодня включать в себя и анализ вероятности отзыва лицензий, скорость принятия отраслевых законопроектов, находящихся на стадии согласования, и т.д.

5. Наглядный пример эффективности Больших данных демонстрирует ретейл. Одним из первых офлайн-магазинов, внедривших анализ Больших данных, стал сетевой супермаркет «Лента». С помощью Big Data ретейлер стал изучать информацию о покупателях из кассовых чеков. Ретейлер собирает информацию для составления поведенческих моделей, что дает возможность более обоснованно принимать решения на уровне операционной и коммерческой деятельности. Данные из чеков позволяют составлять глобальные выкладки по социально-экономической ситуации в городе, регионе и целой стране. Например, как кризисные явления в экономике отражаются на покупательских привычках посетителей магазинов.

Данные из чеков позволяют выявить и отдельные товарные категории и товары, имеющие в отдельный промежуток времени краткосрочный потенциал к повышению продаж. Например, массив информации из собранных чеков показывает, что после валютного скачка привычный импортный сыр покупатели стали заменять на более дешевый аналог. Сам аналог, который, по мнению покупателей, по вкусовым свойствам соответствует ставшему дорогим исходному продукту, также выявляется на основе анализа массива информации. Далее на уровне мерчендайзинга на местах альтернативная позиция дополнительно «подсвечивается» промоактивностью, изменяется упаковка и т.д.

 

Андрей Свирщевский

«Все идет к тому, что большинство идей по Big Data перестанут называть Big Data»

Андрей Свирщевский, руководитель направления углубленной аналитики, SAS Россия/СНГ

1. Изначально Big Data была частично отделена от конкретных текущих бизнес-процессов организаций, а сейчас происходит ее постепенная интеграция. При этом кто-то отказался делать отдельную лабораторию Big Data, кто-то сделал.Но в целом организации решили идти от конкретных кейсов, повышающих эффективность конкретных текущих бизнес-процессов, пошагово проверяя, что работает, а что нет.

Термин «Big Data» стали применять гораздо шире, и появилась прослойка специалистов, которые вообще предпочитают его не употреблять, потому как, что под ним подразумевается, уже не совсем понятно. Канва термина стала подразумевать для большинства использование новых источников данных, в первую очередь внешних. Про поиск новых инновационных алгоритмов для решения задач, про то, что все это должно работать на современных распределенных архитектурах, кто-то помнит, кто-то нет. Для многих это понятие стало гораздо шире и подразумевает любые инновации в обработке данных в организации.

По факту, когда стартуют некоторые проекты с ярлыком Big Data, создается путаница – вы занимаетесь Большими данными или вы просто развиваетесь и выполняете свою работу? Ведь данные, причем довольно большие, анализировались всегда – компания SAS занимается этим уже 40 лет – инновации и распределенные вычисления тоже появились давно. Тенденция использовать больший объем данных и разноформатные данные также не нова. Значение Big Data настолько размыто, что не всегда понятно, что же имеет в виду ваш собеседник в данный момент. Именно поэтому многие специалисты сегодня перестают использовать этот термин, чтобы точнее объяснять друг другу суть задачи.

Выделенные подразделения Big Data найдут себе узкую нишу – собирать и проверять на эффективность новые источники данных. Безусловно, будут организации с выделенными лабораториями Big Data, занимающимися инновациями, но это будет работать только в случае хорошо выстроенных, правильных и понятных коммуникаций с бизнес-подразделениями и ИТ. Все идет к тому, что большинство идей по Big Data перестанут называть Big Data.

2. Для успеха проекта в области Больших данных зачастую необходимо перестать называть это Big Data, размывая значение, и обратиться к сути той бизнес-области, которую мы развиваем.

Второе, если мы все-таки делаем Big Data-лабораторию, то должны быть проработаны и структурированы процессы взаимодействия, это подразделение должно быть частью общей структуры, а не существовать отдельно. Для этого,на мой взгляд, нужны процессная интеграция и понимание всех звеньев в цепочке – кто за что отвечает, где зоны соприкосновения, как результаты работы подразделения Big Data встраиваются в общий бизнес-процесс.

Также очень желательно использовать ту же аналитическую платформу, что и остальная организация, пусть и с доступом к Оpen Source инновационным алгоритмам. Хорошо создать специальную среду, в которой, используя пусть иразные интерфейсы, работают вместе Data Scientists и бизнес-подразделения. Специалистам по Большим данным крайне важно говорить с другими подразделениями компании на одном языке.

Стоит понимать, что какую бы эффективную инновацию для маркетинга или управления рисками они ни создали, бизнес не возьмет «черный ящик» на непонятном языке программирования и не начнет его интегрировать в свои процессы. Результаты работы должны быть понятны и прозрачны для всех участников бизнес-процесса.

5. На самом деле Россия не во всем отстает. Если говорить о Big Data как о дополнительном использовании внешних источников данных, то в России этот рынок развивается быстрее, потому что мы не так сильно переживаем по поводу защиты частной информации по сравнению с развитыми странами. Пока наши западные коллеги осторожничают, мы уже перепробовали много разных подходов, у нас уже множество пилотов, прототипов и работающих систем.

Другое дело, что для иностранных коллег Big Data – это скорее инновационные вычисления, возможность повысить точность аналитических моделей, а не внешние источники данных. Они понимают важность принятия решений наосновании углубленного анализа данных, поэтому стремятся с помощью Big Data поднять архитектуру своей аналитической платформы на принципиально новый высокопроизводительный уровень. Это позволяет им строить больше моделей и делать их более точными и сложными.

У нас же далеко не всем понятно, зачем нужны такие сложности, некоторым до сих пор не очевидно, зачем вообще нужна бизнес-аналитика и как с ее помощью принимать решения. Нашим специалистам казалось, что легче проанализировать соцсети и изучить склонности, интересы, подноготную интересующего клиента. Однако эти ожидания не полностью оправдались. Потому что для эффективного анализа все равно нужны специальные технологии –контекстно-семантический анализ, text mining, теория графов. А это требует новых знаний, плюс все равно мы придем к необходимости изменения архитектуры.

Чтобы ситуация поменялась, должно вырасти новое поколение менеджеров, понимающее, что есть целый пласт решений, которые нельзя принимать без учета результатов анализа исторических данных.

 

Татьяна Зобнина

«Самое важное – команда единомышленников, специализирующихся в разных областях знаний»

Татьяна Зобнина, эксперт отдела бизнес-аналитики компании «СКБ Контур»

1. Один из интересных трендов – развитие локальных систем хранения и обработки Больших данных (продукты проекта Hewlett Packard Enterprise). Эти системы наиболее актуальны с точки зрения безопасности хранения и передачи данных. Расширение возможностей локального хранения Больших данных – это ключевой момент эффективного внедрения технологий Big Data и machine learning в финансовый и государственный сектор экономики.

В области анализа Больших данных активно идет процесс «селекции» моделей и разработки новых эффективных алгоритмов. Примером может служить платформа H2O, где реализованы распределенные вычисления для таких алгоритмов, как Random Forest, Deep Learning Neural Network, gradient boosted trees.

2. Самое важное – команда единомышленников, специализирующихся в разных областях знаний. В нее должны входить программисты, статистики и специалисты области знаний, для которой реализуется проект, понимающие бизнес-ценность информации и направляющие развитие проекта.

3. Основные примеры успешного применения технологий Big Data в «СКБ Контур»: сбор и хранение информации интернет-трафика проектов компании для решения задач по их дальнейшему развитию. Применяем эти технологии дляпроектов «Контур. Норматив» и «Контур. Экстерн/НДС+». Учитывая объемы данных, необходимых для хранения информации о контрагентах, без технологии Big Data эти проекты были бы труднореализуемы.

Для решения задач маркетинга важна детальная информация об активности и специфике поведения пользователей. Также технологии Big Data применяются для анализа динамики клиентской базы, прогнозирования оттока клиентов, поиска потенциальных клиентов.

4. Примером может служить решение задачи о «прогнозе» выручки компаний РФ по данным Росстата. Такая задача ставится для оценки емкости рынка. И она может быть сформулирована как задача о заполнении пропущенных значений и решена методом заполнения средними значениями.

Для оценки потенциальных клиентов мы также решаем задачу о прогнозе выручки всех компаний РФ по данным открытых источников методами machine learning. Достаточно хорошие результаты дают алгоритмы Random Forest иgradient boosted trees. Модель для прогноза выручки позволила увеличить объем баз для продаж за счет включения в работу компаний, у которых ранее не было оценки выручки.

Кроме того, для решения задач маркетингового подразделения используются различные виды кластерного анализа. Примерами могут служить кластерный анализ данных с большим количеством неизвестных значений входных параметров для проекта «Контур. Диадок» и кластерный анализ временных рядов для проекта «Контур. Закупки».

5. Отрасли экономики, для которых характерно естественное накопление Больших данных: телеком, ИТ и государственный сектор. Пока в этих отраслях наблюдается некоторое отставание в развитии. Но ситуация может вскоре измениться. Например, в сегменте телеком развития можно достичь путем создания компаний-аутсорсеров, которые специализируются на хранении данных и предоставлении готовых решений для каждой компании отрасли.

 

Александр Стулов

«Проблема использования Big Data в бизнесе – непонимание того, как из количества получить качество»

Александр Стулов, глава представительства Riverbed Technology в России и СНГ

1. В настоящий момент «первичный ажиотаж» вокруг Big Data, обусловленный модой и новизной, уже поутих. В области бизнес-аналитики сейчас превалирует тенденция развития технологий Smart Data. Уже неактуально просто собирать, обрабатывать и хранить большие объемы информации. Важно знать, как структурировать и использовать накопленные данные для получения практической бизнес-выгоды. Проблема использования Big Data в бизнесе –непонимание того, как из количества получить качество.

Подход Smart Data подразумевает сбор и анализ только ценных для бизнеса данных, которые могут помочь компании решить насущные бизнес-задачи и выйти на новый уровень развития бизнеса. По сути, Smart Data обеспечивает определенный баланс между количеством, качеством данных и их практической ценностью для бизнеса.

2. На мой взгляд, важны две составляющие. Во-первых, заинтересованность организации в развитии новых продуктов, услуг, оптимизации бизнес-процессов, реализации целевых маркетинговых кампаний и т.д. Все эти задачи формулируют бизнес-подразделения и определяют те самые полезные данные, которые им требуются для решения этих задач. Например, аналитические прогнозы, отчеты, которые помогут улучшить показатели или сформировать новые предложения для клиентов. Во-вторых, это возможность технологического департамента удовлетворять потребности бизнеса. То есть обеспечивать качество, объем и структурированность данных, а также скорость предоставления этой информации. Для успеха проекта с использованием технологии Big Data необходимо постоянное взаимодействие бизнеса с ИТ.

4. Могу привести такой оригинальный пример. Одна популярная в США сеть игровой индустрии активно собирает и анализирует информацию о своих клиентах для повышения лояльности. Компания внимательно относится как кновым посетителям, так и к постоянным гостям. Многие из постоянных гостей обладают клиентской картой, предлагающей различные бонусы держателям. Однако данная программа лояльности также представляет собой уникальный инструмент сбора информации о клиенте – демографические данные, поведенческие пороги и другие сведения. Например, оперируя данными сведениями, можно управлять моментом «остановки игры», т.е. постоянного гостя спомощью различных акций (подарки, билеты на шоу и т.д.) можно уберечь от проигрыша чересчур большой суммы. Таким образом, с помощью технологий Big Data компания повышает лояльность клиентов и сохраняет их как своих постоянных гостей для повторного использования услуг.

5. Проблема в том, что российский рынок в целом не достиг той насыщенности и конкуренции, которые есть в развитых странах. Зарубежные бизнесмены считают каждую копейку, маржинальность бизнеса стремится к 2-3%, компании стремятся развиваться и стать привлекательнее для клиентов, постоянно совершенствуя свои продукты, услуги, тарифы и т.д. Достигая потолка в экстенсивном развитии бизнеса (численность клиентов, географическое присутствие), компании начинают искать новые варианты оптимизации бизнеса. И применяют инструменты Больших данных для анализа поведения клиентов, поиска решений для увеличения прибыли и т.п.

Российские же компании не всегда готовы вкладываться в инновационные решения, т.к. низкая конкуренция, а порой и просто монополия, во многих областях не способствует проактивной модернизации бизнеса. Хотя есть иисключения, например, сегмент мобильных операторов связи и финансовые организации активно развивают аналитику данных, предлагая клиентам наиболее подходящие услуги и продукты.

 

Леонид Блынский

«Активно инвестируют в эти технологии телекоммуникационные компании и ретейл. Сотовые телефоны способны передавать столько информации о нас, что сложно даже представить»

Леонид Блынский, директор по архитектуре BI, компания AT Consulting

1. Термин «Big Data» сам по себе давно перестал удивлять людей, трансформировавшись во множество детализированных сценариев и алгоритмов: глубокая аналитика данных, сегментация клиентов, онлайн-обработка массивов информации. Самое перспективное направление развития технологий Big Data – более детальное и эффективное изучение поведения клиентов, основанное на данных, полученных из множества источников: транзакций по банковским картам, социальных сетей, интернет-трафика и прочих.

2. В первую очередь для успеха требуется сильная команда, которая, с одной стороны, полностью понимает предметную область (энергетика, телеком, банкинг и пр.), а с другой – имеет сильный бэкграунд в информационных технологиях и математических науках. Для того чтобы проанализировать собираемую информацию, специалист должен уметь строить математические модели, программировать их и оптимально применять используемый технологический стек. Для описания этой профессии появился даже специальный термин – Data scientist. И сейчас на рынке труда за «звездами» идет настоящая охота.

3. Наша компания долгое время ведет несколько больших коммерческих проектов в крупных телеком-операторах и банках. Большие компании – основные потребители технологий Big Data, они понимают ценность данных и готовы инвестировать в обработку информации. В нашей лаборатории установлено несколько кластеров, на которых постоянно изучаются новые продукты, появляющиеся на рынке.

4. Активно инвестируют в эти технологии телекоммуникационные компании и ретейл. Сотовые телефоны способны передавать столько информации о нас, что сложно даже представить. Например, торговые сети используют данные оближайшей к абоненту базовой станции, чтобы отправлять сообщения рекламного характера именно тогда, когда он находится неподалеку от их магазина. Или проанализировать, что в один и тот же день несколько лет подряд абонент получает смс со словами «годовщина» и «свадьба» и с использованием дисконтной карты покупает шампанское и конфеты, а затем направить ему персональное предложение по скидке на эти продукты.

Современные контакт-центры – тоже отличный пример. Можно построить их работу так, чтобы уже в момент звонка система подтягивала всю информацию об абоненте, историю его предыдущих звонков, писем и формулировала наэкране оператора варианты предложений персонально для этого клиента с учетом, например, вероятности его перехода к другому телеком-оператору.

5. Традиционно российский бизнес консервативно относится к инновациям в сфере ИТ и предпочитает сначала убедиться в успешном опыте западных компаний. Поэтому, как только технология зарекомендовала себя за рубежом ипринесла бизнесу деньги, Big Data стала развиваться и у нас. Чем больше успешных внедрений, тем лучше динамика развития. За прошедший год у нашей компании появилось несколько новых проектов, и все, что сейчас требуется, это сделать их успешными.

 

Юлия Ястребова

«Работа для ряда наших клиентов позволяет эффективно продвигать товары и услуги, переводить офлайн-кампании в онлайн, таргетировать предложения для разной аудитории»

Юлия Ястребова, президент группы коммуникационных компаний Russia Direct

1. Только сейчас direct marketing в России стал серьезно задумываться на тему Big Data и работы с ними. Наверняка вы помните, что раньше все, что у нас было, – это совершенно неподъемные базы данных, организованные внеприспособленной для их хранения программе Excel. Но теперь, за счет развития digital-составляющей, становится все труднее достучаться до потребителей. И это определенным образом стимулирует рынок.

Причина также в том, что новое поколение сконцентрировано в онлайн-среде, т.е. ставшие традиционными способы коммуникации попросту не работают. Если выражаться фигурально, то я бы рассматривала данный отрезок временикак подготовку к съемкам большого фантастического фильма. И для того, чтобы понять, кто нам нужен завтра, надо понять, кто живет на планете сегодня. Поэтому создаются, внедряются и оптимизируются разные методы анализа огромного массива структурированных и неструктурированных данных из разных источников. Сегодня под этим понимается просто массив данных, а понятие «большой» (Big) каждый понимает по-своему.

При этом самый главный секрет успеха – это точная формулировка цели. Задайте себе простые вопросы: зачем вы это делаете, какие данные вам нужны, как вы их будете собирать, перерабатывать и фильтровать? В общем-то, все те вопросы, которые вы задаете себе в начале любого проекта!

3. В классике определение «Big Data» звучит как «серия подходов, инструментов и методов». Поэтому да, безусловно, мы применяем ряд инструментов и подходов, в зависимости от задач бизнеса наших клиентов.

4. Мы работаем в области маркетинга (не технологий), но работа для ряда наших клиентов позволяет эффективно продвигать товары и услуги, переводить офлайн-кампании в онлайн, таргетировать предложения для разной аудитории. Хотя, безусловно, есть масса примеров того, как использование цифровых технологий и аналитики действительно улучшает нашу жизнь. Например, ресурс http://pgu.mos.ru. Действительно, стало максимально легко и просто заказать услугу или получить информацию. А те услуги, которые вынесены в приоритет, это и есть работа с Big Data: проанализировали, профильтровали и пришли к выводу, какими услугами чаще всего будут пользоваться рядовые москвичи. Работает!

Если же говорить о проектах, реализованных за рубежом, то, на мой взгляд, это кейс «Добро пожаловать в Эльмхульт» от ИКЕА. Чтобы увеличить продажи с помощью карты IKEA Family, компания создала фильм, предназначенный каждому конкретному человеку. Путешествие по штаб-квартире ИКЕА в Эльмхульте было спланировано настолько увлекательно, насколько это вообще возможно.

Каждый гость «прибывает» онлайн на станцию Эльмхульт, где его «встречает» представитель IKEA – Ларс. Самое увлекательное в этом то, что в рамках фильма работает обратная связь: с помощью технологий распознавания речи иотслеживания движений вы можете управлять онайн-пространством и отвечать на вопросы Ларса.

Например, вы можете налить себе чашечку чая или помочь дизайнерам разработать новую кровать IKEA с непроизносимым названием, спросить, какой бесплатный подарок вы можете получить в магазине или даже испытать продукцию IKEA в секретной лаборатории. Все это похоже на квест – только герои тут все вполне себе реальные! И в итоге: около 60 000 человек получили персонализированные «послания», средняя длительность пребывания в«доме IKEA» составила 6 минут 17 секунд, 24% посетителей пожелали заново вернуться к просмотру фильма.

 

Денис Афанасьев

«Подходы Big Data дают эффект, когда классические методы оптимизации бизнес-процессов организации исчерпали свои возможности»

Денис Афанасьев, генеральный директор CleverDATA (входит в группу ЛАНИТ)

1. Если говорить о степени интереса бизнеса к тем или иным технологиям Big Data, хочу заметить, что организации уже научились собирать, хранить и обеспечивать быстрый доступ к своим внутренним данным и достаточно хорошо освоили соответствующие технологии. Речь идет об организованном хранении истории транзакций, записей звонков колл-центров, откликов клиентов на различные маркетинговые коммуникации и т.д.

Сегодня компании все больше проявляют интерес к инструментам, позволяющим извлекать из накопленных данных полезные для развития бизнеса знания. Я имею в виду платформы управления данными (Data Management Platform, DMP) и различные аналитические инструменты и подходы, с помощью которых можно анализировать поведение клиентов и выявлять в нем определенные закономерности.

К наиболее распространенным бизнес-кейсам, основанным на использовании технологий Big Data, можно отнести таргетированные маркетинговые коммуникации, «умный» подбор персонала, управление рисками (отток клиентов, кредитный скоринг) и контроль безопасности организации.

Также стоит обратить внимание на взрывообразный рост количества различных облачных сервисов, которые, аккумулируя загружаемые пользователями данные, позволяют использовать их для предоставления качественно новых услуг (таких, например, как карты или многочисленные приложения для фитнес-трекинга).

2. Во-первых, нужны данные. Аккуратно собранными, структурированными базами данных хотя бы за несколько последних лет могут похвастаться очень немногие отечественные B2C-компании. Многим не удалось собрать воедино даже ключевые данные о своих клиентах – пол или дату рождения, не говоря уже об интересах и предпочтениях.

Во-вторых, на старте проекта необходимо сформулировать четкую цель, «вопрос к данным», понять, что вы хотите получить и какие процессы в организации улучшить. Например, с помощью интеллектуального анализа и алгоритмов машинного обучения научиться выявлять клиентов банка или интернет-магазина, склонных к отказу от пользования услугами, принять меры по их удержанию (специальные предложения, скидки) и на выходе получить снижение процента оттока пользователей.

В-третьих, успешный Big Data-проект невозможен без мотивированных людей, обладающих экспертизой и опытом в области использования технологий Big Data для решения бизнес-задач в определенной отрасли. В России таких специалистов пока немного, и в большинстве случаев их приходится самостоятельно выращивать.

3. Бизнес-идея CleverDATA построена на использовании наиболее продвинутых в глобальном масштабе технологий Big Data для создания собственных продуктов и сервисов для работы с Большими данными. Сегодня в нашем активе созданная нашей командой платформа управления данными 1DMP для задач целевого маркетинга и облачный сервис 1DMC (Биржа данных) для организованного взаимодействия поставщиков и потребителей аудиторных сегментов ипрофилей клиентов.

4. Хочется привести в качестве примера проект, выполненный CleverDATA в 2015 году для одного из крупных российских банков. Задачей проекта было получить сегменты клиентов из текущей клиентской базы с наиболее высокой вероятностью подачи заявки на кредит в течение шести месяцев после маркетинговой кампании (использовались обзвон и рассылка по электронной почте и SMS).

Цель проекта заключалась в повышении эффективности маркетинговых коммуникаций при сохранении прежних расходов на них. В проекте были задействованы инструменты предиктивной аналитики, на ретроданных созданы математические модели, которые позволили по ряду паттернов выявить из числа текущих клиентов, в том числе «спящих», наиболее «отзывчивых» к предложению о кредите. Примечательно, что срок окупаемости такого проекта составляет три-четыре месяца, что развенчивает миф о высокой стоимости Big Data-проектов.

5. Подходы Big Data дают эффект, когда классические методы оптимизации бизнес-процессов организации исчерпали свои возможности. Большинство российских компаний еще не до конца использовало возможности классических подходов. К тому же в России исторически низкая культура работы с данными. В организациях только сейчас отлаживаются процессы накопления и обработки информации. Извлечение знаний для решения различных бизнес-задач –это скорее дело завтрашнего дня.

 

Алексей Талаев

«В области работы с Большими данными нужно ориентироваться на тактику «быстрых побед» и оперативную адаптацию результатов к повседневной деятельности»

Алексей Талаев, руководитель департамента прогнозной аналитики и оптимизационного планирования Navicon

1. В качестве основных направлений работы с Big Data в бизнесе можно выделить прогнозирование и анализ состояния активов предприятий, оперативное реагирование и рационализацию использования мощностей и ресурсов предприятия в целом. Например, в производстве анализ Больших данных в режиме реального времени позволяет оперативно производить мониторинг текущего состояния предприятия и строить точные прогнозные модели за счет своевременной оценки состояния дорогостоящих активов с максимальными показателями по производительности и надежности. Одновременно реализация подходов IoT (интернета вещей) становится эффективным инструментом оптимизации управления ресурсами предприятия и риск-менеджмента.

2. В области работы с Большими данными нужно ориентироваться на тактику «быстрых побед» и оперативную адаптацию результатов к повседневной деятельности. На каждом этапе, вплоть до полной автоматизации работы с Big Data, компания должна располагать осязаемыми промежуточными итогами, видеть перспективы и выгоды продолжения проекта. Поэтому для масштабных инициатив стоит проводить пилоты, строить прототипы на ограниченном, нореальном наборе данных.

3. В Navicon для реализации возможностей Big Data, IoT в области управления бизнес-процессами создан целый департамент – «Прогнозной аналитики и оптимизационного планирования». Решения строятся на аналитических платформах и системах прогнозирования крупнейших мировых вендоров и предназначены прежде всего для фармацевтики, ретейла, FMCG-сегмента (в части выявления факторов, влияющих на спрос и реализацию товаров), промышленности и производства (оценка и профилактика состояния оборудования). Также технологии анализа Больших данных используются для прогнозирования сценариев развития бизнеса, в зависимости от целого набора внешних и внутренних факторов.

4. Показателен пример планирования ресурсов предприятия с помощью Big Data. Довольно распространена ситуация простоя работников и остановки производства из-за несвоевременного проведения мер профилактики промышленного оборудования. Решение о его ремонте обычно принимается в авральном режиме после поломки и несет в себе дополнительные издержки на формирование ремонтной бригады, заказ запчастей и их ожидание. Поэтому дляпредупреждения финансовых потерь очень важно вовремя прогнозировать период, тип и причину поломки оборудования, для чего необходим качественный анализ имеющейся информации.

5. Говоря о рынке Big Data в России, нельзя не отметить, что в высокотехнологичных отраслях, где от качественного анализа данных зависит итоговый финансовый результат деятельности (ретейл, FMCG), он развивается достаточно высокими темпами. Однако развитие рынка данных тормозят и нехватка предпринимателей с широким стратегическим видением, и сложности в принятии самой концепции Больших данных. Несмотря на прозрачность результатов, доверие к ним со стороны многих экспертов неоднозначно. Поэтому, на мой взгляд, для массовой инсталляции решений на основе подхода Big Data в российских бизнес-реалиях нужно работать «в открытую», демонстрируя итоговый результат широкой общественности.

 

Виктор Носко

«Успех проекту гарантирован, если он занимает востребованную нишу и рынок растет»

Виктор Носко, директор, «Графовый Грааль»

1. Очень бурно развивается сфера аналитики в социальных сетях, социальных медиа, а с недавнего времени драйва добавил и бум мессенджеров, таких как «Телеграм». Текстовых данных становится все больше: это и отзывы напродукты и услуги, комментарии к событиям в СМИ и т.п. В связи с этим я ожидаю роста спроса на аналитические услуги от госструктур и околополитических маркетинговых агентств. Со стороны бизнеса в условиях кризиса усилится спрос на умную аналитику смыслов, которая включает в себя не просто графики упоминаний вашего бренда и позитив/негатив, а и срезы по продуктам и услугам, тренды внедрения новых продуктов.

2. Проекту успех гарантирован, если он занимает востребованную нишу и рынок растет, а по оценке, данной в исследовании «Экономика Рунета в 2014 году», ожидается, что рост рынка аналитических инструментов продолжится.

4. В условиях начавшегося в 2015 году очищения банковского сектора на плаву останутся только самые приспособленные. Передел банковского рынка уже начался – в этой конкурентной борьбе за клиентов победителями выйдут банки, которые быстро и своевременно внедряют новые услуги и оценивают тренды. А такое реагирование невозможно без ежедневного анализа проблем клиентов и продуктов конкурентов – и все это есть в социальных медиа. Нужно эти данные лишь собрать.

5. Я считаю, что главная причина – это некоторое технологическое отставание и дороговизна внедрения крупных западных продуктов, особенно в текущих экономических условиях. Нужно помогать отечественным проектам.

 

Сергей Оселедько

«Рынок технологий и услуг для Больших данных в России развивается медленнее глобального рынка. Освоение подобных технологий требует средств и отдачи»

Сергей Оселедько, управляющий партнер агентства Notamedia

1. Пока никто точно не знает, как правильно использовать Большие данные в качестве инструмента. Они начинают применяться в медицине. Думаю, Большие данные принесут невероятную пользу для диагностики.

2. Для успеха проекта, связанного с Большими данными, необходим бюджет и сильные аналитики.

3. Notamedia не использует Big Data, поскольку мы другого уровня и масштаба.

4. В целом рынок технологий и услуг для Больших данных в России развивается медленнее глобального рынка. Освоение подобных технологий требует средств и отдачи. Изредка кто-то пишет о том, как извлечь информацию из Big Dataили возрождении систем хранения данных с прямым подключением, но мы пока не двигаемся в практическую сторону.

 

Роман Чеботарев

«Поскольку вокруг Big Data все еще существует некоторый hype или шумиха, то велико количество спекуляций на рынке труда – много специалистов, выдающих себя за экспертов, требующих большие зарплаты»

Роман Чеботарев, эксперт по внедрению бизнес-приложений компании КРОК

1. Во-первых, сам по себе термин Big Data утрачивает свой смысл, постепенно размываясь в других понятиях. По сути, сейчас – это та же самая обработка данных в больших объемах, что и в случае классической бизнес-аналитики, BI, но только с меньшими финансовыми вложениями и возможностью прогнозирования показателей, произведения сценарного анализа. Поэтому на рынке все меньше уделяется внимание разделению понятий (даже крупные BI-вендоры сейчас начали встраивать функционал Big Data и Advanced Analytics в свои продуктовые стеки, создавать коннекторы и пр.), и все больше – решению конкретных задач заказчика без привязки к технологиям. Например, у нас в компании бизнес-аналитикой и большими данными занимается одно и то же направление.

Вторым рыночным трендом можно считать, с одной стороны, оптимизацию расходов в связи с непростым экономическим состоянием, а с другой – постепенное перетекание бюджетов из ИТ-отделов в бизнес-подразделения, такие как маркетинг, финансы, закупки и пр. Поэтому обсуждение результатов проекта все больше происходит с руководителями этих отделов, а не с ИТ-директорами. Для них важно понимать своих клиентов, представлять последствия любых действий и минимизировать возможные риски. Например, в банковской отрасли приоритетными задачами являются детальная сегментация клиентов, в том числе с использованием внешних данных с целью более точного и своевременного таргетинга предложений, а также транзакционная аналитика в реальном времени. Не теряет актуальности и задачи прогнозирования оттока клиента

Еще один тренд заключается в интересе к Open Source-решениям, в том числе и в области аналитики больших данных. Тем более что подобных продуктов на рынке уже достаточно, а государство вполне признает использование открытых решений в качестве одного из вариантов импортозамещения.

2. Во-первых, важно четко понимать, каких конкретно результатов необходимо достичь по итогам проекта. Поскольку результат работы любой системы класса Advanced Analytics гарантирован с некоторой долей неопределенности, то очень важно оценить «стоимость ошибки» прогнозирования – что будет, если случится пересортица или дефицит товара, либо мы попытаемся удерживать и без того лояльного клиента? Иногда такие изыскания затягиваются надолго, но получить необходимые ответы – крайне важно для успеха будущего проекта. Сформированные оценки позволяют предъявить требования по точности работы системы до начала проекта и подойти к его реализации более осознанно – с точки зрения контролируемых метрик.

Во-вторых, поскольку вокруг Big Data все еще существует некоторый hype или шумиха, то велико количество спекуляций на рынке труда – много специалистов, выдающих себя за экспертов, требующих большие зарплаты. Тоже самое с поставщиками услуг. Поэтому для успеха проекта важно обращаться к подрядчикам, имеющим за плечами большой опыт реализации подобных проектов и реальные положительные отзывы заказчиков.

3. Мы внедряли решение собственной разработки для контроля за информационным фоном, проведения конкурентного анализа и исследования трендов рынка. Вся информация, которая выделяется по результатам поиска из разнородных источников, представляется в режиме единого окна, распределяясь по тематикам. Система позволяет подключать любые типы источников – от поисковиков и соцсетей до внутренних бизнес-приложений и хранилищ данных.

Кроме того, используем похожую систему и для мониторинга госзакупок – она определяет заказчика, необходимый класс решений и команду, который может принять участие в конкурсе. Система предназначена для снижения нагрузки на тендерную группу без снижения объемов участия в тендерах. Насколько я знаю, подобные решения интересны крупным сервисным компаниям, например, оказывающих услуги в энергетике, где для оценки лота тратится достаточно длительное время.

 

В начало⇑

 

Комментарии отсутствуют

Комментарии могут отставлять только зарегистрированные пользователи

Выпуск №02 (135) 2024г.
Выпуск №02 (135) 2024г. Выпуск №01 (134) 2024г.
Вакансии на сайте Jooble

           

Tel.: (499) 277-12-41  Fax: (499) 277-12-45  E-mail: sa@samag.ru

 

Copyright © Системный администратор

  Яндекс.Метрика