Большие данные в задачах бизнеса: мифы и реальность::БИТ 03.2015
 
                 
Поиск по сайту
 bit.samag.ru     Web
Рассылка Subscribe.ru
подписаться письмом
Вход в систему
 Запомнить меня
Регистрация
Забыли пароль?

Календарь мероприятий
ноябрь    2024
Пн
Вт
Ср
Чт
Пт
Сб
Вс
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

показать все 

Новости партнеров

14.11.2024

Обновление BI.ZONE Secure DNS: гибкая настройка фильтрации и максимальная скорость

Читать далее 

14.11.2024

RED Security: в октябре количество DDoS-атак на ТЭК выросло в 3 раза

Читать далее 

14.11.2024

Falcongaze представила новую версию DLP-системы — SecureTower 7 Helium

Читать далее 

14.11.2024

ИСП РАН покажет результаты 30-ти лет работы на Открытой конференции в Москве

Читать далее 

08.11.2024

Юбилейная конференция ЭОС: ЭОС: 30 лет лидерства на рынке автоматизации документооборота и обсуждение актуальных трендов

Читать далее 

показать все 

Статьи

22.11.2024

Тандем технологий – драйвер инноваций.

Читать далее 

21.11.2024

ИИ: маршрут не построен, но уже проектируется

Читать далее 

18.11.2024

Глеб Шкрябин: «Надежные и масштабируемые системы — основа стабильной работы бизнеса в условиях больших нагрузок»

Читать далее 

14.10.2024

Елена Ситдикова: «На разработчиках программного обеспечения для транспорта лежит большая ответственность перед пассажирами»

Читать далее 

11.10.2024

Технологический ИИ-арсенал

Читать далее 

13.06.2024

Взгляд в перспективу: что будет двигать отрасль информационной безопасности

Читать далее 

18.04.2024

5 способов повысить безопасность электронной подписи

Читать далее 

18.04.2024

Как искусственный интеллект изменит экономику

Читать далее 

18.04.2024

Неочевидный САПР: выход ПО за рамки конструкторской деятельности

Читать далее 

18.04.2024

Скоро некому будет делать сайты и заниматься версткой

Читать далее 

показать все 

Большие данные в задачах бизнеса: мифы и реальность

Главная / Архив номеров / 2015 / Выпуск №3 (46) / Большие данные в задачах бизнеса: мифы и реальность

Рубрика: Тема номера /  Большие данные в задачах бизнеса


Андрей Бирюковсистемный архитектор

Большие данные в задачах бизнеса:

мифы и реальность

Всегда ли нужно использовать Большие данные при обработке информации? Когда лучше применять эту концепцию?


Концепция Big Data или Большие данные широко известна в кругах ИТ-специалистов. Многие руководители, особенно крупных компаний, внедрили решения для работы с Большими данными, ожидая «чуда», но в итоге обнаружили, что у них лишь добавились новые трудности, а достижение результатов требует гораздо больших усилий, чем они предполагали. Поговорим о том, что такое Большие данные, когда их нужно применять, а когда лучше избегать. Но начнем с основных определений.

Итак, Большие данные (англ. Big Data) в информационных технологиях – это серия подходов, инструментов и методов обработки структурированной и неструктурированной информации очень больших объемов изначительного разнообразия содержимого. Целью данной обработки является получение воспринимаемых человеком результатов, эффективных в условиях непрерывного прироста, распределения по многочисленным узлам вычислительной сети.

Концепция Big Data является альтернативой традиционным системам управления базами данных и решениям класса Business Intelligence. В эту серию включают средства массово-параллельной обработки неопределенно структурированных данных, прежде всего решения категории NoSQL, алгоритмы MapReduce и аналогичные.

В качестве определяющих характеристик для Больших данных отмечают «три V» [1]:

  • объем (англ. volume, в смысле величины физического объема);
  • скорость (англ. Velocity, в смысле как скорости прироста, так и необходимости высокоскоростной обработки и получения результатов);
  • многообразие (англ. variety, в смысле возможности одновременной обработки различных типов структурированных и полуструктурированных данных).

Основными методами и техниками анализа, применимыми к Большим данным, являются следующие.

  • Методы класса Data Mining, основанные на обучении ассоциативным правилам, классифицирования данных (методы категоризации новых данных на основе принципов, ранее примененных к уже наличествующим данным), также кластерный анализ, регрессионный анализ.
  • Краудсорсинг – категоризация и обогащение данных силами широкого неопределенного круга лиц, привлеченных на основании публичной оферты, без вступления в трудовые отношения.
  • Смешение и интеграция данных – набор техник, позволяющих интегрировать разнородные данные из разнообразных источников для возможности глубинного анализа. В качестве примеров таких техник, составляющих этот класс методов, приводятся цифровая обработка сигналов и обработка естественного языка (включая тональный анализ).
  • Машинное обучение, включая обучение с учителем и без учителя, – использование моделей, построенных на базе статистического анализа или машинного обучения для получения комплексных прогнозов на основе базовых моделей.
  • Визуализация аналитических данных – представление информации в виде рисунков, диаграмм, с использованием интерактивных возможностей и анимации, как для получения результатов, так и для использования вкачестве исходных данных для дальнейшего анализа.

Я привел только основные методы работы с большими данными. Как видно, концепция Big Data предлагает довольно обширный функционал по обработке информации. Казалось бы, использование этих технологий позволит существенно упростить и оптимизировать работу предприятия в целом.

Однако есть ряд моментов, на которые следует обращать внимание перед внедрением Big Data.

Статью целиком читайте в журнале «БИТ. Бизнес & Информационные технологии», №3 за 2015 г. на страницах 12-14.

PDF-версию данного номера можно приобрести в нашем магазине.

В начало⇑

 

Комментарии отсутствуют

Комментарии могут отставлять только зарегистрированные пользователи

Выпуск №06 (139) 2024г.
Выпуск №06 (139) 2024г. Выпуск №05 (138) 2024г. Выпуск №04 (137) 2024г. Выпуск №03 (136) 2024г. Выпуск №02 (135) 2024г. Выпуск №01 (134) 2024г.
Вакансии на сайте Jooble

БИТ рекомендует

           

Tel.: (499) 277-12-41  Fax: (499) 277-12-45  E-mail: sa@samag.ru

 

Copyright © Системный администратор

  Яндекс.Метрика