Что такое информация::БИТ 02.2018
 
                 
Поиск по сайту
 bit.samag.ru     Web
Рассылка Subscribe.ru
подписаться письмом
Вход в систему
 Запомнить меня
Регистрация
Забыли пароль?

Календарь мероприятий
август    2018
Пн
Вт
Ср
Чт
Пт
Сб
Вс
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

показать все 

Новости партнеров

16.08.2018

ПРОSTOR 2018 отметит новый этап технологического развития отрасли СХД

Читать далее 

13.08.2018

Вторая конференция «Автоматизация корпоративного казначействa», организованная группой «Просперити Медиа» и порталом CFO-Russia.ru, состоится 20-21 сентября 2018 года

Читать далее 

09.08.2018

Qrator Labs меняет взгляд на проблематику сетевых инцидентов в рамках конференции IETF

Читать далее 

08.08.2018

5-7 сентября в Сколково пройдет MERLION IT Solutions Summit

Читать далее 

08.08.2018

VI Международный Съезд лидеров отрасли телекоммуникаций TELECOMTREND в Санкт-Петербурге

Читать далее 

08.08.2018

Как бизнес в России поддерживает ИТ-жизнеспособность офиса и корпоративных ресурсов

Читать далее 

07.08.2018

Самый пляжный IT Fest ULCAMP-2018: снова бьём рекорды

Читать далее 

показать все 

Статьи

25.06.2018

Посетить или пропустить?

Читать далее 

25.06.2018

Внедрение искусственного интеллекта задерживается в связи с отсутствием стратегических инициатив

Читать далее 

25.06.2018

Илоны Маски для «умного» города

Читать далее 

25.06.2018

Почему ИИ положен в долгий ящик?

Читать далее 

25.06.2018

Smart Москва

Читать далее 

21.04.2017

Язык цифр или внутренний голос?

Читать далее 

16.04.2017

Планы – ничто, планирование – все. Только 22% компаний довольны своими инструментами для бизнес-планирования

Читать далее 

16.04.2017

Цифровизация экономики

Читать далее 

23.03.2017

Сервисная компания – фея или Золушка?

Читать далее 

17.02.2017

Информационные технологии-2017

Читать далее 

показать все 

Что такое информация

Главная / Архив номеров / 2018 / Выпуск №02 (75) / Что такое информация

Рубрика: Философия ИТ


Анатолий Орлюкк.э.н., доцент Московского университета путей сообщения

Что такое информация

Что такое информацияИногда в литературе можно встретить высказывания о том, что объем информации вырос на 30-50 процентов. О чем идет речь? Да, рост данных постоянно наблюдается, но означает ли это рост информации?

Сперва собирать факты и только после этого связывать их мыслью

Аристотель

Несмотря на то что уже несколько десятилетий мы строим и живем в информационном обществе, в настоящее время пока нет четкого определения, что такое информация. Закон об информации от 2005 года определяет ее как сведения, философы – как разнообразие, которое один объект содержит о другом объекте (в процессе их взаимодействия).

Другие трактуют информацию как всеобщее фундаментальное свойство реальности, которое проявляется в том, что отдельные фрагменты реальности различным образом проявляют себя в пространстве и времени, т.е. обладают свойствами различия, или, по-другому, информация отражает разнообразие и нарушение однообразия.

Дали свое определение информации и классики: Норберт Винер, благодаря которому под информацией уже понимали не просто сведения, а новые и полезные для принятия решения, Клод Шеннон, Виктор Глушков и другие. Есть и словарное определение информации как осведомление. Приведенное показывает многообразие и неоднозначность и в определенном смысле неразбериху в этом вопросе. Подтверждением этого является то, что некоторые авторы говорят о статической и динамической информации или постоянной и переменной (в современной трактовке постоянная информация – это знания), другие – о полноте, идентичности и достоверности. Представляется, что понятие «информация», по сути, не нуждается в таких оговорках, в противном случае это не информация, которая всегда конкретна, а если не так, то это не информация.

Информация – понятие относительное. Это, вообще говоря, не отражение или сведения о событии, а именно наличие связи между несколькими событиями

Отсутствует и теория информации, что является причиной такой неразберихи. Идут споры о материальности и нематериальности или амбивалентности информации, объективности и субъективности. Говорят о системной теории информации как симбиозе теории Шеннона и других теорий, а также о синергетической теории информации. Такие попытки не решают проблему построения всеобъемлющей и стройной теории, а только подчеркивают ее актуальность.

Зачастую смешиваются понятия «данные» и «информация», «информация» и «знания». Утверждается, что информация – это зафиксированные данные или это просто слова-синонимы.

Разумеется, в основе этих понятий есть что-то общее, и может показаться, что здесь вопрос терминологии (о которой можно договориться), но важна суть. Общим является то, что в основе их лежит отражение реального мира.

Представляется, что на понимание и трактовки оказывает влияние степень развития информационных технологий, основное предназначение которых – обработка данных и получение информации или знаний. На разных этапах развития ИТ такая путаница вполне объяснима.

На ранней стадии развития ИТ, например, чтобы узнать, есть ли на складе сырье для производства, надо было сделать запрос, а информационная система выдавала ответ, т.е. информацию. Однако с развитием ИТ и построением современных информационных систем стало очевидно, что в подобном случае мы имели не информацию, а данные, поскольку никакой обработки этих данных не было, хотя считалось, что получена важная информация для производства.

Продолжая пример: наличие товара для отдела сбыта и бухгалтерии – это данные. Но они превращаются в информацию для этих подразделений: скажем, для бухгалтерии – это превышение сверхнормативных запасов и, соответственно, штрафы, а для сбыта – это срыв поставок и санкции. Иными словами, из одних и тех же данных в зависимости от потребителя, для которого они предназначены, получается уже информация, требующая соответствующих действий.

С появлением больших данных стало очевидным различие: уже не говорят, что данные и информация – это синонимы

Из этого простого примера видно, что информация – понятие относительное. Это, вообще говоря, не отражение или сведения о событии, а именно наличие связи между несколькими событиями, в данном случае одно событие – это факт, а другое событие – это норма.

Как видно, данные и информация суть разные по смыслу, и одной из причин смешивания их было несовершенство старых информационных систем, которые назывались информационными, но фактически работали с данными, о чем упоминалось выше.

Ситуация изменилась, когда стало возможным превращать данные в информацию в реальном времени для принятия управляющих воздействий. Это уже действительно информационные системы или информационно-управляющие системы реактивного или проактивного типа. На примере таких систем мы видим, что информация – не отражение, а прогноз возможных аномальных ситуаций (событий) с необходимостью принятия управляющих воздействий.

Иногда в литературе можно встретить высказывания о том, что объем информации вырос на 30-50 процентов. О чем идет речь? Да, рост данных постоянно наблюдается, но означает ли это рост информации? Для более глубокого анализа и получения качественной или конкретной информации нужен большой объем данных, но это не означает, что если мы имеем петабайты данных, то, соответственно, растет объем информации, ибо это разные понятия, и попытки найти чуть ли прямую зависимость свидетельствуют о терминологической вольности или недостаточной изученности вопроса. Хотя, строго говоря, для полного понимания и степени связи требуется отдельное исследование.

Между тем бурное развитие ИТ и появившиеся современные тренды, в частности большие данные, обострили проблему и требуют полного переосмысления понятий, не только информации, а всей триады: данные-информация-знания.

В то же время с появлением больших данных стало очевидным различие: уже не говорят, что данные и информация – это синонимы.

Более того, все чаще употребляется выражение «цифровое общество», а не информационное, не информационная революция, а цифровая.

Заметим, что если кто-то думает, что это маркетинговый ход, то он ошибается. Термин «цифровая революция» точнее отражает суть происходящих процессов, равно как и корректнее говорить о том, что в компьютере циркулирует не информация, а данные.

Очевидно, что возникает настоятельная необходимость переосмысления понятий, если не с философских теоретических позиций, то по крайней мере с приложенческих.

Можно предположить, что колоссальные возможности ИТ и являются прообразом того разумного существа, которое сделает мир детерминированным, где понятие «информация» исчезнет или перестанет быть актуальным

Надо ответить на вопрос: что такое данные, информация, знания, в чем их отличия с позиции хранения, обработки, использования, а также введения их в хозяйственный оборот или каков механизм превращения их в нематериальные активы?

Необходимо подчеркнуть, что в последнее время установился подход, в соответствии с которым данные – это представленные факты, а информация – это то, что получаем в результате анализа данных.

Самой по себе ее в природе нет, более того, возможность возникновения информации существует при наличии определенных условий и только во время взаимодействия данных и методов их анализа. Отсюда вытекают ограниченное время жизни информации и ее связь со временем.

Схематично можно изобразить так (см. рис. 1).

Рисунок 1. Откуда берется информация

Рисунок 1. Откуда берется информация

Как видно из этой схемы, информация порождается из данных конкретной задачи и существующих знаний для анализируемой предметной области. В результате анализа может быть получена различная по назначению и смыслу информация: диагностическая, прогностическая, описательная и другая.

Например, если анализируются показатели работы предприятия – данные, в качестве знаний может быть технологический процесс, на выходе – информация для принятия управленческого решения. На схеме показана возможность превращения информации в знания.

В связи с огромным потоком данных может быть уместно прибегнуть к предварительной обработке данных и только после начинать анализ. Условно выделить три уровня данных: первый – не представляющие интереса; второй – для глубоко анализа; третий – для оперативного получения информации. Это даст возможность не потерять ценные данные и избавиться от менее ценных и в целом повысить качество данных.

В результате анализа могут быть выявлены скрытые зависимости между данными или событиями, которые они отражают, а в отдельных случаях и закономерности, подтвержденные множеством наблюдений (знания). Можно выявить, например, как влияет квалификация персонала отдельного филиала на объем выручки, но если собрать такую информацию по всем филиалам и на определенном периоде времени, то можно проследить наличие закономерности, а это уже знания для конкретной фирмы.

Кроме того, информацией может быть отклонение от нормы заданного параметра, при этом если отклонение не выходит за рамки обычного распределения вероятностей, когда речь идет о стационарном случайном процессе, то никакой информации нет. Но исключения, которые не укладываются в рамки распределения, являются информацией. В простом случае, если мы наблюдаем отклонение от нормы в виде превышения некоторого порогового или заданного значения, это тоже информация.

Таким образом, можно сделать вывод, что информация – это отклонение, которое требует реакции или действия, и это отклонение носит случайный характер. В этом смысле можно определить информацию как отражение свершившейся случайности.

Представляется, что такое определение в наибольшей степени отражает суть этой сложной категории. Только через призму случайного можно понять ее глубину и противоречивость.

Почему случайность? Не потому, что отсутствуют причинно-следственные связи, а из-за недостатка данных мы не знаем всех фактов или событий, которые связывают и обусловливают наблюдаемое явление. Наконец, не во всех случаях есть стройная научная теория, которая способна объяснить эту взаимосвязь, и полученная информация не вписывается в рамки существующих законов. Если мы ищем связь между двумя событиями, то до тех пор, пока не будет достаточного набора данных, такая связь носит вероятностный характер, и, соответственно, мы получаем информацию как реализованную случайность. Но как только для нахождения связи достаточно данных, информация о найденной связи превращается в данные или знания, как в случае детерминированного процесса. Вот почему так важен объем данных и почему актуален тренд, связанный с большими данными.

Этот вопрос, вообще говоря, восходит к существованию двух миров – детерминированного и случайного. В связи с этим приведем высказывания Пьера-Симона Лапласа: «Состояние вселенной в данный момент можно рассматривать как результат ее прошлого и как причину ее будущего. Разумное существо, которое в любой момент знало бы все движущие силы природы и взаимное расположение образующих ее существ, могло бы, если разум был бы достаточно обширен для того, чтобы проанализировать все эти данные, выразить одним уравнением движение и самых больших тел во вселенной и мельчайших атомов. Ничто не осталось бы сокрытым от него, оно могло бы охватить единым взглядом как будущее, так и прошлое».

Можно предположить, что колоссальные возможности ИТ и являются прообразом того разумного существа, которое сделает мир детерминированным, где понятие «информация» исчезнет или перестанет быть актуальным.

Почему мы об этом говорим? Появление понятия «большие данные» (БД) может быть предтечей того разума по Лапласу, который способен выявить все причинно-следственные связи, что явится шагом к детерминированному миру и станет мощным инструментом познания. Правда, специалисты по БД утверждают, что мы пока далеки от этого, и БД позволяют в большинстве случаев, за исключением фундаментальной науки, отказаться от поиска причинно-следственных связей и ограничиться корреляциями.

Но если БД пока не решают эту фундаментальную проблему, то уже сегодня они освобождают нас от необходимости высокой точности при сборе данных.

Одна из сложнейших проблем при анализе данных, так как отсутствие высокоточных датчиков, например, не позволяет увидеть малейшие изменения, которые важны для получения прогнозной информации. За счет увеличения числа наблюдений можно компенсировать потери из-за их недостаточной разрешающей способности.

Не менее интересным в контексте данные-информация-знания является другой тренд, связанный с искусственным интеллектом.

Рассматривая подходы к построению ИИ, можно отметить, что вышеприведенная схема анализа данных подобна машинному обучению, когда в целях решения конкретной задачи проводится обработка большого объема данных с последующим получением информации и знаний как результат обучения. Примером дальнейшего использования результатов такого обучения могла бы быть вышеуказанная предварительная обработка данных.

Возвращаясь к ранее упомянутой триаде данные-информация-знания, зададимся вопросом: все ли сходится в этой парадигме или, может, от нее надо отказаться ввиду того, что информация занимает особое положение? Она связана с временными и вероятностными характеристиками, что совершенно не свойственно ни данным, ни знаниям.

Означает ли это, что информация не вписывается в триаду? Думается, нет, так как и данные, и знания, и информация являются отражением реального мира, хотя каждый по-своему, и находятся в диалектическом единстве, при этом информация занимает промежуточное положение между данными и знаниями. Особенность ее в том, что она существует только в динамике или в противном случае превращается в данные или знания. Вот смысл диалектического единства. Такое единство позволяет понять суть данных, информации, знаний, и в отдельности их существование не имеет смысла.

В заключение можно сделать следующие выводы:

  • информация выступает как категория, которая побуждает к действиям;
  • использование данных и информации можно представить в виде энергии, где данные – это потенциальная энергия, а информация кинетическая;
  • некорректно ставить вопрос о длительном хранении информации, т.к. ее время жизни ограничено;
  • информация не может быть объектом хозяйственного оборота как один из видов нематериальных активов, и не только с юридической точки зрения, только данные могут вводиться в хозяйственный оборот и, в некоторых случаях, знания.

В целом приведенные соображения позволят внести ясность и станут еще одним шагом на пути улучшения взаимопонимания между специалистами, между человеком и искусственным интеллектом, который на теперешней стадии требует однозначного понимания и трактовок. Может быть, упростят решение многих технических, экономических и юридических вопросов, особенно последних, поскольку здесь всегда наблюдается отставание практики от современных трендов.

В начало⇑

 

Комментарии отсутствуют

Комментарии могут отставлять только зарегистрированные пользователи

Выпуск №06 (79) 2018г.
Выпуск №05 (78) 2018г. Выпуск №04 (77) 2018г. Выпуск №03 (76) 2018г. Выпуск №02 (75) 2018г. Выпуск №01 (74) 2018г.

           

Tel.: (499) 277-12-41  Fax: (499) 277-12-45  E-mail: sa@samag.ru

 

Copyright © Системный администратор

  Яндекс.Метрика