Интеграция корпоративных информационных систем с использованием семантических технологий::БИТ 02.2013
 
                 
Поиск по сайту
 bit.samag.ru     Web
Рассылка Subscribe.ru
подписаться письмом
Вход в систему
 Запомнить меня
Регистрация
Забыли пароль?

Календарь мероприятий
июль    2022
Пн
Вт
Ср
Чт
Пт
Сб
Вс
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

показать все 

Новости партнеров

06.07.2022

MERLION IT Summit 2022: новый уровень важного отраслевого события

Читать далее 

05.07.2022

Учиться для жизни: специалисты в Оренбургской области решат задачу для образовательной компании

Читать далее 

04.07.2022

Запущена единая база знаний по работе с кириллическими доменными именами и email адресами

Читать далее 

27.06.2022

Три миллиона за искусственный интеллект: в Москве стартовал всероссийский чемпионат по искусственному интеллекту 

Читать далее 

показать все 

Статьи

29.04.2022

Можно ли продолжать цифровую трансформацию сегодня?

Читать далее 

23.03.2022

Дата-центры – 2022

Читать далее 

04.01.2022

Ваш рейтинг перспективных технологий

Читать далее 

11.12.2021

Что повысит конкурентоспособность?

Читать далее 

02.11.2021

Парадокс инвесторов

Читать далее 

13.02.2020

Чат-бот CallShark не требует зарплаты, а работает круглосуточно

Читать далее 

24.12.2019

До встречи в «Пьяном Сомелье»!

Читать далее 

21.12.2019

Искусство как награда Как изготавливали статуэтки для премии IT Stars им. Георгия Генса в сфере инноваций

Читать далее 

04.12.2019

ЛАНИТ учредил премию IT Stars памяти основателя компании Георгия Генса

Читать далее 

04.06.2019

Маркетолог: привлекать, продавать, продвигать?

Читать далее 

показать все 

Интеграция корпоративных информационных систем с использованием семантических технологий

Главная / Архив номеров / 2013 / Выпуск №2 (25) / Интеграция корпоративных информационных систем с использованием семантических технологий

Рубрика: Тема номера /  Корпоративный контент


Сергей Горшковдиректор компании «Бизнес Семантика»

Интеграция корпоративных информационных систем
с использованием семантических технологий

Интеграция корпоративных информационных систем – один из источников «головной боли» для ИТ-службы крупного предприятия. Семантические технологии позволяют по-новому посмотреть на пути решения наболевших проблем

Чем сложнее информационная инфраструктура компании, тем больше внимания приходится уделять процедурам обмена данными между различными системами. Они требуют постоянного внимания администраторов и программистов, являются одним из источников регулярно возникающих сбоев и авралов. По мере увеличения числа эксплуатируемых продуктов, сложность настройки обмена данными между ними возрастает в геометрической прогрессии. Затраты на интеграцию сравнимы с бюджетами на внедрение самих КИС. Способы интеграции – начиная от различных выгрузок и SOAP-сервисов, до MDM-систем и шин обмена сообщениями – давно известны, но сложны и не свободны от недостатков.

Вперед, к «семантической паутине»!

Одной из тенденций нынешнего этапа развития Интернет является расширение сферы применения семантических технологий (Semantic Web). Их суть состоит в том, что информация представляется в виде набора фактов, записываемых в форме триплетов «подлежащее – сказуемое – дополнение», а не в виде структурированных таблиц или гипертекстового содержимого, как это чаще всего делается в современных информационных системах. Для представления данных в таком виде необходима так называемая онтология – описание объектов, их свойств, возможных типов связей между ними. Консорциум W3C утвердил в качестве стандартов набор технологий, которые позволяют при помощи определенных синтаксисов записывать как онтологии, так и саму информацию, представленную в виде триплетов. Эти технологии уже сейчас широко используются в Интернете. Одним из их применений являются микроформаты, в которых на сайтах записываются адреса, описания товаров, контактная информация людей.

Разработаны и методы обработки данных, представленных в форме триплетов: например, язык SPARQL, предоставляющий совершенно иной уровень построения баз данных и запросов к ним, по сравнению с реляционными базами. Отличным примером практического использования этих технологий является проект DBPedia, задачей которого является перевод содержимого wikipedia в семантическую форму. Уже сейчас пользователи могут извлекать оттуда при помощи SPARQL-запросов такую информацию, найти которую при помощи традиционных средств поиска было бы просто невозможно.

Поле битвы - интеграция

Использование семантических технологий позволяет по-другому взглянуть на проблему интеграции информационных систем. Чтобы понять, какие именно проблемы мы сможем решить, посмотрим на типичные задачи, возникающие в этой сфере, и способы их решения. В качестве примера представим себе CRM-систему, в которой хранится информация о клиентах компании. По каждому клиенту хранится набор свойств – название, адрес, реквизиты и т.д. В отдельной таблице базы данных хранятся сведения о сделках с ним. Пусть необходимо организовать передачу информации о клиентах из CRM в другие информационные системы.

Традиционным способом решения этой задачи является выгрузка данных в текстовый формат, например CSV или XML (см. рис. 1).

Рисунок 1.	Выгрузка данных в текстовый формат

Рисунок 1. Выгрузка данных в текстовый формат

Недостатки способа очевидны: обновление информации происходит с большими интервалами времени, есть проблемы с передачей данных, изменившихся «задним числом», при изменении структуры информации приходится перенастраивать процедуры выгрузки и загрузки.

Чуть более элегантным решением является создание веб-сервиса SOAP, к которому будут обращаться информационные системы, которым требуется информация о клиентах из CRM (см. рис. 2). Скорее всего, сервис будет предоставлять методы, при помощи которых другие информационные системы смогут запросить у CRM информацию об определенных клиентах и сделках с ними.

Рисунок 2.	Веб-сервис SOAP –  более элегантное решение

Рисунок 2. Веб-сервис SOAP – более элегантное решение

В компаниях, ИТ-инфраструктура которых включает три и более информационных системы, объем данных велик, а требования к их актуальности и доступности высоки, перечисленные традиционные способы не подойдут. В таких компаниях для интеграции используют MDM-системы, шины обмена сообщениями. Для их реализации и поддержки нужны серьезные ресурсы и трудозатраты. Одна из ключевых проблем всех перечисленных способов интеграции состоит в том, что они требуют создания программного кода или процедур, которые напрямую зависят от структуры передаваемых данных. Значит, любое изменение структуры данных несет риск того, что эти процедуры перестанут работать, и в них нужно будет вносить изменения.

Новый взгляд на старые проблемы

Посмотрим теперь, как могут помочь в решении этих проблем семантические технологии. Интеграция, построенная на семантических технологиях, позволяет полностью абстрагироваться от структуры и представления данных, от их источника. Все объединяемые системы передают определенные срезы той информации, которой они обладают, единому центру, одним из компонентов которого выступает SPARQL-сервер или иное хранилище информации в семантической форме. Пользователь (или информационная система – потребитель информации), работающий с этим сервером, имеет дело с огромным информационным графом, вершинами которого являются объекты, а гранями – связи между ними.

Как мы уже говорили, для построения такого графа нужна онтология. В нашем примере онтология будет включать понятия (классы объектов) «Клиент» и «Сделка». Объекты, экземпляры этих понятий – собственно клиенты и сделки – станут вершинами информационного графа. Каждый объект может обладать свойствами, типы которых также определены в онтологии: для клиента это адрес и ИНН, для сделки – клиент, дата и сумма. Значениями свойств могут быть другие объекты (например, клиент), или литералы – текстовые и числовые величины. Кроме того, у каждого объекта есть идентификатор – URI, который состоит из типа объекта, символа # и уникального идентификатора объекта. Фрагмент графа может выглядеть так (см. рис. 3).

Рисунок 3.	Фрагмент информационного графа

Рисунок 3. Фрагмент информационного графа

После того, как информационная система преобразовала хранящуюся в ней информацию в такую форму, она может сообщить ее интеграционному серверу и другим системам в виде потока триплетов, или фактов. Получится следующий «текст»:

Клиент #alpha называется ООО «Альфа». Клиент #alpha находится по адресу ул. Ленина, 1. Клиент #alpha имеет ИНН 6671999888. Сделка #123 совершена с клиентом #alpha. Сделка #123 состоялась 2013-03-01. Сделка #123 имеет сумму 1024 руб.

Как мы видим, такая форма представления информации никак не связана со структурой, в которой информация хранится в системе-источнике (типы объектов и их свойства совсем не обязательно должны соответствовать таблицам и полям базы данных).

Такой «текст» может быть передан другим системам через центральный сервер, который осуществит его маршрутизацию, необходимые проверки целостности, гарантирует доставку. Каждая из систем-адресатов сможет интерпретировать полученные факты, и преобразовать их в свои информационные структуры. Для решения этой задачи можно разработать стандартные программные инструменты.

Сегодня уже существуют системы интеграции, реализующие описанный принцип. Предложенный подход позволяет построить схему интеграции, не усложняющуюся в зависимости от количества объединяемых информационных систем, не теряющую работоспособности при изменении структуры данных в одной из них, требующую гораздо меньших усилий при перенастройке обмена, по сравнению с традиционными подходами. Кроме того, в процессе такого обмена можно формировать и обновлять единый информационный граф, объединяющий данные из всех систем компании, а значит – получить непревзойденные аналитические возможности. Семантические технологии могут изменить рынок средств интеграции не в меньшей степени, чем принципы «семантической паутины» – лицо современного Интернета.

В начало⇑

 

Комментарии отсутствуют

Комментарии могут отставлять только зарегистрированные пользователи

Выпуск №04 (117) 2022г.
Выпуск №04 (117) 2022г. Выпуск №03 (116) 2022г. Выпуск №01 (114) 2022г. Выпуск №02 (115) 2022г.
Вакансии на сайте Jooble

           

Tel.: (499) 277-12-41  Fax: (499) 277-12-45  E-mail: sa@samag.ru

 

Copyright © Системный администратор

  Яндекс.Метрика