Интеграция корпоративных информационных систем с использованием семантических технологий::БИТ 02.2013
 
                 
Поиск по сайту
 bit.samag.ru     Web
Рассылка Subscribe.ru
подписаться письмом
Вход в систему
 Запомнить меня
Регистрация
Забыли пароль?

Календарь мероприятий
декабрь    2024
Пн
Вт
Ср
Чт
Пт
Сб
Вс
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

показать все 

Новости партнеров

07.12.2024

Avanpost FAM/MFA+ стали еще безопаснее: вышла обновленная версия системы аутентификации

Читать далее 

07.12.2024

M1Cloud: Итоги 2024 года на российском облачном рынке

Читать далее 

06.12.2024

Действия сотрудников назвали главной причиной утечек информации

Читать далее 

06.12.2024

САТЕЛ представляет систему записи разговоров СИЗАР

Читать далее 

06.12.2024

Efros Defence Operations, релиз 2.11: умная киберзащита

Читать далее 

показать все 

Статьи

12.12.2024

Что следует учитывать ИТ-директорам, прежде чем претендовать на должность генерального директора?

Читать далее 

11.12.2024

Сетевая инфраструктура, сетевые технологии: что лучше – самостоятельная поддержка или внешнее обслуживание?

Читать далее 

22.11.2024

Тандем технологий – драйвер инноваций.

Читать далее 

21.11.2024

ИИ: маршрут не построен, но уже проектируется

Читать далее 

18.11.2024

Глеб Шкрябин: «Надежные и масштабируемые системы — основа стабильной работы бизнеса в условиях больших нагрузок»

Читать далее 

14.10.2024

Елена Ситдикова: «На разработчиках программного обеспечения для транспорта лежит большая ответственность перед пассажирами»

Читать далее 

13.06.2024

Взгляд в перспективу: что будет двигать отрасль информационной безопасности

Читать далее 

18.04.2024

5 способов повысить безопасность электронной подписи

Читать далее 

18.04.2024

Как искусственный интеллект изменит экономику

Читать далее 

18.04.2024

Неочевидный САПР: выход ПО за рамки конструкторской деятельности

Читать далее 

показать все 

Интеграция корпоративных информационных систем с использованием семантических технологий

Главная / Архив номеров / 2013 / Выпуск №2 (25) / Интеграция корпоративных информационных систем с использованием семантических технологий

Рубрика: Тема номера /  Корпоративный контент


Сергей Горшковдиректор компании «Бизнес Семантика»

Интеграция корпоративных информационных систем
с использованием семантических технологий

Интеграция корпоративных информационных систем – один из источников «головной боли» для ИТ-службы крупного предприятия. Семантические технологии позволяют по-новому посмотреть на пути решения наболевших проблем

Чем сложнее информационная инфраструктура компании, тем больше внимания приходится уделять процедурам обмена данными между различными системами. Они требуют постоянного внимания администраторов и программистов, являются одним из источников регулярно возникающих сбоев и авралов. По мере увеличения числа эксплуатируемых продуктов, сложность настройки обмена данными между ними возрастает в геометрической прогрессии. Затраты на интеграцию сравнимы с бюджетами на внедрение самих КИС. Способы интеграции – начиная от различных выгрузок и SOAP-сервисов, до MDM-систем и шин обмена сообщениями – давно известны, но сложны и не свободны от недостатков.

Вперед, к «семантической паутине»!

Одной из тенденций нынешнего этапа развития Интернет является расширение сферы применения семантических технологий (Semantic Web). Их суть состоит в том, что информация представляется в виде набора фактов, записываемых в форме триплетов «подлежащее – сказуемое – дополнение», а не в виде структурированных таблиц или гипертекстового содержимого, как это чаще всего делается в современных информационных системах. Для представления данных в таком виде необходима так называемая онтология – описание объектов, их свойств, возможных типов связей между ними. Консорциум W3C утвердил в качестве стандартов набор технологий, которые позволяют при помощи определенных синтаксисов записывать как онтологии, так и саму информацию, представленную в виде триплетов. Эти технологии уже сейчас широко используются в Интернете. Одним из их применений являются микроформаты, в которых на сайтах записываются адреса, описания товаров, контактная информация людей.

Разработаны и методы обработки данных, представленных в форме триплетов: например, язык SPARQL, предоставляющий совершенно иной уровень построения баз данных и запросов к ним, по сравнению с реляционными базами. Отличным примером практического использования этих технологий является проект DBPedia, задачей которого является перевод содержимого wikipedia в семантическую форму. Уже сейчас пользователи могут извлекать оттуда при помощи SPARQL-запросов такую информацию, найти которую при помощи традиционных средств поиска было бы просто невозможно.

Поле битвы - интеграция

Использование семантических технологий позволяет по-другому взглянуть на проблему интеграции информационных систем. Чтобы понять, какие именно проблемы мы сможем решить, посмотрим на типичные задачи, возникающие в этой сфере, и способы их решения. В качестве примера представим себе CRM-систему, в которой хранится информация о клиентах компании. По каждому клиенту хранится набор свойств – название, адрес, реквизиты и т.д. В отдельной таблице базы данных хранятся сведения о сделках с ним. Пусть необходимо организовать передачу информации о клиентах из CRM в другие информационные системы.

Традиционным способом решения этой задачи является выгрузка данных в текстовый формат, например CSV или XML (см. рис. 1).

Рисунок 1.	Выгрузка данных в текстовый формат

Рисунок 1. Выгрузка данных в текстовый формат

Недостатки способа очевидны: обновление информации происходит с большими интервалами времени, есть проблемы с передачей данных, изменившихся «задним числом», при изменении структуры информации приходится перенастраивать процедуры выгрузки и загрузки.

Чуть более элегантным решением является создание веб-сервиса SOAP, к которому будут обращаться информационные системы, которым требуется информация о клиентах из CRM (см. рис. 2). Скорее всего, сервис будет предоставлять методы, при помощи которых другие информационные системы смогут запросить у CRM информацию об определенных клиентах и сделках с ними.

Рисунок 2.	Веб-сервис SOAP –  более элегантное решение

Рисунок 2. Веб-сервис SOAP – более элегантное решение

В компаниях, ИТ-инфраструктура которых включает три и более информационных системы, объем данных велик, а требования к их актуальности и доступности высоки, перечисленные традиционные способы не подойдут. В таких компаниях для интеграции используют MDM-системы, шины обмена сообщениями. Для их реализации и поддержки нужны серьезные ресурсы и трудозатраты. Одна из ключевых проблем всех перечисленных способов интеграции состоит в том, что они требуют создания программного кода или процедур, которые напрямую зависят от структуры передаваемых данных. Значит, любое изменение структуры данных несет риск того, что эти процедуры перестанут работать, и в них нужно будет вносить изменения.

Новый взгляд на старые проблемы

Посмотрим теперь, как могут помочь в решении этих проблем семантические технологии. Интеграция, построенная на семантических технологиях, позволяет полностью абстрагироваться от структуры и представления данных, от их источника. Все объединяемые системы передают определенные срезы той информации, которой они обладают, единому центру, одним из компонентов которого выступает SPARQL-сервер или иное хранилище информации в семантической форме. Пользователь (или информационная система – потребитель информации), работающий с этим сервером, имеет дело с огромным информационным графом, вершинами которого являются объекты, а гранями – связи между ними.

Как мы уже говорили, для построения такого графа нужна онтология. В нашем примере онтология будет включать понятия (классы объектов) «Клиент» и «Сделка». Объекты, экземпляры этих понятий – собственно клиенты и сделки – станут вершинами информационного графа. Каждый объект может обладать свойствами, типы которых также определены в онтологии: для клиента это адрес и ИНН, для сделки – клиент, дата и сумма. Значениями свойств могут быть другие объекты (например, клиент), или литералы – текстовые и числовые величины. Кроме того, у каждого объекта есть идентификатор – URI, который состоит из типа объекта, символа # и уникального идентификатора объекта. Фрагмент графа может выглядеть так (см. рис. 3).

Рисунок 3.	Фрагмент информационного графа

Рисунок 3. Фрагмент информационного графа

После того, как информационная система преобразовала хранящуюся в ней информацию в такую форму, она может сообщить ее интеграционному серверу и другим системам в виде потока триплетов, или фактов. Получится следующий «текст»:

Клиент #alpha называется ООО «Альфа». Клиент #alpha находится по адресу ул. Ленина, 1. Клиент #alpha имеет ИНН 6671999888. Сделка #123 совершена с клиентом #alpha. Сделка #123 состоялась 2013-03-01. Сделка #123 имеет сумму 1024 руб.

Как мы видим, такая форма представления информации никак не связана со структурой, в которой информация хранится в системе-источнике (типы объектов и их свойства совсем не обязательно должны соответствовать таблицам и полям базы данных).

Такой «текст» может быть передан другим системам через центральный сервер, который осуществит его маршрутизацию, необходимые проверки целостности, гарантирует доставку. Каждая из систем-адресатов сможет интерпретировать полученные факты, и преобразовать их в свои информационные структуры. Для решения этой задачи можно разработать стандартные программные инструменты.

Сегодня уже существуют системы интеграции, реализующие описанный принцип. Предложенный подход позволяет построить схему интеграции, не усложняющуюся в зависимости от количества объединяемых информационных систем, не теряющую работоспособности при изменении структуры данных в одной из них, требующую гораздо меньших усилий при перенастройке обмена, по сравнению с традиционными подходами. Кроме того, в процессе такого обмена можно формировать и обновлять единый информационный граф, объединяющий данные из всех систем компании, а значит – получить непревзойденные аналитические возможности. Семантические технологии могут изменить рынок средств интеграции не в меньшей степени, чем принципы «семантической паутины» – лицо современного Интернета.

В начало⇑

 

Комментарии отсутствуют

Комментарии могут отставлять только зарегистрированные пользователи

Выпуск №07 (140) 2024г.
Выпуск №07 (140) 2024г. Выпуск №06 (139) 2024г. Выпуск №05 (138) 2024г. Выпуск №04 (137) 2024г. Выпуск №03 (136) 2024г. Выпуск №02 (135) 2024г. Выпуск №01 (134) 2024г.
Вакансии на сайте Jooble

БИТ рекомендует

           

Tel.: (499) 277-12-41  Fax: (499) 277-12-45  E-mail: sa@samag.ru

 

Copyright © Системный администратор

  Яндекс.Метрика