Календарь мероприятий
октябрь 2024
Пн |
Вт |
Ср |
Чт |
Пт |
Сб |
Вс |
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | | | |
показать все
Новости партнеров
Николай Нашивочников, «Газинформсервис»: в нефтегазовом секторе изменился ландшафт угроз
Читать далее
В Москве обсудят применение искусственного интеллекта в строительстве
Читать далее
«ГенИИ» расскажут о кейсах и вызовах ИИ в производстве
Читать далее
Зарулили на 1-е место: победителем «Биржи ИБ- и IT-стартапов» стал проект по автомобильной кибербезопасности
Читать далее
«Киберарена»: «Газинформсервис» запускает новый формат киберсоревнований
Читать далее
показать все
Статьи
Технологический ИИ-арсенал
Читать далее
Чем страшен ИИ, и с чем его едят
Читать далее
Готов ли рынок АСУ ТП к переменам?
Читать далее
Отрыв длиной в год. Российские ИИ-решения незначительно уступают иностранным аналогам
Читать далее
Лейсан Чистая: «КулибИТ для каждого из нас это больше, чем просто проект – это наша миссия»
Читать далее
Взгляд в перспективу: что будет двигать отрасль информационной безопасности
Читать далее
5 способов повысить безопасность электронной подписи
Читать далее
Как искусственный интеллект изменит экономику
Читать далее
Неочевидный САПР: выход ПО за рамки конструкторской деятельности
Читать далее
Скоро некому будет делать сайты и заниматься версткой
Читать далее
показать все
|
Интеграция корпоративных информационных систем с использованием семантических технологий
Главная /
Архив номеров / 2013 / Выпуск №2 (25) / Интеграция корпоративных информационных систем с использованием семантических технологий
Рубрика:
Тема номера /
Корпоративный контент
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
Сергей Горшков, директор компании «Бизнес Семантика»
Интеграция корпоративных информационных систем с использованием семантических технологий
Интеграция корпоративных информационных систем – один из источников «головной боли» для ИТ-службы крупного предприятия. Семантические технологии позволяют по-новому посмотреть на пути решения наболевших проблем
Чем сложнее информационная инфраструктура компании, тем больше внимания приходится уделять процедурам обмена данными между различными системами. Они требуют постоянного внимания администраторов и программистов, являются одним из источников регулярно возникающих сбоев и авралов. По мере увеличения числа эксплуатируемых продуктов, сложность настройки обмена данными между ними возрастает в геометрической прогрессии. Затраты на интеграцию сравнимы с бюджетами на внедрение самих КИС. Способы интеграции – начиная от различных выгрузок и SOAP-сервисов, до MDM-систем и шин обмена сообщениями – давно известны, но сложны и не свободны от недостатков.
Вперед, к «семантической паутине»!
Одной из тенденций нынешнего этапа развития Интернет является расширение сферы применения семантических технологий (Semantic Web). Их суть состоит в том, что информация представляется в виде набора фактов, записываемых в форме триплетов «подлежащее – сказуемое – дополнение», а не в виде структурированных таблиц или гипертекстового содержимого, как это чаще всего делается в современных информационных системах. Для представления данных в таком виде необходима так называемая онтология – описание объектов, их свойств, возможных типов связей между ними. Консорциум W3C утвердил в качестве стандартов набор технологий, которые позволяют при помощи определенных синтаксисов записывать как онтологии, так и саму информацию, представленную в виде триплетов. Эти технологии уже сейчас широко используются в Интернете. Одним из их применений являются микроформаты, в которых на сайтах записываются адреса, описания товаров, контактная информация людей.
Разработаны и методы обработки данных, представленных в форме триплетов: например, язык SPARQL, предоставляющий совершенно иной уровень построения баз данных и запросов к ним, по сравнению с реляционными базами. Отличным примером практического использования этих технологий является проект DBPedia, задачей которого является перевод содержимого wikipedia в семантическую форму. Уже сейчас пользователи могут извлекать оттуда при помощи SPARQL-запросов такую информацию, найти которую при помощи традиционных средств поиска было бы просто невозможно.
Поле битвы - интеграция
Использование семантических технологий позволяет по-другому взглянуть на проблему интеграции информационных систем. Чтобы понять, какие именно проблемы мы сможем решить, посмотрим на типичные задачи, возникающие в этой сфере, и способы их решения. В качестве примера представим себе CRM-систему, в которой хранится информация о клиентах компании. По каждому клиенту хранится набор свойств – название, адрес, реквизиты и т.д. В отдельной таблице базы данных хранятся сведения о сделках с ним. Пусть необходимо организовать передачу информации о клиентах из CRM в другие информационные системы.
Традиционным способом решения этой задачи является выгрузка данных в текстовый формат, например CSV или XML (см. рис. 1).
Рисунок 1. Выгрузка данных в текстовый формат
Недостатки способа очевидны: обновление информации происходит с большими интервалами времени, есть проблемы с передачей данных, изменившихся «задним числом», при изменении структуры информации приходится перенастраивать процедуры выгрузки и загрузки.
Чуть более элегантным решением является создание веб-сервиса SOAP, к которому будут обращаться информационные системы, которым требуется информация о клиентах из CRM (см. рис. 2). Скорее всего, сервис будет предоставлять методы, при помощи которых другие информационные системы смогут запросить у CRM информацию об определенных клиентах и сделках с ними.
Рисунок 2. Веб-сервис SOAP – более элегантное решение
В компаниях, ИТ-инфраструктура которых включает три и более информационных системы, объем данных велик, а требования к их актуальности и доступности высоки, перечисленные традиционные способы не подойдут. В таких компаниях для интеграции используют MDM-системы, шины обмена сообщениями. Для их реализации и поддержки нужны серьезные ресурсы и трудозатраты. Одна из ключевых проблем всех перечисленных способов интеграции состоит в том, что они требуют создания программного кода или процедур, которые напрямую зависят от структуры передаваемых данных. Значит, любое изменение структуры данных несет риск того, что эти процедуры перестанут работать, и в них нужно будет вносить изменения.
Новый взгляд на старые проблемы
Посмотрим теперь, как могут помочь в решении этих проблем семантические технологии. Интеграция, построенная на семантических технологиях, позволяет полностью абстрагироваться от структуры и представления данных, от их источника. Все объединяемые системы передают определенные срезы той информации, которой они обладают, единому центру, одним из компонентов которого выступает SPARQL-сервер или иное хранилище информации в семантической форме. Пользователь (или информационная система – потребитель информации), работающий с этим сервером, имеет дело с огромным информационным графом, вершинами которого являются объекты, а гранями – связи между ними.
Как мы уже говорили, для построения такого графа нужна онтология. В нашем примере онтология будет включать понятия (классы объектов) «Клиент» и «Сделка». Объекты, экземпляры этих понятий – собственно клиенты и сделки – станут вершинами информационного графа. Каждый объект может обладать свойствами, типы которых также определены в онтологии: для клиента это адрес и ИНН, для сделки – клиент, дата и сумма. Значениями свойств могут быть другие объекты (например, клиент), или литералы – текстовые и числовые величины. Кроме того, у каждого объекта есть идентификатор – URI, который состоит из типа объекта, символа # и уникального идентификатора объекта. Фрагмент графа может выглядеть так (см. рис. 3).
Рисунок 3. Фрагмент информационного графа
После того, как информационная система преобразовала хранящуюся в ней информацию в такую форму, она может сообщить ее интеграционному серверу и другим системам в виде потока триплетов, или фактов. Получится следующий «текст»:
Клиент #alpha называется ООО «Альфа». Клиент #alpha находится по адресу ул. Ленина, 1. Клиент #alpha имеет ИНН 6671999888. Сделка #123 совершена с клиентом #alpha. Сделка #123 состоялась 2013-03-01. Сделка #123 имеет сумму 1024 руб.
Как мы видим, такая форма представления информации никак не связана со структурой, в которой информация хранится в системе-источнике (типы объектов и их свойства совсем не обязательно должны соответствовать таблицам и полям базы данных).
Такой «текст» может быть передан другим системам через центральный сервер, который осуществит его маршрутизацию, необходимые проверки целостности, гарантирует доставку. Каждая из систем-адресатов сможет интерпретировать полученные факты, и преобразовать их в свои информационные структуры. Для решения этой задачи можно разработать стандартные программные инструменты.
Сегодня уже существуют системы интеграции, реализующие описанный принцип. Предложенный подход позволяет построить схему интеграции, не усложняющуюся в зависимости от количества объединяемых информационных систем, не теряющую работоспособности при изменении структуры данных в одной из них, требующую гораздо меньших усилий при перенастройке обмена, по сравнению с традиционными подходами. Кроме того, в процессе такого обмена можно формировать и обновлять единый информационный граф, объединяющий данные из всех систем компании, а значит – получить непревзойденные аналитические возможности. Семантические технологии могут изменить рынок средств интеграции не в меньшей степени, чем принципы «семантической паутины» – лицо современного Интернета. В начало⇑
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
Комментарии отсутствуют
Комментарии могут отставлять только зарегистрированные пользователи
|
Вакансии на сайте Jooble
|