принципы построения создания единого информационного пространства

на основе методологии байесовских интеллектуальных измерений

С.В.Прокопчина

Санкт-Петербургский Государственный Электротехнический университет (ЛЭТИ)

Научно-производственная корпорация «Интеллект-С»

ЗАО  « CINTECH»

 

 

Abstract - The concept of united informational space (UIS) on the basis of regularizating Bayesian approach (RBA) and Bayesian Intelligent technologies (BIT) are discussed.  Specifical features of UIS for territories and enterprises management are considered.  Concept models for UIS on the basis of the RBA and BIT are suggested. The metrological aspects of UIS by the instrument of the dynamic limited scale are discussed. The examples of UIS implementation for CIS countries (Central Asia region, Black Sea region, Baykal region) are given.

 


Одним  из важнейших приоритетов развития современного общества является информатизация всех сфер человеческой деятельности. Активное накопление информационных ресурсов, а также повышение сложности задач и пользовательских требований к решениям определило тенденцию к интеллектуализации компьютерных систем. В связи с этим  основным направлением развития IT-индустрии, международных научных работ и программ по информатике и телекоммуникациям стало создание единого информационного общества, основанного на знаниях (Шестая рамочная программа Европейского союза, проекты и программы Комиссий по устойчивому развитию и экономике Организации Объединенных Наций, проекты Всемирного Банка Реконструкции и Развития). Причем, в качестве основного инструмента построения такого общества определены интеллектуальные технологии,  как технологии обработки и получения знаний.

В данном докладе рассмотрены принципы  создания единого информационного пространства на основе регуляризирующего байесовского  подхода (РБП) и реализующих его байесовских интеллектуальных технологий (БИТ) [1 – 5], к числу которых относятся технологии измерений характеристик сложных объектов  (байесовские интеллектуальные измерения), технологии формирования и интеграции информационных и вычислительных ресурсов в единую динамическую информационно-технологическую среду (байесовские интегрирующие технологии), а также технологии аудита и управления (байесовские управляющие или  (для принятия решений)  управленческие технологии).

В реальных условиях спецификой задач мониторинга, аудита, принятия управленческих решений для сложных объектов (компонентов природной среды, социальных и экономических процессов,  промышленных  предприятий, территорий), как правило, является отсутствие достаточно достоверных, полных рядов экспериментальных данных и модельных представлений. Применение РБП и БИТ, предназначенных для работы в условиях значительной неопределенности, позволяет решать эффективно вышеуказанные задачи.

Единое информационное пространство Gu с его многофакторной, географической и временной распределенностью в целом и покомпонентно представляет собой сложный объект, активно взаимодействующий со средой. Формирование информационного пространства на основе компьютерных систем Gm представляет собой процесс моделирования реального информационного пространства, в котором реализуются гомоморфные преобразования вида:

 (1)

К числу компонентов  пространства Gm относятся модельные представления объектов окружающего нас мира, созданные субъектами  окружающей среды – источниками информации. Такого рода источники по принципу своего функционирования всегда генерируют неполную, нечеткую и неточную информацию, которая создает  базис информационного пространства. Тогда, согласно теоретическим выводам работы [1] информационное пространство можно представить в виде динамического компакта  G. На основе методологии РБП в виде композиции информационных ресурсов его компонентов, представляемых динамическими компактами информационных подпространств Gi, где I – число источников информации:

    (2)

            Информационное пространство многомерно. Так, например, для регионального информационного пространства территории можно выделить экономическое, индустриальное, экологическое, социальное, политическое и другие измерения. Для информационного пространства предприятия к числу измерений относятся производственное, финансовое, маркетинговое, инвестиционное, кадровое и другие. Для каждого измерения существует информация, которая определяет состояние поля по этому измерению. В целях обеспечения устойчивости оценок этого состояния  по неполной, неточной, нечеткой информации применяются регуляризирующие  технологии, в соответствии с которыми для каждого измерения определяются его параметры, для которых, в свою очередь строятся шкалы с динамическими ограничениями Gsmi по технологиям байесовских интеллектуальных измерений. Параметры измерений делятся на измеряемые непосредственно и измеряемые косвенно. В зависимости от типа параметров выбираются типы ШДО (параметрические или функциональные). Построение гипер-шкалы единого информационного пространства Gsu производится на основании свертки шкал Gsmi :

 (3)

            Применение соответствующих типов ШДО позволяет сохранить принцип единства измерений, обеспечивающий устойчивость, контроль качества и управление риском решений.[2]

Требуемая точность получаемых решений определяет расстояние между реперами ШДО в пространствах принятия решений: вероятностном и возможностном, географическом и временном, параметрическом и функциональном пространствах. Возможно определение расстояния между реперами в единицах измерения количества информации. Если расстояние между реперами гипер-шкалы информационного пространства определяется в географических координатах то рассматривая реперы как источники информации можно определить оптимальную инфраструктуру распределенного Информационного Аналитического Центра, реализующего единое информационное пространство.

Для обеспечения  управляемости  информационным полем, то есть управление его созданием и дальнейшим развитием, необходимо  соблюдение принципов наблюдаемости, идентифицируемости и интерпретируемости его свойств и характеристик.

Для обеспечения принципа наблюдаемости производится инвентаризация источников информации, их ранжирование  по степени их достоверности, точности и интеграция на основе технологий БИТ. Кроме того, в целях применения мощных статистических методов производится наращивание объема выборочных данных по следующей схеме:

1.      Собираются и шкалируются на ШДО все имеющиеся данные.

2.      Метрологически аттестуются полученные потоки   в виде комплексов метрологических характеристик (МХ) Gsmi по правилам, предложенным в [1].

3.      Осуществляется свертка шкалированных представлений источников в единый поток по модифицированной формуле Байеса [1].

4.      Производится преобразование комплексов метрологических характеристик для определения их для потока в целом.

5.      Осуществляется аппроксимация апостериорного закона распределения типовой моделью по алгоритму, приведенному в [1] с заданными метрологическими характеристиками.

6.      Реализуется имитационная модель  найденного закона распределения.

7.      Формируется выборка необходимой длины.

Идентифицирование производится на основе алгоритмов байесовской математической статистики, концепция которой представлена в [3]. Результаты идентификации представляют собой новые знания в виде модельных представлений, тематических карт риска и развития контролируемых объектов, текстовых сообщений, аналитических обзоров, графических образов и др. Интерпретируемость обеспечивается интеграцией технологий, реализующих математическую основу БИТ с другими технологиями, такими как ГИС-технологии, WEB-технологии на основе принципов РБП.

Следуя правилам РБП, основные этапы формирования единого информационного пространства можно представить в виде следующего технологического ряда:

1.      Проектирование гипер-шкалы единого информационного пространства на основе принципов РБП.

2.      Построение динамического компакта единого информационного пространства (ИП). 

2.1.   Формализация концептуального контентного представления единого информационного пространства (определение, типизация и концептуальная формализация прикладных задач ИП на основе РБП).

2.2.   Формирование концептуального представления объектов и субъектов единого информационного пространства на основе РБП.

2.3.   Формирование требований и ограничений ( требования к виду и качеству / риску решений; ограничения методологического, технологического и прикладного аспектов).

2.4.   Инвентаризация и аудит, (контентное, топологическое и  метрологическое обоснования и фильтрация) источников информации  на основе принципов и формализмов БРП.

2.5.   Инвентаризация и аудит потребителей информации.

2.6.   Формирование критериальной базы для решения прикладных задач

2.7.   Фильтрация и инвентаризация (типизация) и форматирование  полезных источников информации.

2.8.   Метризация источников информации на основе шкал с динамическими ограничениями.

2.9.   Построение гиперкуба ШДО (гипер-ШДО) для единого ИП.

3.      Информационное наполнение метризованного пространства.

4.      Интеграция контентного наполнения гипер-ШДО.

5.      Интеграция информационных и модельных представлений (вычислительных) ресурсов на основе методологии БИТ.

6.      Наполнение баз знаний (типовых и априорных выводов, рекомендаций.

7.      Организационное формирование  единого информационного пространства в виде сети интеллектуальных центров (примером такой сети может служить сеть региональных центров CINTECH.

8.      Наполнение локальных центров по шаблонам деревьев факторов и решений БИТ, копирование БИТ-шаблонов компонентов поля.

9.      Наполнение электронной библиотеки единого информационного поля согласно типам решаемых задач и типу пользователей.

10.  Разработка концептуальной логистической модели поля, включая WEB-модель подключения центров к телекоммуникационной сети.

11.  Обучение пользователей центров.

12.  Запуск рабочего режима.

13.  Мониторинг новых источников информации, генерация новых знаний в системе созданного единого информационного пространства.

При нахождении новых источников информации процесс преобразования и обновления информационного пространства повторяется, начиная с позиций 2.7. При изменении требований, задач или критериальной базы процесс преобразования повторяется с первой позиции.

Приведенная выше концепция реализуется в рамках проектов по созданию единого информационного пространства стран Центральной Азии (проект ООН), Байкальского региона, стран Черноморского региона.

Литература

1. Д. Д. Недосекин. С. В. Прокопчина. Е. А. Чернявский. «Информационные технологии интеллектуализации измерительных процессов», Санкт-Петербург Энергоатомиздат 1995

2.С. В. Прокопчина «Байесовские интеллектуальные технологии для аудита и управления сложными объектами в условиях значительной неопределенности» Сборник докладов Международной конференции по мягким вычислениям и измерениям SCM 2002, Санкт-Петербург, 25-27 июня, 2002,Том 1 стр. 27

3.Прокопчина С. В. ,Наугольнов О. А. «Байесовские интеллектуальные измерения параметров случайных процессов //Известия ЛЭТИ:Cб. Науч. Тр., вып. 442,Л.: ЛЭТИ, 1991,с. 73-76.

4. Прокопчина С. В. «Интеллектуальные байесовские измерения вероятностных характеристик процессов и систем.» - В сб. тез. Докл. Всесоюзн. Науч.-техн. Конф. «ИИС-91», Санкт-Петербург, 1991, с. 40-41.

5.Прокопчина С. В. Экспертная система АССИСТЕНТ для интеллектуальных байесовских измерений вероятностных характеристик. //Измерительная техника, 1992,№ 8, с. 11-14.