Методы и средства автоматизации проектирования систем баз данных (26.11.2009)
Автор: Щэнь Янь
ней выделяются следующие составляющие: 1) интерфейс с пользователем и экспертом; 2) база знаний; 3) механизм логического вывода; 4)система объяснения принятых решений; 5) система обучения; 6) БД описаний концептуальной модели ПО; 7) система структурирования данных; Рис. 2 Структура ЭС для проектирования БД 8) система физической реализации БД. В ЭС проектирования БД предусмотрен ввод входных требований пользователя - (функциональных требований и ограничений целостности) в различных режимах. При этом используются правила БЗ: отбора входных форм, идентификации сущностей, назначения атрибутов, идентификации связей, размерностей и ограничений целостности. Кроме того, предоставляется возможность графического представления КС для удобства проектирования БД. Таким образом, интерфейс ЭС с проблемной областью (с пользователем, в частности) предусматривает ввод и обработку требований в одном из трех режимов: на органическом естественном языке (при заданном множестве синтаксических конструкций), с помощью шаблонов (ввод в заданные поля экрана по требованию системы), в виде выбранного варианта из меню предложений. Кроме того, ЭС система может использоваться, как средство интеграции неоднородных БД. Наиболее удобным и наименее трудоемким для пользователя является режим ввода через меню предложений и шаблоны, отражающих структуру концептуальной модели. Необходимо отметить новизну появления в архитектуре ЭС библиотеки формализмов - отдельных знаний о ПО, часто используемых в различных приложениях и, следовательно, соответствующих концептуальных моделях. Использование подобных стандартных и унифицированных общих знаний о ПО способствует значительному повышению производительности труда разработчика систем БД. Приводится описание разработанной концептуальной расширенной модели "сущность-категория-связь" (Рис. 3), и обосновывается возможность на ее основе наиболее полного представления семантики ПО в структуре разрабатываемой БД. ("сущность - связь"), а язык предикатов первого порядка ПРОЛОГ является удобным средством для реализации макета ЭС для проектирования БД в плане механизма логического вывода, предоставления знаний и обработки естественно-языковых конструкций, ER-модель естественным образом описывает объекты и взаимосвязи ПО, легко интерпретируется, модифицируется и удобна для наглядного изображения на плоскости. Кроме того, различные расширенные модели этого типа пригодны для представления и выведения новых знаний о ПО. Поэтому в качестве внутренней модели для описания концептуальной схемы проектируемой БД была выбрана ECR - модель ("сущность-категория-связь"), являющаяся универсальной и совместимой с другими описаниями на концептуальном уровне, максимально отражающей семантику ПО, и на базе известных модификаций моделей этого типа была разработана EСR- модель, содержащая оптимальный и достаточный набор формализмов для представления знаний о ПО и удобная для представления и обработки в среде ПРОЛОГа. Важнейшим требованием, предъявляемым к моделям, является способность к самоописанию, то есть представление в виде КС множества понятий и взаимосвязей модели. Предложенная ECR-мoдель позволяет очень эффективно строить такую мета модель, причем с образованием иерархии понятий, например, введением категории "элемент КМ". Описывается способ преобразования расширенной ECR-модели в логическую модель реляционного типа. Преобразование концептуальной схемы в СУБД-ориентированное описание БД (логическую схему), проводимое с помощью правил физической реализации, является обратным по отношению к отображению входных формализмов. Здесь конструкции ECR-модели транслируются в отношения в одной из форм реляционной модели, выбранной как наиболее распространенной на сегодняшний день. Часть правил физической реализации необходима для организации пустых баз данных со структурами полученных отношений. Основное отличие способа преобразования конструкций ECR-модели в отношения реляционной модели (R-отношения) состоит в образовании отдельных R-отношений при неполном вхождении объектов в отношение, а также оригинальное решение проблемы преобразования абстракций различных типов с использованием R-отношений метауровня. В четвертой главе диссертации проводится описание архитектуры и конкретных реализаций подсистем разработанной ЭС для проектирования БД в среде PDC Prolog, решается задача построения комплекса программ анализа концептуальных моделей ПО, рассматривается его структура, состав и назначение модулей, реализующих предложенные в главе 2 алгоритмы на языке Pascal. На основании множества правил концептуального моделирования и концептуальной кластеризации с использованием экспертной системы проводится наполнение и обработка КМ ПО в процессе диалогового взаимодействия с пользователем ЭС в одном из описываемых режимов. Интеграция моделей подразумевает объединение находящихся в работе моделей ПО в одну интегрированную модель о уникальным именем с целью ее анализа, оптимизации и реализации. Например, может быть решена задача слияния концептуальных моделей баз данных различных приложений (возможно различного типа) с целью проектирования интегрированного БнД. Анализ созданной концептуальной модели ПО проводится в режимах: 1) атрибуты - выявление совместимых по доменам атрибутов объектов и отношений для определения синонимов, противоречий и неоднозначностей, при этом могут быть обнаружены одноименные атрибуты, несовместимые по доменам, и выдана рекомендация для разрешения проблемы; 2) объекты - определение синонимов, абстракций типа "группирование", противоречий и неоднозначностей среди объектов путем классификации их по атрибутам, в этом случае проводится анализ на общность объектов КМ ПО по атрибутам и выдача сообщения о необходимости образования абстракции для выявленного множества объектов или корректировки описаний повторно определенных объектов или синонимов; 3) объекты отношений - определение абстракций типа "обобщение", противоречий и неоднозначностей среди объектов отношений путем классификации их по отношениям, при этом в случае обнаружения общности вхождения объектов в одноименные отношения с одинаковой ролью разработчику рекомендуется определить новую категорию-обобщение для этих объектов или устранить допущенные ранее ошибки в определении КМ ПО; 4) отношения - определение абстракций типа "агрегация", противоречий и неоднозначностей среди отношений путем классификации их по объектам отношений: если обнаруживается, что в КС определено несколько однотипных отношений (например, "содержит" или "входит") с одинаковыми наборами объектов отношений, система сообщит о целесообразности введения категории агрегации типа PART-OF для данных объектов; 5) связи - поиск противоречий и неоднозначностей среди отношений путем классификации их по атрибутам. Рекомендации системы строятся в этом случае, исходя из принципа детерминированности при описании атрибутов и их однозначного толкования, с целью избежания недоразумений при эксплуатации БД, то есть содержат советы пользователю по их переименованию. При проведении классификации как основы анализа элементов КМ ПО разработчику выдается информация о качестве КС в виде значения числовой характеристики и словесного описания ("качество КС низкое (высокое)"), и предоставляется возможность просмотра степени принадлежности рассматриваемому классу объектов всего множества элементов также c лингвистической квантификацией ("сильная", "слабая" ...). Кроме того, любой процесс классификации сопровождается наглядным представлением и классификацией множества образов на плоскости. В режиме реализации проводится проектирование БД с именем активной модели на логическом уровне (преобразование модели "объект-категория-отношение" в реляционную модель данных - реализация алгоритма преобразования, описанного в главе 3. Приведены основные характеристики работы комплекса программ и макета ЭC, результаты разработки систем БД "Расчетный отдел" в ЗАО «СТРОЙСТАНДАРТ ПЛЮС». Предлагаемая методика использования макета ЭС для проектирования БД определяет последовательность практических действий по его эффективному применению. ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ В итоге выполнения диссертации лично автором получены следующие основные результаты, определяющие научную новизну работы и ее практическую значимость: |