Delist.ru

Методы и средства автоматизации проектирования систем баз данных (26.11.2009)

Автор: Щэнь Янь

использованием интеллектуальных средств, обосновать и формализовать предлагаемую методику проектирования БД.

Рис. 1 Схема процесса проектирования БД с использованием интеллектуальных средств

Во второй главе решаются задачи анализа методов классификации агрегатов данных, используемых при проектировании фактографических БД и, на основании результатов анализа, делается вывод о необходимости разработки метода нечеткой классификации элементов концептуальных моделей ПО. В ходе разработки данного метода решены задачи выбора меры сходства объектов, функций принадлежности, целевого функционала качества КС.

Коэффициент сходства для пары Kij,обладающих, соответственно множеством характеристик Ai и Aj рассчитывается как индекс сходства Жаккара:

Предлагается также функция принадлежности, позволяющая проводить оценивание однородности исходного множества элементов (количество кластеров М=1):

Целевой функционал алгоритма нахождения оптимального числа кластеров Hp рассчитывается через элементарную функцию

энтропии, которую можно представить кусочно-линейной функцией.

Hp выглядит так:

и носит название индекса энтропии.

Тогда можно определить функцию качества разбиения Q как обратную по смыслу индексу энтропии:

Q = 1 - HP

Предлагается система методов структурирования элементов концептуальных моделей и их представления на плоскости, включающая:

1) алгоритм начальной кластеризации;

2) базовый алгоритм декомпозиции;

3) алгоритм для определения оптимального числа кластеров;

4) алгоритм нисходящей классификации;

5) алгоритм восходящей классификации;

6) алгоритм изображения множества образов на плоскости.

Приводятся характеристики работы алгоритмов концептуальной кластеризации для ПЭВМ.

Алгоритмы классификации дополняются методами оценки ее результатов с целью генерации рекомендаций и метазнаний о

концептуальной модели ПО, представляемых для анализа разработчику БД в процессе диалога.

Полученная классификация объектов не всегда может быть

описана на понятном человеку концептуальном языке, то есть логически квантифицирована, что требуется при выполнении каких-либо обобщений, построения механизмов абстракций в задаче концептуального проектирования. Таким образом, качество концептуальной кластеризации зависит также от качества задаваемых концепций S для идентификации кластеров или отображения между понятиями и кластерами:

Qi = g (Q , S)

Можно предcтавить S набором эвристик или множеством продукционных правил вида "если ... , то ..." , например:

>Используя значение целевой функции Q и основную эвристику: "хорошее разбиение - неразмытое разбиение", можно построить шкалу качества классификации, то есть осуществить переход к значению лингвистической переменной например, со значениями: качество "очень плохое", "плохое", "среднее", "хорошее", "очень хорошее". При этом значения Q в крайних точках: 0 и 1, очевидно, свидетельствуют об отказе от распознавания и, соответственно, качестве дискретного разбиения.

Тогда, пусть качество концептуальной модели, определяемое дискретностью задания типов объектов, связей, атрибутов и отношений, определяется нечетким множеством определенных выше лингвистических переменных с характеристической функцией

µ(q, ?, ?, ?1, ?2, ?1, ?2), в которой параметр ? определяет

центр распределения функции принадлежности µ, параметр ? -

интервал единичного значения функции принадлежности, параметры ?1 и ?2 - плавность перехода к нулю характеристической

функции слева и справа, соответственно, а параметры ?1 и ?2 -

точку перегиба функции на этих переходах:

При этом также могут использоваться функции принадлежности элементов классам для применения правил, учитывающих

неопределенность, например, для построения подмножеств

уровня ?:

“если fij > ?, то ei є Ci”

или использующих функции принадлежности как априорные характеристики достоверности в системах рассуждений с использованием байесовского подхода.

В любом случае ценность получаемой информации определяет эксперт - разработчик информационной системы, интерпретируя ее с точки зрения использования таксономических иерархий для устранения выявленных неоднозначностей, повторных определений, синонимичных конструкций в КМ, а также для построения механизмов абстракций: обобщения, группирования и агрегации.

Таким образом, ориентируясь по значениям Qi функциям принадлежности объектов, выявленным кластерам со множеством общих характеристик, наглядному представлению множества образов на плоскости, и , используя совокупность знаний о ПО, процессе кластеризации и свой опыт (предопределенные концепции S ), проектировщик БД разрабатывает концептуальную модель ПО. С использованием предложенных методов анализа множества элементов КМ и подхода построения систем, основанных на знаниях, была разработана экспертная система для построения БД на концептуальном и логическом уровнях.

В третьей главе разрабатываются принципы построения и архитектура ЭС (Рис. 2) для проектирования БД и ее составных частей. В

загрузка...