Delist.ru

Системный анализ, онтологический синтез и инструментальные средства обработки информации в процессах интеграции профессиональных знаний

Автор: Минаков Игорь Александрович

Система онлайн анализа пользователей Интернет-портала по продаже «горящих» авиационных билетов. Ключевой возможностью портала фирмы-заказчика была идея учета индивидуальных предпочтений пользователя для интегрированного предложения различных сервисов, например, выбора гостиницы, кросс-продажи билетов на культурные события, бронирования ресторанов, сдача в аренду машин и пр.

Для решения этой задачи использовался предложенный модуль кластерного анализа, позволивший проанализировать предпочтения пользователей, приходящих на сайт (как явные, задаваемые матрицей на сайте, так и неявные, следующие из выбора опций), выявить группы пользователей со сходными интересами, а также проанализировать качество предлагаемых услуг, сравнивая получаемые результаты на соответствие ожиданиям пользователя.

Тем самым, была достигнута индивидуализация в общении с пользователями – каждому предлагались целенаправленно сервисы, интересующие его согласно предпочтениям, и повышено общее качество обслуживания.

Предложенная система способна подключаться к любому Интернет-порталу со специфицированным форматом хранения данных с целью выявления правил, описывающих типы пользователей и их интересы, что позволяет повысить качество взаимодействия с клиентами за счет индивидуализации подхода.

ЗАКЛЮЧЕНИЕ

В диссертации решена научная проблема разработки и развития теоретических основ и инструментальных программных средств для решения проблемы интеграции профессиональных научно-технических знаний, представленных в виде текстов на естественном языке, с целью индивидуализации процесса приобретения и анализа знаний.

Сущность предложенной методики состоит в использовании единого онтологического подхода в рамках субъектно-ориентированной модели приобретения знаний для индивидуализации процесса представления и анализа знаний для эксперта предметной области, и использовании мультиагентного подхода для реализации основных блоков инструментальной среды онтологического анализа и синтеза.

Основные научные и практические результаты работы состоят в следующем:

1. Предложен онтологический подход к задаче интеграции профессиональных научно-технических знаний, ориентированный на субъекта исследования и реализуемый на основе использования онтологии предметной области, индивидуально подстраиваемой под субъекта и автоматизировано сконструированной с помощью имеющихся материалов и знаний эксперта о предметной области, что обеспечивает полный цикл приобретения и интеграции научно-технических знаний, необходимый для эффективного и оперативного использования информации и поддержки принятия решений в сфере промышленного проектирования и производства, а также других областях.

2. Предложен метод автоматизированного построения начальной онтологии, реализующийся путем итеративного анализа строящейся онтологии с помощью предложенного мультиагентного метода понимания научно-технических текстов на естественном языке с применением базовой онтологии языка и набора предметно-ориентированных текстов, позволяющий оперативно получать начальное формализованное знание о предметной области.

3. Предложен метод преобразования неструктурированной информации на естественном языке в семантическую сеть в терминах онтологии предметной области, заключающийся в применении механизмов агентного взаимодействия квантов знаний, позволяющих реконструировать смысл предложения, и использовании построенных онтологий для хранения межфразового контекста.

4. Предложен метод кластерного анализа, реализованный на основе агентного взаимодействия, что обеспечивает механизмы динамической иерархии групп семантически схожих объектов как в пошаговом, так и в пакетном режимах, а также дает возможность работы с неструктурированными квантами информации.

5. Предложен метод машинного обучения системы в форме автоматизированного пополнения онтологии новыми знаниями на основе зависимостей, найденных в процессе анализа выявленных групп кластеров, что дает возможность уточнять знания о предметной области, улучшая качество представления, поиска и анализа документов.

6. Разработана и реализована инструментальная среда онтологического анализа и синтеза, где инструментарий инженерии знаний включает в себя конструктор онтологий, автоматизированную систему построения онтологий, систему понимания текста на естественном языке, систему извлечения знаний, модуль пополнения онтологических знаний и ряд дополнительных модулей, в том числе отладочную систему, интерфейсы работы с базами данных и внешними приложениями.

7. Выработаны критерии оценки и проведены экспериментальные исследования реализационных характеристик разработанных методов и средств, получено порядка 50 оценок и рекомендаций по применению предлагаемых алгоритмов. Исследования подтвердили эффективность предлагаемых методов, в частности было показано, что начальное автоматизированное построение онтологии позволяет сконструировать от 60 до 85% онтологии, представление текста в виде семантического дескриптора остается корректным примерно в 85-90% случаев, кластерное извлечение знаний формулирует до 22-27% значимых правил, при этом порядка 10-12% являются неизвестными для экспертов предметных областей, а пополнение онтологий позволяет дополнительно расширить начальную онтологию до 32% от первоначального объема.

8. На основе разработанных методов и средств создан ряд прикладных промышленных систем для применения в задачах мониторинга информации в области малых космических аппаратов, логистики, поисковых и метапоисковых системах, системах классификации профессионального и научно-технического документооборота, семантическом анализе действий пользователя в режиме онлайн, электронной коммерции и других. Полученный опыт свидетельствует, что разработанные методы и средства позволяют эффективно решать задачи анализа и извлечения знаний из естественно-языковых текстов, а использование созданного инструментария повышает производительность труда, сокращает стоимость и сроки разработки, а также упрощает процессы интеграции и сопровождения рассматриваемых промышленных систем.

Основные результаты диссертации отражены в следующих работах:

Статьи, опубликованные в реферируемых журналах из Перечня ВАК:

Минаков И.А. Онлайн-анализ пользователей Интернет-портала продажи «горящих» авиабилетов // Информационные технологии, 2006. № 1. С.62-68.

Андреев В., Виттих В., Батищев С., Ивкушкин К., Минаков И., Ржевский Г., Сафронов А., Скобелев П. Методы и средства создания открытых мультиагентных систем для поддержки процессов принятия решений // Изв. РАН. Теория и системы управления, 2003. № 1. С.126-137.

Минаков И.А. Система интеллектуального метапоиска в сети Интернет для оперативного нахождения и мониторинга релевантной информации в области малых космических аппаратов // Вестник Самарского гос. техн. ун-та. Серия «Технические науки», 2007. № 1(19). С.28-35.

Минаков И.А. Интеграция профессиональных знаний, представленных в виде текстов на естественном языке // Вестник Самарского гос. техн. ун-та. Серия «Технические науки». Самара: СамГТУ, 2006. Вып. 41. С. 18-25.

Минаков И.А. Кластеризация неструктурированной информации, представленной в виде текстов на естественном языке // Вестник Самарского гос. техн. ун-та. Серия «Технические науки». Самара: СамГТУ, 2006. Вып. 40. С. 15-22.

Минаков И.А. Анализ эффективности и выработка рекомендаций для повышения качества алгоритмов кластеризации и текстопонимания в онтологической модели приобретения знаний // Вестник Самарского гос. техн. ун-та. Серия «Технические науки». Самара: СамГТУ, 2005. Вып. 39. С. 10-17.

Минаков И.А. Архитектура инструментальной среды, ориентированной на решение задач извлечения знаний и понимания текста на естественном языке //Вестник Самар. гос. техн. ун-та. Серия «Технические науки», Самара: СамГТУ, 2005. Вып. 32. С. 12-19.

Минаков И.А. Автоматизированное пополнение онтологии на основе знаний, извлеченных в процессе кластеризации // Вестник Самар. гос. техн. ун-та. Серия «Технические науки». Самара: СамГТУ, 2005. Вып. 33. С. 321-326.

Минаков И.А. Разработка автоматизированной системы построения онтологии предметной области на основе анализа текстов на естественном языке // Вестник Самар. гос. техн. ун-та. Серия «Технические науки». Самара: СамГТУ, 2004. Вып. 20. С. 44-48.

Батищев С.В., Лахин О.И., Минаков И.А., Ржевский Г.А., Скобелев П.О. Разработка мультиагентной системы дистанционного обучения для Интернет-портала «Оптик-сити» // Изв. СНЦ РАН. – 2003. – Т.5, №1. – С.91-95.

Батищев С., Ивкушкин К., Минаков И., Ржевский Г., Скобелев П. Открытые мультиагентные системы для поддержки процессов принятия решений при управлении предприятиями // Изв. СНЦ РАН, Январь – Июнь 2001. Самара: СНЦ РАН, 2001. С.71-79.

Батищев С.В., Лахин О.И., Минаков И.А., Ржевский Г.А., Скобелев П.О. Разработка инструментальной системы для создания мультиагентных приложений в сети Интернет // Изв. СНЦ РАН. Самара: СНЦ РАН, 2001. Т.3, №1. С.131-135.

Минаков И.А. Сравнительный анализ некоторых методов случайного поиска и оптимизации // Изв. СНЦ РАН. Самара: СНЦ РАН, № 2. 1999. С.286-293.

Статьи, опубликованные в материалах конференций и других журналах

Виттих В.А., Минаков И.А. Интеграция профессиональных знаний: основные положения подхода // Проблемы управления и моделирования в сложных системах: Тр. IХ Междунар. конф., Самара, 22 июня – 29 июня 2007. Самара: СНЦ РАН, 2007. С.191-197.

Минаков И.А. Интеграция профессиональных знаний: методы и средства // Проблемы управления и моделирования в сложных системах: Тр. IХ Междунар. конф., Самара, 22 июня – 29 июня 2007. Самара: СНЦ РАН, 2007. С. 498-510.

Igor Minakov, George Rzevski, Petr Skobelev, Simon Volman “Automatic Extraction of Business Rules to Improve Quality in Planning and Consolidation in Transport Logistics Basing on Multi-Agent Clustering”. Proceedings of the 2nd International Workshop - Autonomous Intelligent Systems: Agents and Data Mining (AIS-ADM-07), St. Petersburg, Russia, June 3-5, 2007, LNAI 4476, pp. 124-137.

Marat Kanteev, Igor Minakov, George Rzevski, Petr Skobelev, Simon Volman “Multi-Agent Meta-Search Engine Based on Domain Ontology“. Proceedings of the 2nd International Workshop - Autonomous Intelligent Systems: Agents and Data Mining (AIS-ADM-07), St. Petersburg, Russia, June 3-5, 2007, LNAI 4476, pp. 269-274.

Igor Minakov, George Rzevski, Petr Skobelev, and Semen Volman “Dynamic Pattern Discovery using Multi-Agent Technology”. Proceedings of the 6th WSEAS International Conference on Telecommunications and Informatics (TELE-INFO ’07), Dallas, Texas, USA, March 22-24, 2007, 75-81.

Минаков И.А. Скобелев П.О. Томин М.С. Мультиагентная система интеллектуальной обработки факсов, используемых для обмена бизнес-данными // Проблемы управления и моделирования в сложных системах: Тр. VIII Междунар. конф., Самара, 24 июня – 28 июня 2006. Самара: СНЦ РАН, 2006. С.510-515.

Вольман С.И., Минаков И.А. Применение методов извлечения знаний в задачах транспортной логистики // Проблемы управления и моделирования в сложных системах: Тр. VIII Междунар. конф., Самара, 24 июня – 28 июня 2006. – Самара: СНЦ РАН, 2006. С.516-521.

Minakov Igor, Rzevski George, Skobelev Petr, Volman Semen. Automatic Generation of Business Rules for Logistics Company using Multi-agent clustering // 1st International Conference on Business Information, Organisation and Process Management (BIOPoM 2006), Westminster Business School, University of Westminster London, June, 2006. http://www.wmin.ac.uk/wbs/pdf/BIOPoM_2006_Final_Programme2.pdf

загрузка...