Delist.ru

Нейросетевой подход к интегрированному представлению и обработке информации в интеллектуальных системах (31.01.2008)

Автор: Харламов Александр Александрович

Статистический подход позволяет сформировать индекс на основе анализа частоты встречаемости слов в тексте. Семантический подход использует в этих целях заранее сформированное семантическое представление в виде глобальной семантической сети, в том или ином представлении. В этом случае проекция входного текста на эту сеть и формирует индекс текста. Все остальные функции являются производными от функции индексации. В зависимости от качества ее реализации стоит и качество работы остальных функций. Системы анализа текстов, в связи с этим, делятся на два класса.

К первому классу относятся простые, быстрые, не зависящие от языка и предметной области, но грубые системы, использующие статистические механизмы анализа. Второй класс – реализованный на основе использования лингвистической информации - формируют достаточно изощренные, дающие хороший результат, но сравнительно медленно работающие системы. Автоматизация извлечения знаний из текстов средствами формализмов искусственных языков представления знаний, встречает ряд трудностей, связанных с разнородностью используемых методов, слабой автоматизацией процессов формирования базы знаний и необходимостью привлечения экспертов - лингвистов и инженеров по знаниям - для формирования базы знаний. Поэтому существующие системы этого класса являются весьма громоздкими структурами с большими семантическими сетями. Либо качество их работы оставляет желать лучшего.

Показано, что, как и при разработке систем распознавания речи, в системах анализа текстов стоит проблема автоматического формирования источников лингвистических и экстралингвистических знаний различных уровней. В наибольшей степени это относится к формированию семантических представлений, в силу большого объема используемой информации. В не меньшей степени важную роль при обработке текстов играет ассоциативность доступа к информации.

Проведенный анализ показывает, что реализация эффективных интеллектуальных систем оказывается возможной лишь при включении в их состав семантического компонента. Существует два типа семантических представлений: процедурное представление знаний, где знания о конкретной проблемной области представляются в виде набора правил, и декларативное представление знаний, когда информация представляется в виде базы данных или базы знаний. Показано, что все семантические представления, так или иначе, сводятся к сетевому представлению.

Ограниченность искусственно-интеллектуального подхода к представлению семантической информации заключается в невозможности полного и непротиворечивого представления семантики только метаязыковыми средствами. Решение задачи интеграции информации различных модальностей позволило бы выйти из этого порочного круга.

Во второй главе показана необходимость использования двух основополагающих принципов для эффективного решения задач обработки и представления информации, полученной от разных типов сенсоров и эффекторов (разных модальностей), а также обработки и представления надмодальной семантической и прагматической информации. Это ассоциативность обращения к информации и структурный подход к ее обработке. Ассоциативность обращения к информации позволяет быстро получить нужную информацию, независимо от объемов выборки, а структурный подход к обработке информации – автоматически восстанавливать структуру и компактно хранить полученную информацию.

- траектория:

. (2.1)

является основой для осуществления структурной обработки информации.

-членный фрагмент, и траектория в этом случае пройдет через вершину, уже принадлежащую ей, то есть пересечется с самой собой. В этой точке возможно более одного продолжения траектории. Для двоичной последовательности продолжений может быть не более двух.

позволяет сохранить топологию структуры преобразуемой информации. Действительно, одинаковые фрагменты последовательности преобразуются в одну и ту же траекторию, разные - в разные траектории.

- обозначает обусловленность.

. (2.3)

, (2.4)

. При этом развертывание в траекторию несущей последовательности позволяет обратиться к информации, записанной в точках траектории, то есть к информационной последовательности. Такой способ записи назовем гетерассоциативной записью, а воспроизведение - гетероассоциативным воспроизведением.

. (2.5)

Аналогично (2.4):

. (2.6)

В этом случае можно восстановить исходную последовательность, начиная с одной из точек траектории:

. (2.7)

Такая запись называется автоассоциативной записью, а воспроизведение - автоассоциативным воспроизведением.

, возможно забывание - равномерное уменьшение значений счетчиков во времени со скоростью изменения их содержимого значительно меньшей, чем при запоминании:

. Введение забывания позволяет устранить случайные точки на траектории, не подтверждающиеся в процессе дальнейшего обучения.

в одну и ту же часть траектории.

, формирует словарь, характеризующий состав последовательностей входного класса в терминах их повторяющихся фрагментов в пространстве данной мерности:

слова словаря могут быть либо цепями, либо графами.

, соответствующих словам словаря, и пропускание новой, относительно словаря, информации. В результате появляется возможность реализовать структурный подход к обработке информации.

(2.10)

(2.11)

, или в другой записи:

(2.12)

предыдущего уровня, так как его элементами, при соответствующем выборе размерностей пространств этих уровней, являются элементы связей слов

Процессы в описанной многоуровневой структуре обратимы. Информация может сжиматься при ее обработке в иерархии в направлении снизу-вверх, с выделением из нее на каждом уровне поуровневых словарей (освобождением проходящей наверх информации от часто встречающихся событий соответствующей частоты встречаемости). Информация может развертываться при ее обработке в иерархии в направлении сверху вниз.

. (2.19)

-ой окрестности), а также взятой со своим весом информации о следующем символе входной последовательности, инициировавшей воспроизведение, принимается решение о следующем символе воспроизводимой последовательности.

реализуется с использованием механизма внимания с помощью управления порогом срабатывания ассоциативным процессом:

(2.20)

. Изменение порога приводит к расфокусировке, если порог уменьшается, и к схлопыванию зоны захвата, если порог увеличивается. Изменение порога осуществляется синапсом, расположенным на теле нейрона в области триггерной зоны.

Уменьшение порога на величину расфокусировки переводит процессы в режим генерализации. В этом случае радиусы сфер захвата всех вершин гиперкуба увеличиваются и они начинают откликаться на n-членные фрагменты, отличающиеся от их адреса на r символов. Увеличение порога переводит процессы в режим локализации.

, с вычислением меры близости по Хеммингу:

загрузка...