Delist.ru

Методы распознаваниярукописных текстов в системах автоматизации документооборота на промышленных предприятиях. (15.08.2008)

Автор: Ла Суан Тханг

Модификация алгоритма LMA

Формулу (5) можно переписать как:

(k =1,2,...K).

Теперь, матрицу Якобиан можно переписать в следующем виде:

Соответственно, преобразуем уравнение (5) в следующее:

Рассмотрим следующую операцию с матрицами.

, то справедливо уравнение

Заменить (10), (11), (12), (13) в (9) получаем:

И заменить (14) в (8) получаем:

Стоит отметить, что в правой части уравнения (16) размер результирующей матрицы равняется KxK. Значит затрат ресурса при вычислении операций с матрицами гораздо снизится (т.к. на практике количество выходов К гораздо меньше количества весов сети N). В результате чего, затрат ресурса при обновлении веса по формуле (17) становится намного меньше чем по формуле (8).

В третьей главе была разработана программа СНС_РТ, а также проведены эксперименты по работоспособности предложенных модели НС и алгоритмов обучения НС. Ниже показаны иерархия классов и примеры объектов в БД (Рис.6 – Рис.7).

База данных, используемая для обучения и тестирования, состоит из двух частей SD-1 и SD-3. SD1 содержит 60000 образов и используется в качестве обучающей выборки, а SD3 содержит 10000 образов и используется в качестве тестовой выборки.

Ниже приведены примеры результатов работы сверточной нейронной сети в задаче распознавания рукописных цифр по сравнению с другими классификаторами (Рис.8 – Рис.10). В таблице 6 приведено обозначение классификаторов.

Сверточные нейронные сети особенно хороши для распознавания и фильтрации фигур с варьируемыми размерами, положением, ориентацией в пространстве. Система неправильно распознает только 74 символа (из 10 000 изображений тестовой

выборки). Значит, что уровень ошибок составляет 0,74%.

Рис 8. Ошибки обучения и тестирования системы СНС_РТ

Таблица 6.

Рис 10.

В четвертой главе были разработаны методы выбора и внедрения СЭД в производственных предприятиях. На практике популярны 2 подхода к внедрению СЭД: Внедрения платформы автоматизации документооборота или автоматизации отдельных задач обработки документов.

При реализации набора не интегрированных приложений (рис. 11) первые внедрения обходятся относительно недорого. Однако, при внедрении большого количества приложений с одной стороны существенно удорожается стоимость их сопровождения и обучения персонала, а с другой стороны возникает необходимость их интеграции, что приводит к дополнительным издержкам.

Внедрение платформы автоматизации избавляет от этих проблем, и даже более того, по мере накопления опыта использования системы, все меньше усилий необходимо тратить на внедрение очередного приложения и существенно снижаются риски неудачного внедрения.

Рис 11. Зависимость суммарных издержек количеством внедренных приложений.

Исходя из сравнительного анализа в главе 1, в качестве СЭД для предприятия среднего размера автор рекомендует выбрать систему DocsVision как платформу автоматизации документооборота. В рис. 12 показаны основные этапы в процессе внедрения СЭД.

В четвертой главе также представлены результаты внедрения СЭД DocsVision в ТД «Роллтон» и его заводе в г. Серпухов.

До внедрения:

Таблица 7.

Наименование документов Количество документов Темпы роста, %

2005 2006 2007 2005-2006 2006-2007

Входящие 372 609 1020 164 167

Исходящие 1074 1362 1806 127 133

Приказы 1944 2379 3108 122 130

Внутренние 5916 7791 11523 132 148

Итого в год: 9306 12141 17457 130 144

В среднем за день 33 42 60 127 143

Затраченное время на обработку документов (час) 0,5 0,5 0,5 100 100

Затраченное время в год (час) 4653 6070,5 8728,5 130 144

После внедрения:

Таблица 8.

Год 2006 2007

Общее количество документов Классический СУД Классический СУД

загрузка...