Методы распознаваниярукописных текстов в системах автоматизации документооборота на промышленных предприятиях. (15.08.2008)
Автор: Ла Суан Тханг
Модификация алгоритма LMA Формулу (5) можно переписать как: (k =1,2,...K). Теперь, матрицу Якобиан можно переписать в следующем виде: Соответственно, преобразуем уравнение (5) в следующее: Рассмотрим следующую операцию с матрицами. , то справедливо уравнение Заменить (10), (11), (12), (13) в (9) получаем: И заменить (14) в (8) получаем: Стоит отметить, что в правой части уравнения (16) размер результирующей матрицы равняется KxK. Значит затрат ресурса при вычислении операций с матрицами гораздо снизится (т.к. на практике количество выходов К гораздо меньше количества весов сети N). В результате чего, затрат ресурса при обновлении веса по формуле (17) становится намного меньше чем по формуле (8). В третьей главе была разработана программа СНС_РТ, а также проведены эксперименты по работоспособности предложенных модели НС и алгоритмов обучения НС. Ниже показаны иерархия классов и примеры объектов в БД (Рис.6 – Рис.7). База данных, используемая для обучения и тестирования, состоит из двух частей SD-1 и SD-3. SD1 содержит 60000 образов и используется в качестве обучающей выборки, а SD3 содержит 10000 образов и используется в качестве тестовой выборки. Ниже приведены примеры результатов работы сверточной нейронной сети в задаче распознавания рукописных цифр по сравнению с другими классификаторами (Рис.8 – Рис.10). В таблице 6 приведено обозначение классификаторов. Сверточные нейронные сети особенно хороши для распознавания и фильтрации фигур с варьируемыми размерами, положением, ориентацией в пространстве. Система неправильно распознает только 74 символа (из 10 000 изображений тестовой выборки). Значит, что уровень ошибок составляет 0,74%. Рис 8. Ошибки обучения и тестирования системы СНС_РТ Таблица 6. Рис 10. В четвертой главе были разработаны методы выбора и внедрения СЭД в производственных предприятиях. На практике популярны 2 подхода к внедрению СЭД: Внедрения платформы автоматизации документооборота или автоматизации отдельных задач обработки документов. При реализации набора не интегрированных приложений (рис. 11) первые внедрения обходятся относительно недорого. Однако, при внедрении большого количества приложений с одной стороны существенно удорожается стоимость их сопровождения и обучения персонала, а с другой стороны возникает необходимость их интеграции, что приводит к дополнительным издержкам. Внедрение платформы автоматизации избавляет от этих проблем, и даже более того, по мере накопления опыта использования системы, все меньше усилий необходимо тратить на внедрение очередного приложения и существенно снижаются риски неудачного внедрения. Рис 11. Зависимость суммарных издержек количеством внедренных приложений. Исходя из сравнительного анализа в главе 1, в качестве СЭД для предприятия среднего размера автор рекомендует выбрать систему DocsVision как платформу автоматизации документооборота. В рис. 12 показаны основные этапы в процессе внедрения СЭД. В четвертой главе также представлены результаты внедрения СЭД DocsVision в ТД «Роллтон» и его заводе в г. Серпухов. До внедрения: Таблица 7. Наименование документов Количество документов Темпы роста, % 2005 2006 2007 2005-2006 2006-2007 Входящие 372 609 1020 164 167 Исходящие 1074 1362 1806 127 133 Приказы 1944 2379 3108 122 130 Внутренние 5916 7791 11523 132 148 Итого в год: 9306 12141 17457 130 144 В среднем за день 33 42 60 127 143 Затраченное время на обработку документов (час) 0,5 0,5 0,5 100 100 Затраченное время в год (час) 4653 6070,5 8728,5 130 144 После внедрения: Таблица 8. Год 2006 2007 Общее количество документов Классический СУД Классический СУД |