2. Распределение функций операторов.

Мощные системы ввода данных обычно функционируют по принципу конвейера. Специализация повышает производительность труда, а также позволяет практически неограниченно масштабировать систему. Например, всегда можно увеличить количество мест операторов сканирования, не вмешиваясь в работу операторов распознавания, верификаторов, и так далее.

3.Масштабируемость системы.

Благодаря распределению функций между операторами, система оказывается состоящей из узкоспециализированных модулей. При этом количество модулей каждого вида определяется только особенностями конкретной ситуации и может быть при необходимости легко изменено. Эта особенность делают систему более гибкой и управляемой, что существенно удешевляет комплекс ввода в целом.

4. Очередность заданий.

Важным для таких систем является понятие маршрута движения пакета. Пакеты движутся по системе не произвольным образом, а в соответствии с заданной схемой маршрутизации. Простейшим примером схемы маршрутизации может служить линейная схема: станция сканирования — станция распознавания — станция верификации — станция корректировки — станция экспорта. Основное преимущество системы, использующей очереди заданий, — равномерное распределение нагрузки по всем ресурсам (операторам) системы. Как только, например, оператор верификации освободился от задания и сообщил о своей готовности продолжить работу, на его рабочее место доставляется очередной пакет форм, стоящий следующим в очереди пакетов на верификацию [3].

 

2.3 Требования к системам массового ввода стандартных форм

Основные требования к системам обработки форм:

1. Соответствие предъявляемым функциональным требованиям.

Решение о внедрении системы обработки форм, а также выбор того или иного приложения должны производиться с учётом, в первую очередь, типа обрабатываемых документов и вида содержащихся в них данных. Для одних целей использование таких приложений может быть эффективно, в то время как для других, напротив, — вести к лишним расходам.

Поскольку производится обработка образов документов с распознаванием содержащихся в них данных, они должны быть спроектированы с учётом максимально удобного сканирования, а данные — внесены таким образом, чтобы их было удобно распознавать. Помимо типа документов и вида данных нужно оценить количество подлежащей обработке информации. Наиболее эффективно применение систем в тех случаях, когда за день обрабатываются сотни или более форм (ряд систем позволяет справляться и с несколькими тысячами документов).

2. Точность распознавания.

Модуль распознавания текста встроен в систему обработки форм. Существуют две его разновидности, основанные на технологиях оптического распознавания: OCR, которая применяется к напечатанным машинным способом символам, и так называемое интеллектуальное распознавание — ICR, способное работать с написанными вручную символами. Первая из технологий появилась давно и в настоящий момент хорошо проработана и широко распространена. Несмотря на то, что ICR базируется на концепции нейронных сетей, начавшей своё развитие относительно недавно, сегодня это тоже достаточно популярная и совершенная технология.

В табл.1 приведены основные характеристики методов распознавания.

 

Таблица 1

Характеристики методов распознавания

Метод Точность распознавания, % Процент нераспознанных символов Процент символов, распознанных ошибочно
Вручную 97-98 3
OCR 99,5 1-2 0,1
ICR 90-95 10-30 0,9-2

Как видно из таблицы, ни один из доступных способов не гарантирует полного отсутствия ошибок в тексте, однако чем выше точность распознавания и меньше количество не распознанных символов, тем больше вероятность того, что вложенные деньги окупятся быстрее. Пользователи систем OCR и ICR сталкиваются с ошибками двух типов: во-первых, это символы, которые система вообще не способна распознать, и, во-вторых, — те, что распознаются ошибочно. Причём последние наиболее опасны, так как ошибка, вполне вероятно, может остаться незамеченной. Первых также не должно быть слишком много, иначе редактирование затягивается на длительный срок, и эффективнее ввести информацию вручную. Диапазон значений, указанных в таблице, зависит от уровня систем: более дорогие, как правило, обеспечивают лучшие показатели.

3. Наличие эффективной системы редактирования.

Нельзя построить системы со 100%-м распознаванием форм и полностью исключить действия человека. Но их надо минимизировать и построить систему так, чтобы человек с максимальным удобством и скоростью исправлял выявленные ошибки. Лучше всего при редактировании иметь перед глазами содержимое формы полностью (или части формы), где выделены «сомнительно» распознанные символы. Оператор просматривает и вносит необходимые изменения, после чего подтверждает ввод данных.


Информация о работе «Ввод стандартных форм и форматированных документов»
Раздел: Информатика, программирование
Количество знаков с пробелами: 39623
Количество таблиц: 2
Количество изображений: 0

Похожие работы

Скачать
26388
7
7

... текста и его обработки, таблицы, форматирования и редактирования. Текстовый редактор: назначение и основные возможности. Редактирование и форматирование текста. Вставка таблицы в текстовый документ. Редактирование и форматирование таблиц. Данные, с которыми работают текстовые редакторы – это символьная информация. Наименьший единицей символьной информации является один символ. Слова – ...

Скачать
20470
0
0

... на рынке продуктов требует не только хорошего понимания конечной задачи, но и отличного знания рынка программного обеспечения. Рассмотрим подробнее основные подсистемы интеграции СЭД. 2.1 Системы автоматизации делопроизводства и документооборота Функции автоматизации делопроизводства и документооборота в том или ином виде представлены в любой системе автоматизации документооборота. В ...

Скачать
24072
0
7

... , поэтому при изменении стиля Обычный изменятся все основанные на нем стили. Стиль Обычный не основан ни на одном из стилей. Элементы текстовых документов, которые вводятся в документ в процессе его редактирования и форматирования: ·              Колонтитулы (Вид / Колонтитулы) ·              Символ (Вставка / Символ) ·              Ссылка (сноски; названия рисунков, таблиц, формул; ...

Скачать
38882
0
0

... и время; просмотреть и скопировать колонтитулы других разделов; переключиться между верхним и нижним колонтитулами. Редактирование колонтитулов завершают щелчком на кнопке Закрыть или и о игорной командой Вид ^ Колонтитулы. Проверка правописания Текстовый процессор Word существенно облегчает создание гра­мотных и литературно правильных документов. Проверка текста и исправление ошибок в нем ...

0 комментариев


Наверх