Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Работа с программой Fine Reader 5.0 и порядок распознавания документов



Практическая работа № 8.

Тема : Ввод информации с бумажных носителей с пользованием сканера, распознавание текста Освоение соответствующего программное обеспечение».

Цель занятия: Изучение основных принципов сканирования данных.

Методические указания к практической работе

Система сканирования Fine Reader 5.0

Работа с программой Fine Reader 5.0 и порядок распознавания документов

Основные операции обработки бумажного документа в программе выполняются с помощью панели инструментов Scan& Read.

На панели инструментов программы находятся соответствующие кнопки “Сканировать “, “ Распознать “, “ Проверить “, “ Сохранить “. Можно выполнять указанные операции и через меню Scan& Read в строке команд.

Процесс обработки документа состоит из следующих шагов:

– сканирование документа;

– сегментация документа;

– распознавание документа;

– редактирование и проверка результата;

– сохранение документа.

Первый этап работы сканирование . На этом этапе используют сканер. Чтобы начать сканирование, нужно включить сканер, положить оригинал документа (обычно левой стороной вниз, если только вы не используете ручной сканер) и щелкнуть кнопку “Сканировать “ или в раскрывающемся списке подкоманд данной кнопки использовать пункт Сканировать.

Можно задать различные режимы сканирования:

Black& White (черно-белый) – предназначен для сканирования текстов и контурных рисунков.

Gray (серый) – 256 оттенков серого цвета, используют данный режим для сканирования черно-белых фотографий или для черно-белых принтеров.

Color (цветной) – для получения цветных картинок и фотографий.

Второй этап работы сегментация текста. Дело в том, что в бумажном документе, например на странице книги или журнала, текст не всегда располагается в фиксированном порядке. Он может размещаться в нескольких колонках (столбцах), содержать иллюстрации (и подписи к ним), другие элементы форматирования. Дополнительные врезки и данные, представленные в таблицах, также могут запутать естественный порядок текста. Поэтому, прежде чем включать текст в документ, его разбивают на блоки, содержащие цельные фрагменты. Блоки распознают последовательно. Полученный текст включается в документ в порядке нумерации блоков.Сегментация – разбиение документа на блоки.

Ручную установку блоков (рамка с помощью левой кнопки мыши) можно применить, если нужно распознать только часть текста.

Второй этап работы программы сегментация. При автоматической сегментации определение границ блока определяется автоматически. При этом учитываются поля документа, просветы между колонками, рамки.

Третий этап работы программы – непосредственно распознавание. Этот этап обычно не требует вмешательства пользователя, за исключением тех случаев, когда распознавание сопровождается «обучением».

Процесс распознавания будет " иллюстрироваться" закраской участков текста.

Точность распознавания FineReader 6.0 около 92- 97 %, так как при печати книг и газет на бумаге иногда не прилипает или осыпается краска. Это будет хорошо видно в окне “Крупный план” с увеличенным масштабом.

Результаты распознавания будут отражены в окне “ Текст ”.

На четвертом этапе, средствами программы в полученном тексте, можно провести проверку грамматики с помощью соответствующей кнопки “Проверить” на панели инструментов или пунктом Проверить из раскрывающегося списка подкоманд. В результате появится следующее окно диалога

Распознанный текст отображается в отдельном окне “Текст”, в виде форматированного текстового документа. Он «теряет связь» с исходным изображением и может редактироваться и форматироваться независимого от него. Программа выделяет цветом те символы, которые она рассматривает как неоднозначно опознанные. Это упрощает поиск ошибок.

Пятый этап: по щелчку на кнопке “Сохранить“ на панели инструментов Scan& Read запускается Мастер сохранения результатов. Он позволяет сохранить распознанный текст или передать его в другую программу (например, MS Word) с помощью выбора соответствующего пункта из раскрывающегося списка подкоманд (рис. 5):

Выполнение настройки системы Fine Reader

При настройке обычно требуется выполнить следующие действия:

Установить язык распознавания и тип текста. Язык распознавания и тип текста являются главными параметрами распознавания.

Язык текста. При распознавании текста на том или ином языке выбрать нужный язык из списка на панели Распознавание из окна Опции/Распознавание (рис. 6).

Этап 1. Запустить сканирование.

Нажать кнопку

При выполнения сканирования можно добавлять отсканированные страницы в пакет, по умолчанию создаваемый при запуске программы, или можно открыть другой пакет (нажать кнопку Открыть на панели инструментов и записать отсканированные страницы в него).

При сегментировании изображения можно изменить тип блока путем вызова контекстного меню.

Практическая работа № 8.

Тема : Ввод информации с бумажных носителей с пользованием сканера, распознавание текста Освоение соответствующего программное обеспечение».

Цель занятия: Изучение основных принципов сканирования данных.

Методические указания к практической работе

Система сканирования Fine Reader 5.0

Работа с программой Fine Reader 5.0 и порядок распознавания документов

Основные операции обработки бумажного документа в программе выполняются с помощью панели инструментов Scan& Read.

На панели инструментов программы находятся соответствующие кнопки “Сканировать “, “ Распознать “, “ Проверить “, “ Сохранить “. Можно выполнять указанные операции и через меню Scan& Read в строке команд.

Процесс обработки документа состоит из следующих шагов:

– сканирование документа;

– сегментация документа;

– распознавание документа;

– редактирование и проверка результата;

– сохранение документа.

Первый этап работы сканирование . На этом этапе используют сканер. Чтобы начать сканирование, нужно включить сканер, положить оригинал документа (обычно левой стороной вниз, если только вы не используете ручной сканер) и щелкнуть кнопку “Сканировать “ или в раскрывающемся списке подкоманд данной кнопки использовать пункт Сканировать.

Можно задать различные режимы сканирования:

Black& White (черно-белый) – предназначен для сканирования текстов и контурных рисунков.

Gray (серый) – 256 оттенков серого цвета, используют данный режим для сканирования черно-белых фотографий или для черно-белых принтеров.

Color (цветной) – для получения цветных картинок и фотографий.

Второй этап работы сегментация текста. Дело в том, что в бумажном документе, например на странице книги или журнала, текст не всегда располагается в фиксированном порядке. Он может размещаться в нескольких колонках (столбцах), содержать иллюстрации (и подписи к ним), другие элементы форматирования. Дополнительные врезки и данные, представленные в таблицах, также могут запутать естественный порядок текста. Поэтому, прежде чем включать текст в документ, его разбивают на блоки, содержащие цельные фрагменты. Блоки распознают последовательно. Полученный текст включается в документ в порядке нумерации блоков.Сегментация – разбиение документа на блоки.

Ручную установку блоков (рамка с помощью левой кнопки мыши) можно применить, если нужно распознать только часть текста.

Второй этап работы программы сегментация. При автоматической сегментации определение границ блока определяется автоматически. При этом учитываются поля документа, просветы между колонками, рамки.

Третий этап работы программы – непосредственно распознавание. Этот этап обычно не требует вмешательства пользователя, за исключением тех случаев, когда распознавание сопровождается «обучением».

Процесс распознавания будет " иллюстрироваться" закраской участков текста.

Точность распознавания FineReader 6.0 около 92- 97 %, так как при печати книг и газет на бумаге иногда не прилипает или осыпается краска. Это будет хорошо видно в окне “Крупный план” с увеличенным масштабом.

Результаты распознавания будут отражены в окне “ Текст ”.

На четвертом этапе, средствами программы в полученном тексте, можно провести проверку грамматики с помощью соответствующей кнопки “Проверить” на панели инструментов или пунктом Проверить из раскрывающегося списка подкоманд. В результате появится следующее окно диалога

Распознанный текст отображается в отдельном окне “Текст”, в виде форматированного текстового документа. Он «теряет связь» с исходным изображением и может редактироваться и форматироваться независимого от него. Программа выделяет цветом те символы, которые она рассматривает как неоднозначно опознанные. Это упрощает поиск ошибок.

Пятый этап: по щелчку на кнопке “Сохранить“ на панели инструментов Scan& Read запускается Мастер сохранения результатов. Он позволяет сохранить распознанный текст или передать его в другую программу (например, MS Word) с помощью выбора соответствующего пункта из раскрывающегося списка подкоманд (рис. 5):


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-08-31; Просмотров: 1635; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.016 с.)
Главная | Случайная страница | Обратная связь