Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Работа с программой Fine Reader 5.0 и порядок распознавания документов
Практическая работа № 8. Тема : Ввод информации с бумажных носителей с пользованием сканера, распознавание текста Освоение соответствующего программное обеспечение». Цель занятия: Изучение основных принципов сканирования данных. Методические указания к практической работе Система сканирования Fine Reader 5.0 Работа с программой Fine Reader 5.0 и порядок распознавания документов Основные операции обработки бумажного документа в программе выполняются с помощью панели инструментов Scan& Read. На панели инструментов программы находятся соответствующие кнопки “Сканировать “, “ Распознать “, “ Проверить “, “ Сохранить “. Можно выполнять указанные операции и через меню Scan& Read в строке команд. Процесс обработки документа состоит из следующих шагов: – сканирование документа; – сегментация документа; – распознавание документа; – редактирование и проверка результата; – сохранение документа. Первый этап работы – сканирование . На этом этапе используют сканер. Чтобы начать сканирование, нужно включить сканер, положить оригинал документа (обычно левой стороной вниз, если только вы не используете ручной сканер) и щелкнуть кнопку “Сканировать “ или в раскрывающемся списке подкоманд данной кнопки использовать пункт Сканировать. Можно задать различные режимы сканирования: Black& White (черно-белый) – предназначен для сканирования текстов и контурных рисунков. Gray (серый) – 256 оттенков серого цвета, используют данный режим для сканирования черно-белых фотографий или для черно-белых принтеров. Color (цветной) – для получения цветных картинок и фотографий. Второй этап работы – сегментация текста. Дело в том, что в бумажном документе, например на странице книги или журнала, текст не всегда располагается в фиксированном порядке. Он может размещаться в нескольких колонках (столбцах), содержать иллюстрации (и подписи к ним), другие элементы форматирования. Дополнительные врезки и данные, представленные в таблицах, также могут запутать естественный порядок текста. Поэтому, прежде чем включать текст в документ, его разбивают на блоки, содержащие цельные фрагменты. Блоки распознают последовательно. Полученный текст включается в документ в порядке нумерации блоков.Сегментация – разбиение документа на блоки. Ручную установку блоков (рамка с помощью левой кнопки мыши) можно применить, если нужно распознать только часть текста. Второй этап работы программы – сегментация. При автоматической сегментации определение границ блока определяется автоматически. При этом учитываются поля документа, просветы между колонками, рамки. Третий этап работы программы – непосредственно распознавание. Этот этап обычно не требует вмешательства пользователя, за исключением тех случаев, когда распознавание сопровождается «обучением». Процесс распознавания будет " иллюстрироваться" закраской участков текста. Точность распознавания FineReader 6.0 около 92- 97 %, так как при печати книг и газет на бумаге иногда не прилипает или осыпается краска. Это будет хорошо видно в окне “Крупный план” с увеличенным масштабом. Результаты распознавания будут отражены в окне “ Текст ”. На четвертом этапе, средствами программы в полученном тексте, можно провести проверку грамматики с помощью соответствующей кнопки “Проверить” на панели инструментов или пунктом Проверить из раскрывающегося списка подкоманд. В результате появится следующее окно диалога Распознанный текст отображается в отдельном окне “Текст”, в виде форматированного текстового документа. Он «теряет связь» с исходным изображением и может редактироваться и форматироваться независимого от него. Программа выделяет цветом те символы, которые она рассматривает как неоднозначно опознанные. Это упрощает поиск ошибок. Пятый этап: по щелчку на кнопке “Сохранить“ на панели инструментов Scan& Read запускается Мастер сохранения результатов. Он позволяет сохранить распознанный текст или передать его в другую программу (например, MS Word) с помощью выбора соответствующего пункта из раскрывающегося списка подкоманд (рис. 5): Выполнение настройки системы Fine Reader При настройке обычно требуется выполнить следующие действия: Установить язык распознавания и тип текста. Язык распознавания и тип текста являются главными параметрами распознавания. Язык текста. При распознавании текста на том или ином языке выбрать нужный язык из списка на панели Распознавание из окна Опции/Распознавание (рис. 6). Этап 1. Запустить сканирование. Нажать кнопку При выполнения сканирования можно добавлять отсканированные страницы в пакет, по умолчанию создаваемый при запуске программы, или можно открыть другой пакет (нажать кнопку Открыть на панели инструментов и записать отсканированные страницы в него). При сегментировании изображения можно изменить тип блока путем вызова контекстного меню. Практическая работа № 8. Тема : Ввод информации с бумажных носителей с пользованием сканера, распознавание текста Освоение соответствующего программное обеспечение». Цель занятия: Изучение основных принципов сканирования данных. Методические указания к практической работе Система сканирования Fine Reader 5.0 Работа с программой Fine Reader 5.0 и порядок распознавания документов Основные операции обработки бумажного документа в программе выполняются с помощью панели инструментов Scan& Read. На панели инструментов программы находятся соответствующие кнопки “Сканировать “, “ Распознать “, “ Проверить “, “ Сохранить “. Можно выполнять указанные операции и через меню Scan& Read в строке команд. Процесс обработки документа состоит из следующих шагов: – сканирование документа; – сегментация документа; – распознавание документа; – редактирование и проверка результата; – сохранение документа. Первый этап работы – сканирование . На этом этапе используют сканер. Чтобы начать сканирование, нужно включить сканер, положить оригинал документа (обычно левой стороной вниз, если только вы не используете ручной сканер) и щелкнуть кнопку “Сканировать “ или в раскрывающемся списке подкоманд данной кнопки использовать пункт Сканировать. Можно задать различные режимы сканирования: Black& White (черно-белый) – предназначен для сканирования текстов и контурных рисунков. Gray (серый) – 256 оттенков серого цвета, используют данный режим для сканирования черно-белых фотографий или для черно-белых принтеров. Color (цветной) – для получения цветных картинок и фотографий. Второй этап работы – сегментация текста. Дело в том, что в бумажном документе, например на странице книги или журнала, текст не всегда располагается в фиксированном порядке. Он может размещаться в нескольких колонках (столбцах), содержать иллюстрации (и подписи к ним), другие элементы форматирования. Дополнительные врезки и данные, представленные в таблицах, также могут запутать естественный порядок текста. Поэтому, прежде чем включать текст в документ, его разбивают на блоки, содержащие цельные фрагменты. Блоки распознают последовательно. Полученный текст включается в документ в порядке нумерации блоков.Сегментация – разбиение документа на блоки. Ручную установку блоков (рамка с помощью левой кнопки мыши) можно применить, если нужно распознать только часть текста. Второй этап работы программы – сегментация. При автоматической сегментации определение границ блока определяется автоматически. При этом учитываются поля документа, просветы между колонками, рамки. Третий этап работы программы – непосредственно распознавание. Этот этап обычно не требует вмешательства пользователя, за исключением тех случаев, когда распознавание сопровождается «обучением». Процесс распознавания будет " иллюстрироваться" закраской участков текста. Точность распознавания FineReader 6.0 около 92- 97 %, так как при печати книг и газет на бумаге иногда не прилипает или осыпается краска. Это будет хорошо видно в окне “Крупный план” с увеличенным масштабом. Результаты распознавания будут отражены в окне “ Текст ”. На четвертом этапе, средствами программы в полученном тексте, можно провести проверку грамматики с помощью соответствующей кнопки “Проверить” на панели инструментов или пунктом Проверить из раскрывающегося списка подкоманд. В результате появится следующее окно диалога Распознанный текст отображается в отдельном окне “Текст”, в виде форматированного текстового документа. Он «теряет связь» с исходным изображением и может редактироваться и форматироваться независимого от него. Программа выделяет цветом те символы, которые она рассматривает как неоднозначно опознанные. Это упрощает поиск ошибок. Пятый этап: по щелчку на кнопке “Сохранить“ на панели инструментов Scan& Read запускается Мастер сохранения результатов. Он позволяет сохранить распознанный текст или передать его в другую программу (например, MS Word) с помощью выбора соответствующего пункта из раскрывающегося списка подкоманд (рис. 5):
Популярное:
|
Последнее изменение этой страницы: 2016-08-31; Просмотров: 1635; Нарушение авторского права страницы