Информатика. Часть 2 - Учебное пособие (Артьомова С.В.)

Лабораторная работа № 1 сканирование документа и преобразование изображения в текстовый документ. создание  шаблона для  распознавания бланков

Порядок выполнения

Сканирование документа

1   Включите сканер. Включите компьютер в режиме Windows.

2   Запустите программу Imaging (Пуск > Программы > Стандартные > Imaging).

3   Откройте крышку сканера, положите документ на окно сканера текстом вниз, закройте крышку.

4   Дайте команду Файл > Сканировать.

5 Средствами  открывшегося  диалогового  окна  драйвера  TWAIN       проведите предварительное сканирование документа.

6   Средствами  диалогового  окна  драйвера  TWAIN  выделите  на  документе  область,

подлежащую сканированию.

7   Средствами   диалогового   окна   драйвера   TWAIN   задайте   черно-белый   режим   и разрешение сканирования.

8   Средствами диалогового окна драйвера TWAIN проведите сканирование.

9   Закройте диалоговое окно драйвера TWAIN.

10 Ознакомьтесь с тем, как выглядит отсканированный документ. Увеличьте масштаб изображения, чтобы оценить качество воспроизведения отдельных символов.

11 Сохраните отсканированный     документ        в          формате          TIFF    для      последующего           его

использования.

На этом  этапе  Вы научились выполнять сканирование документов из приложений через драйвер  TWAIN. Это   наиболее универсальный метод,   применимый во  всех  приложениях, которые  допускают использование сканера.

Преобразование изображения в текстовый документ

1   Запустите программу FineReader (Пуск > Программы * ABBYY FineReader > FineReader

4.0 Professional).

В  настоящее   время  достаточно  широко  используются  версии FineReader  5.0  и  6.0

Professional.     Эти  версии отличаются  дополнительными возможностями,  например, позволяют  открывать  и  распознавать   PDF-файлы,     а  так же   используют  улучшенный алгоритм распознавания.  Работа с ними аналогична работе с рассматриваемой  версией.

2   Откройте крышку сканера, положите документ на окно сканера текстом вниз, закройте крышку сканера.

3   Щелкните на кнопке Сканировать на панели инструментов Scan&Read.

4 Дождитесь окончания сканирования. Обратите внимание на появление значка отсканированного документа на панели Пакет и окна Изображение.

5  Щелкните на кнопке Сегментировать на панели инструментов Scan&Read. Изучите результат автоматической сегментации.

6   Щелкните на кнопке Распознать. Ознакомьтесь с распознанным текстом в окне Текст.

7   Сохраните распознанный текст в виде текстового файла.

8   Откройте текстовый файл в программе Блокнот и еще раз убедитесь в правильности распознавания. Закройте программу Блокнот.

9   Дайте команду Файл > Открыть и выберите изображение, созданное при сканировании документа с помощью драйвера TWAIN.

10 Выберите это изображение в окне Пакет и проведите его распознавание (см. пп. 5 – 7).

11 Сравните результаты распознавания при сканировании через TWAW-драйвер и в обход его. Сравните трудоемкость этих операций.

Вы научились преобразовывать  бумажные  документы в электронную форму при помощи программы FineReader,  и   познакомились с возможностью работы с пакетом  страниц.  Вы также выяснили преимущества методов  сканирования с использованием TWAIN-драйвера и в обход его.

Ручная  сегментация изображения

1   Включите сканер (если Вы его выключили после выполнения предыдущего задания).

2   Запустите программу FineReader (Пуск > Программы > ABBYY FineReader > FineReader

4.0 Professional).

3   Откройте крышку сканера, положите документ на окно сканера текстом вниз, закройте крышку.

4  Щелкните на кнопке Сканировать на панели инструментов Scan&Read и дождитесь окончания сканирования.

5   Щелкните на кнопке Сегментировать на панели инструментов Scan&Read.

6   Щелкните на кнопке Распознать на панели инструментов Scan&Read. Ознакомьтесь с тем, как проведено упорядочение распознанного текста в соответствии с автоматической сегментацией. Оцените пригодность полученного документа.

7   Закройте окно Текст. Полученный документ предварительно сохраните для сравнения.

8   Щелкните в окне Изображение правой кнопкой мыши и выберите в контекстном меню команду Удалить все блоки.

9   Сформируйте блоки вручную, выделяя отдельные элементы документа.

10 Чтобы блоки, содержащие иллюстрации, не распознавались как текст, щелкните на каждом из них правой кнопкой мыши и выберите в контекстном меню команду Тип блока > Картинка.

11 Щелкните  на  кнопке  Перенумеровать  блоки  на  панели  Инструменты.  Задайте последовательность блоков, щелкая на них в том порядке, в каком их содержимое должно включаться в окончательный документ.

12 Щелкните на  кнопке  Распознать на  панели  инструментов Scan&Read. Сохраните полученный документ (При сохранении Вы можете воспользоваться Мастером сохранения, что позволит Вам более удобно выбрать параметры сохранения документа).

13 Сравните документы, полученные в результате автоматической и ручной сегментации.

Вы научились производить ручную сегментацию изображения для распознавания и узнали, в каких случаях ее следует производить. Вы также узнали, как задается тип блоков и порядок блоков, чтобы полученный документ наилучшим образом соответствовал оригиналу.

Создание шаблона  для распознавания бланков

1   Включите сканер.

2   3aпустите программу FineReader Forms (Пycк > Пpoгpaммы   > ABBYYFineReader > FineReader 4.0 Forms).

3  Откройте крышку сканера, положите бланк на окно сканера текстом вниз, закройте крышку.

4   Дайте команду Файл > Новый.

5   Задайте имя пакета и место его размещения, после чего щелкните на кнопке Далее.

6   Установите переключатель Создать новый и щелкните на кнопке Далее.

7   Введите имя шаблона и щелкните на кнопке Далее.

8  Установите переключатель Отсканировать и щелкните на кнопке Далее. Дождитесь окончания сканирования. Щелкните на кнопке Готово.

9   Создайте  блоки,  охватывающие постоянные поля  («разметку»)  бланка.  Для  каждого такого блока на вкладке Блок диалогового окна Параметры задайте тип Статический.

10 Создайте блоки, охватывающие переменные (заполняемые) поля бланка. Для каждого такого поля установите флажок Экспортируемый блок и задайте имя поля базы данных (Поле БД).

11 Завершив разметку бланка, щелкните на кнопке Закрыть на панели инструментов.

12 После закрытия редактора шаблонов снова отсканируйте тот же бланк, но уже для распознавания (кнопка Сканировать на панели инструментов Open&Read).

13 Щелкните на кнопке Наложить шаблон на панели инструментов Open&Read.

14 Щелкните на кнопке Распознать на панели инструментов Open&Read.

15 Ознакомьтесь с заполненной формой, полученной в результате распознавания.

16 Сохраните документ в виде таблицы Excel.

Вы научились обрабатывать бланки, имеющие предопределенную структуру. Вы также узнали, как сохранять результаты распознавания в виде, удобном для дальнейшей обработки.