Как распознать отсканированный текст. Работаем с ABBYY FineReader

Главная - Новости 11 июня, 2011

Как распознать отсканированный текст. Работаем с ABBYY FineReader

Несмотря на вездесущее проникновение компьютерных технологий, огромное количество информации хранится на бумажных носителях, в книгах, газетах и журналах. Частенько её приходится переводить в электронный вид, набирая вручную на клавиатуре или воспользовавшись специальным устройством – сканером. Но вот беда, сканер воспринимает текст документа в виде изображения, которое как-то нужно сохранить в Microsoft Word с возможностью дальнейшего редактирования. Это не проблема, если на компьютере имеется специальная программа для распознавания отсканированного текста. Сегодня мы рассмотрим установку и работу одной их таких программ – ABBYY FineReader. ABBYY FineReader – один из мировых лидеров в области распознавания документов. Программа очень проста в установке и настройке, обладает интуитивно понятным интерфейсом и поддерживает несколько языков распознавания текста. Скачать последнюю версию FineReader вы можете с официального сайта программы http://www.abbyy.ru/finereader/. Для домашнего использования подойдет ABBYY FineReader 9.0 Home Edition.

Для установки программы запустите скаченный файл и нажмите кнопочку «Install». Установочные файлы FineReader будут распакованы во временную папку Temp на диске С: вашего компьютера.

 

1

Выберите язык программы (Русский) и нажмите кнопочку «ОК».

2

Прочитайте и примите лицензионное соглашение и нажмите «Далее» для продолжения установки FineReader.

3

В следующем окошке указываются опции интеграции FineReader с Проводником Windows и программами из пакета Microsoft Office (Word, Excel), а также папка, в которую будет установлен FineReader. Оставьте все настройки, как есть, и просто нажмите «Далее».

4

Для начала установки нажмите кнопочку «Установить».

5

Подождите, пока FineReader инсталлируется на компьютер. По окончании данного процесса нажмите «Готово». Программа автоматически запустится.

6

Пробная версия ABBYY FineReader 9.0 Home Edition действует 14 дней и рассчитана на обработку 50 страниц. По окончании тестового периода и исчерпания лимита страниц, программу нужно будет приобрести в вечное пользование. Для работы в тестовой версии FineReader нажмите кнопочку «Запустить ABBYY FineReader 9.0 Home Edition».

7

В процессе установки FineReader автоматически найдет имеющийся на компьютере сканер. Вам останется лишь положить на стекло сканера приготовленный бумажный документ и выбрать в окошке FineReader нужную задачу. Учтите, что сканер должен быть подключен к компьютеру, включен в сеть, а также для него должны быть установлены все необходимые драйверы.
Чтобы отсканировать и распознать текст, сохранив его в формате Microsoft Word, в окошке Выбора сценариев нажмите «Сканировать в другие форматы».

8

Далее всё будет зависеть от модели вашего сканера. Многие сканеры имеют режим Предварительного просмотра, который позволяет увидеть сканируемый документ и определить параметры сканирования еще до запуска оного процесса. При настройке параметров рекомендуем установить разрешение сканирование не менее 300 dpi.

9

Для запуска сканирования документа нажмите кнопочку «Сканировать». Вам придется подождать некоторое время, пока сканер отсканирует документ и передаст его в FineReader в виде изображения.

10

Теперь изображение документа необходимо распознать и преобразовать в текст, а затем сохранить в Word. Прежде, чем приступить к распознаванию, FineReader автоматически выделит в документе области с текстом, картинками и таблицами. При необходимости программа также перевернет отсканированный документ по направлению текста.

11

Сейчас самое время выбрать язык распознавания в списке «Язык документа». Если документ содержит текст на разных языках, выбирайте «Авто».

12

В списке «Конвертировать в» выберите формат, в который будет сохранен отсканированный документ. Для последующего редактирования документа подходит формат Word. Если вы отсканировали таблицу, выбирайте «Microsoft Excel». Чтобы сохранить отсканированный документ на компьютере в виде картинки выберите «Файл изображения». Если вам необходимо перевести отсканированный и распознанный документ в файл формата PDF, выбирайте соответствующий пункт.

13

Определившись с языком и форматом документа, займемся выделенными областями. На отсканированном документе текстовые области выделены зеленым цветом, картинки – красным, а таблицы — синим. Соответственно, каждая область будет распознана в зависимости от ее типа.
Работать с областями позволяет раздел «2. Проверьте области» на панели инструментов в правой части окна FineReader. Так, чтобы удалить область нажмите «Удалить область» и щелкайте мышкой по областям, которые хотите удалить. Можно удалить все картинки и текстовые области кроме той, тест в которой вам нужно распознать и сохранить.
Чтобы выделить текстовую область, щелкните по кнопке «Выделить область Текст» и обведите границы нужного текстового блока рамкой (двигайте мышь с нажатой левой кнопкой). Для выделения картинки выберите соответственно «Выделить область Картинка», а для таблицы – «Выделить область Таблица».
В FineReader также можно изменять размеры выделенной области: на отсканированном изображении щелкните по нужной области мышкой, наведите курсор на границу области до появления стрелочки, нажмите левую кнопку мышки и, не отпуская её, перемещайте мышь.

14

После того, как нужные области выделены, можно приступать к распознаванию текста и сохранению результатов в выбранном формате. Для этого нажмите кнопочку «Конвертировать».

15

Несколько секунд вы будете наблюдать за экспортом результатов распознавания, а потом вам потребуется задать имя файла, выбрать формат и место для сохранения распознанного документа. Для сохранения в формате Microsoft Word выбирайте «Rich Text Format (*.rtf)».

16

Документ готов! Можете сравнить полученный в результате распознавания текст с оригиналом и поправить имеющиеся ошибки. Обычно FineReader отлично распознает тексты, но, тем не менее, при плохом качестве исходника некоторые слова могут быть распознаны неверно.
Отсканированный документ можно не только распознать и конвертировать в один из форматов, но и просто сохранить в виде картинки без распознавания. Для этого в меню «Файл» FineReader выберите пункт «Сохранить изображение». В появившемся окошке введите имя файла, выберите формат и место сохранения картинки.

17

Помимо распознавания текста с отсканированных документов FineReader Home Edition умеет распознавать текст с сохраненных на компьютере изображений. Примером картинки с текстом служит результат снимка экрана (скриншот) или фотография документа, сделанная цифровым фотоаппаратом. Чтобы открыть такое изображение в меню «Файл» выберите пункт «Открыть новое изображение и», а деле выберите формат конвертирования – PDF или другие форматы.

18

Появится окошко, в котором вам предстоит найти нужное изображение. Выделите его и нажмите кнопочку «Открыть». Картинка попадет в программу FineReader. Дальнейшие действия ничем не отличаются от работы с отсканированными документами.

19

Как видите, работать в FineReader Home Edition очень просто. Программа быстро переводит документы из бумажного вида в электронный, сохраняя распознанный текст, изображения и таблицы в нужном вам формате.

 

Специально для Ячайник, Елена Карлтон

  • как работать в файн ридер 11 сканировать документ
  • как заставить finereader все распознать
  • как распознать текст через fine reader

Читайте также о Как распознать отсканированный текст. Работаем с ABBYY FineReader


Особенности ABBYY FineReader 10 Corporate Edition
ABBYY FineReader 10 Corporate Edition – как ввести и распознать документы в промышленных масштабах? Идея перевода организаций на решения в области
Corel Draw. Урок третий. Собираем открытку
Corel Draw. Урок третий. создать открытку в Corel Я рада приветствовать уважаемый читатель. В предыдущих статьях мы с вами рисовали
Меняем заголовок окна регистрации
Диалоговое окно, которое отображается при нажатии комбинации клавиш SAS (Secure Attention Sequence — <Ctrl+Alt+Del>) имеет заголовок Windows Security. Для того, чтобы


Комментировать

*