Sunday, Dec 04th

Навигация: Чистка сканированных документов от мусора, устранение перекоса и искажения строк.

Чистка сканированных документов от мусора, устранение перекоса изображения и искажения строк.

Иногда нет времени для того чтобы создать новый документ и необходимо срочно:

  • отредактировать сканированный чертеж или схему, внести в документ дополнения, комментарии;
  • вставить в сканированный рисунок формы документа поля для заполнения;
  • просто получить чистый, без помарок и лишнего грязного фона документ.

Для этого сканированный документ предварительно необходимо преобразовать в черно-белый, при необходимости устранить перекос, и очистить от "мусора".
Предвижу вопрос - почему бы не включить при сканировании черно-белый режим? Можно, но качество полученного изображения в этом случае будет на порядок ниже, чем в рассмотренном примере.

Существуют специализированные программы для этих целей, такие как Spotlight Pro, но они сложны в использовании, и для их освоения требуется значительное время.

Я хочу предложить более простой, но эффективный вариант обработки сканированных документов, с помощью программы оптического распознавания текста ABBYY FineReader 9.0.

Сканировать документ, можно непосредственно из интерфейса программы или вставить для обработки уже сканированный рисунок.

Для наглядности и усложнения задачи, мы возьмем уже сканированный разворот книги, с перекосом страниц и пожелтевшими от времени страницами. Используя программу ABBYY FineReader 9.0, преобразуем рисунок в черно-белый, исправим перекос и очистим от мусора.


Рис. 1
  1. Запускаем программу ABBYY FineReader и в меню Сервис, выбираем команду Опции.
    В открывшемся окне, во вкладке Сканировать/Открыть, отмечаем пункт Не обрабатывать полученные изображения, так как распознавать текст мы не будем - нам нужно только изображение. Выбираем параметры Обработки изображения:


    Рис 2

    Как видим из рисунка, выбрав соответствующие пункты обработки изображения, мы практически полностью можем автоматизировать нашу работу.
  2. В меню Файл, выбираем команду Открыть PDF/изображение..., и выбираем наше изображение (программа поддерживает все распространенные форматы рисунков, а так же pdf и DjVu файлы). В результате, мы получим две страницы черно-белого изображения с исправленным перекосом.


    Рис. 3

  3. Теперь очистим изображение от мусора - мелких точек. Для этого, просто нажмем 1-3 раза кнопку Очистить изображение , при этом наблюдаем за процессом удаления мусора. при первом нажатии удаляются более мелкие точки, а при последующих, крупнее.

    Участок рисунка до начала процесса очистки от мусора.
    Участок рисунка после однократного нажатия на кнопку Очистить изображение
    Участок рисунка после второго нажатия на кнопку Очистить изображение
  4. Теперь, осталось очистить изображение от крупных "клякс" и затемненных участков. Сделать это можно с помощью инструмента Ластик .
    Принцип работы этого инструмента, отличается от работы аналогичных инструментов других распространенных графических редакторов, и конечно в лучшую сторону. В данном случае, отпадает необходимость "ёрзать" пиктограммой листика по изображению, периодически выбирая команду отмена, после нечаянно стертой полезной информации. Стереть участок изображения в программе ABBYY FineReader, можно методом выделения этого участка.
    Удерживая левую кнопку мыши, выделяем участок изображения любых размеров, и, убедившись, что в выделенный участок входят только элементы, предназначенные для удаления, отпускаем кнопку. Выделенный участок очищен.
  5. Осматриваем получившийся очищенный рисунок, и на одной из страниц обнаруживаем небольшой ньюанс. Строки текста слегка искажены. Но оказывается и от этого дефекта сканирования можно легко избавится. Нажимаем кнопку Исправить искажение строк , и дефект исправлен.

    Участок изображения до исправления искажения строк
    Участок изображения после исправления искажения строк
  6. Вот и все, получилось чистое, без перекосов и искажения строк изображение.

    Его можно распечатать, не тратя лишнюю краску на кляксы и грязь, отправить по электронной почте другу, без угрызения совести за не качественный скан, а так же сохранить для дальнейшего использования в любом из поддерживаемых форматов.

    Для сохранения изображения в меню Файл, выбираем команду Сохранить изображение как.... Выбираем любой из поддерживаемых форматов:
    Bitmap, черно-белый (*.bmp; *.dib; *.rle)
    Bitmap, серый (*.bmp; *.dib; *.rle)
    Bitmap, цветной (*.bmp; *.dib; *.rle)
    DCX, черно-белый (*.dcx)
    DCX, серый (*.dcx)
    DCX, цветной (*.dcx)
    JBIG2 (*.jb2; *.jbig2)
    JPEG 2000, серый (*.jp2; *.j2k)
    JPEG 2000, цветной (*.jp2; *.j2k)
    JPEG, серый (*.jpg; *.jpeg)
    JPEG, цветной (*.jpg; *.jpeg)
    PCX, черно-белый (*.pcx)
    PCX, серый (*.pcx)
    PCX, цветной (*.pcx)
    PNG, черно-белый (*.png)
    PNG, серый (*.png)
    PNG, цветной (*.png)
    TIFF, черно-белый, несжатый (*.tif; *.tiff)
    TIFF, черно-белый, packbits (*.tif; *.tiff)
    TIFF, черно-белый, сжатие: ZIP (*.tif; *.tiff)
    TIFF, черно-белый, сжатие: LZW (*.tif; *.tiff)
    TIFF, черно-белый, Group4 (*.tif; *.tiff)
    TIFF, серый, несжатый (*.tif; *.tiff)
    TIFF, серый, Packbits (*.tif; *.tiff)
    TIFF, серый, сжатие: JPEG (*.tif; *.tiff)
    TIFF, серый, сжатие: ZIP (*.tif; *.tiff)
    TIFF, серый, сжатие: LZW (*.tif; *.tiff)
    TIFF, цветной, несжатый (*.tif; *.tiff)
    TIFF, цветной, Packbits (*.tif; *.tiff)
    TIFF, цветной, сжатие: JPEG (*.tif; *.tiff)
    TIFF, цветной, сжатие: ZIP (*.tif; *.tiff)
    TIFF, цветной, сжатие: LZW (*.tif; *.tiff)
    PDF (*.pdf)




Хочется отметить, многие в настоящее время переводят свои документы (четежи, схемы, книги...) в электронный вид. При большом объеме работ, удобнее использовать для этих целей фотоаппарат. С некоторыми моделями сканеров и фотоаппаратов, поддерживающих функцию переснятия документов, программа ABBYY FineReader, идет в комплекте. При выборе инструмента для перевода документов в электронный вид, следует учесть это, так как FineReader, с учетом её основного назначения - оптического распознования текста, для тех, кто работает с документами не менее полезная программа, чем текстовый редактор.

© 2016 Электричество и схемы.