gImageReader - извлечение текста из изображений и PDF-файлов в Linux

gImageReader — это бесплатный аналог коммерческих программ для оптического распознавания символов, так как например ABBYY FineReader.

Она позволяет извлекать текст из изображений и PDF-файлов и построена как простой интерфейс для Tesseract-OCR, движка OCR для распознавания текстов и шаблонов в документах и изображениях с использованием искусственного интеллекта.

Сам по себе Tesseract — это инструмент командной строки, который может использоваться только пользователями Linux, достаточно знакомыми со своими терминалами. Благодаря gImageReader теперь каждый может воспользоваться преимуществами системы распознавания текста.

gImageReader работает путем сканирования текстов из PDF-файлов или файлов изображений на любом из нескольких языков, которые он поддерживает, благодаря наличию символов Unicode. Он имеет простой, хорошо организованный настраиваемый пользовательский интерфейс, с помощью которого вы можете выполнять задачи проверки орфографии и перевода.

Возможности gImageReader:

Исходный код доступен на GitHub.
Доступно на платформах GNU/Linux и Windows.
Тематический интерфейс со знакомым макетом редактирования.
Импортируйте PDF-документы и изображения с диска, сканирующих устройств, снимков экрана и буфера обмена.
Создавайте документы PDF из документов hOCR.
Ручное или автоматическое определение области распознавания.
Обработка нескольких изображений и документов в пакетном режиме.
Распознавать в документы hOCR или в обычный текст.
Распознанный текст отображается рядом с изображениями.
Постобработка распознанного текста, включая проверку орфографии.

gImageReader прост в использовании и поддерживает работу с электронными копиями документов, а также со снимками загруженных с носителей, например скриншоты. У вас даже есть возможность выбрать интересующую вас область текста и добавить только нужный вам текст. В конечном итоге gImagereader работает как программа для чтения PDF-файлов и как инструмент для извлечения текста.

Вы даже можете распознавать текст на снимках сделанных вашим телефоном. Что еще круче, так это то, что есть многоязычная поддержка.
Программа не идеальна, но уже сейчас является одним из лучших вариантов.

Установите gImageReader в Linux

Чтобы использовать gImageReader в полной мере, вы должны вручную установить языковые пакеты Tesseract, чтобы вы могли правильно анализировать изображения и файлы. Пакет называется «tesseract-ocr» и доступен в диспетчере программного обеспечения в дистрибутивах Debian и Fedora. Именно он занимается распознаванием текста.

Если вы используете Ubuntu, вы можете просто добавить PPA и запустить команду установки, используя следующие команды:

$ sudo add-apt-repository ppa:sandromani/gimagereader
$ sudo apt update
$ sudo apt install gimagereader

В Debian, Fedora и OpenSUSE установите его из диспетчера пакетов.

$ sudo apt install gimagereader     [для Debian]
$ sudo dnf install gimagereader     [для Fedora]
$ sudo zypper install gimagereader  [для OpenSuse]

Не почувствуйте себя обделенным, если вы используете Arch Linux или любой из его производных. AUR позаботится о вас. А если вы предпочитаете собрать приложение из исходного кода, то инструкции можно найти в его Wiki-ссылке на репозитории GitHub.

Итог

gImageReader — одна из лучших программ для распознавания текста в мире с открытым исходным кодом, так что попробуйте и посмотрите, насколько она вам нравится.

Как обычно, вы можете поделиться с нами своим опытом использования приложения, если он у вас есть. И добавить другие предложения в разделе комментариев ниже.
Делиться опытом — это забота о других …