OCRFeeder - распознавание текста. Программы для Linux

OCRFeeder

8
Распознавание текста
Оценка пользователей
зарегистрируйтесь, чтобы ставить оценки
Добавить в мои программы
зарегистрируйтесь, чтобы получить доступ к этим функциям
OCRFeeder

OCRFeeder — программа для автоматического распознавания текста. Поддержка импорта и экспорта документов. Автоматическое определение макета документа.

В качестве входных данных программа принимает файлы изображений (поддерживаются все популярные форматы) или PDF файлы, а также изображения со сканера (через программу SANE).

OCRFeeder автоматически анализирует файлы и выполняет распознавание, умеет анализировать макет документа, различая графику, текст, блоки текста, параграфы и абзацы.

Интерфейс программы выполнен достаточно аккуратно. В центре главного окна находится рабочая область — редактор документа. Слева миниатюры страницы, а справа панель форматирования, коррекции текста и дополнительные параметры.

OCRFeeder позволяет через графический интерфейс выполнять коррекцию текста, исправлять нераспознанные символы, устанавливать стили абзацев, удалять изображения, выделять и корректировать блоки текста на странице. Поддерживается проверка орфографии.

Поддерживается несколько форматов экспорта распознанных документов: ODT (OpenDocument Format), обычный текстовый файл, HTML, PDF. Основным является формат ODT.

Рабочий проект можно сохранить для последующего редактирования.

Также есть режим работы программы через командную строку (исполняемый файл ocrfeeder-cli).

OCRFeeder использует «внешние» движки распознания текста. Это могут быть, например, Tesseract, Ocrad, GOCR, Cuneiform. Результат распознавания может сильно зависеть от конкретного движка. У меня, например, Tesseract почему-то вообще не заработал. Если конкретный движок поддерживает русский язык, тогда программа сможет его распознать. Выбирать движок можно прямо из программы.

Изначально OCRFeeder был разработан как проект магистерской диссертации по информатике программиста Хоакима Роши (Joaquim Rocha).

Установка

Установка через Flatpak

Установка:

flatpak install flathub org.gnome.OCRFeeder

Запуск:

flatpak run org.gnome.OCRFeeder

Установка в Ubuntu (LinuxMint)

sudo apt install ocrfeeder

Установка в ArchLinux (Manjaro)

sudo pacman -S ocrfeeder

Установка в ArchLinux из AUR

git clone https://aur.archlinux.org/ocrfeeder-git.git
cd ocrfeeder-git
makepkg -sri

Разработка

Разрабатывается в рамках проекта:
Исходный код:
  • Open Source (открыт)
Языки программирования:
  • Python
Библиотеки:
  • GTK
Приложение переведено на русский язык.

Сайт:

OCRFeeder
Лайков: +5
войдите, чтобы ставить лайки
8
  • Опубликовано: 23.06.2017

Скриншоты программы

Смотрите также

Комментарии

Cherry
03.08.2017
19:16
Постоянная ссылка на комментарийПостоянная ссылка на комментарий
+1
войдите, чтобы ставить лайки
программа не запускается на линукс минт вообще 18 версия, просто моргает и все, и ничего, давайте как то исправляйте пожалуйста.
ness
Активный пользователь
Активный
05.08.2017
18:52
Постоянная ссылка на комментарийПостоянная ссылка на комментарий
+1
войдите, чтобы ставить лайки
yuriy, во второй абзац опечатка закралась')
ilia
10.01.2018
22:42
Постоянная ссылка на комментарийПостоянная ссылка на комментарий
+1
войдите, чтобы ставить лайки
linux mint 18.2 cinnamon 64-bit запускается из консоли норм (из меню кликом не запускается)
Григорий
12.06.2018
13:53
Постоянная ссылка на комментарийПостоянная ссылка на комментарий
+1
войдите, чтобы ставить лайки
Запускается из консоли. Текст не распознаёт! Совсем. Капец! Каждую букву пытается распознать как отдельную текстовую область!
vovan
07.08.2019
09:38
Постоянная ссылка на комментарийПостоянная ссылка на комментарий
+1
войдите, чтобы ставить лайки
Тоже устанавливал в Mint 19.1 - запускалась только из командной строки. Текст распознанный отображает частью в латинице, а часть кракозябрами. При попытке настройки языка сразу закрывается. Короче хрень, а не программа.
Ярослав
21.09.2019
20:25
Постоянная ссылка на комментарийПостоянная ссылка на комментарий
+2
войдите, чтобы ставить лайки
Чтобы программа распознавала русский текст, нужно поставить языковой пакет для ocr движка Tesseract: sudo apt-get install tesseract-ocr-rus.
Александр
19.05.2020
13:25
Постоянная ссылка на комментарийПостоянная ссылка на комментарийРодительский комментарийЯрославРодительский комментарий
+1
войдите, чтобы ставить лайки
+100500 к карме
FreeStyler
21.06.2020
08:23
Постоянная ссылка на комментарийПостоянная ссылка на комментарий
+1
войдите, чтобы ставить лайки
Автор! Внеси в статью коммент выше
Чтобы программа распознавала русский текст, нужно поставить языковой пакет для ocr движка Tesseract: sudo apt-get install tesseract-ocr-rus.

Написать комментарий

Ваше имя:
Текст комментария:
  • Уважать других.
  • Не ругаться.
  • Без оскорблений.
  • Без грубости.
  • Не переходить на личности.
  • Писать на русском языке.
  • Без политики.
  • Без флуда.
Правила