Project

General

Profile

Настройка Tesseract-ocr

Официальный сайт пакета Tesseract-ocr . Установка варьируется в зависимости от платформы. Мы приводим вариант для Debian-lenny.

В каталоге glassfish domains/domain1/config создать файл docero-tesseract.xml Пример такого файла для MS Windows:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>DOCERO SYSTEM PROPERTIES</comment>
<entry key="TesseractPath">D:\tesseract\Tesseract-OCR</entry>
<entry key="TesseractBin">tesseract.exe</entry>
<entry key="TesseractLang">rus</entry>
</properties>

Для Debian меняем пути

<entry key="TesseractPath">/usr/local/tesseract/bin</entry>
<entry key="TesseractBin">tesseract</entry>

После перезапуска сервера Glassfish система Docero сразу начнёт использовать Tesseract установленный на Вашем сервере, только не забудьте что пользователь из под которого запускается Ваш Glassfish должен иметь доступ к каталогу Tesseract для чтения и выполнения файлов.