[LINUX] Kompilieren Sie Tesseract für Tess4J, um Bilder mit CentOS zu transkribieren

Dinge notwendig

VirtualBox (Java ist schließlich wunderbar.) Disk-Image von CentOS6.3 (iso)

Virtuelle Umgebung

Verfahren

Stellen Sie die VM ein

Sie werden gefragt, ob Sie den Build zuerst testen möchten, aber den Test überspringen möchten. Aus irgendeinem Grund kann ich nicht weitermachen. Danach fahren Sie so fort, wie es ist. Installieren Sie alle in der Desktop-Version.

Interneteinstellungen

Zuerst ist das Netz nicht verbunden, also stellen Sie es ein. Starten Sie das Terminal und wechseln Sie die Superuser

su - 

Spielen Sie mit den folgenden Dateien mit vi. (Einfügemodus mit i, Escape mit esc, Überschreiben mit: wq!)

vi /etc/sysconfig/network-scripts/ifcfg-eth0

ONBOOT = yes #no in yes geändert

Starten Sie den Dienst neu.

service netowrk restart

Überprüfen Sie, ob FireFox verbunden werden kann, und ob es verbunden ist, ist es in Ordnung. (Je nach Hardware muss möglicherweise der Treiber installiert werden.)

Andere Updates

Starten Sie das Terminal, Super User Switching

su - 

aktualisieren

yum update

Aktualisiere Java auf 1.8 (in der Entwicklungsversion)

#Weil es auch an javac übergeht.
yum install java-1.8.0-openjdk-devel

Eclipse Neon Installieren Sie Eclipse Neon (Versionsfehler in der Zeichnungsbibliothek, wenn es mehr als dies ist) https://www.eclipse.org/downloads/packages/release/neon/3

Ich gehe davon aus, dass Sie tess4j in Ihrem Maven-Projekt verwenden.

Installieren Sie Entwicklungstools und kompilieren Sie tesseract

Entwicklungswerkzeug (gcc erfordert 4.7 oder höher)

#Entwicklungswerkzeuge
yum -y groupinstall "development tools"
#Periphere Bibliothek
yum -y install libpng-devel libtiff-devel libjpeg-devel
#Für die Kompilierung benötigte Tools
yum -y install centos-release-scl
#Compiler
yum -y install devtoolset-7-gcc-c++

Aktivieren Sie die gescannte Umgebung

Dies muss jedes Mal im Terminal erfolgen, sofern dies nicht in der Voreinstellungsdatei festgelegt ist.

source /opt/rh/devtoolset-7/enable

Installation der für die Kompilierung erforderlichen Tools

cd /usr/src/
wget http://ftpmirror.gnu.org/autoconf-archive/autoconf-archive-2019.01.06.tar.xz
tar xvvfJ autoconf-archive-2019.01.06.tar.xz
cd autoconf-archive-2019.01.06/
./configure --prefix=/usr
make
make install

Kompilieren und installieren Sie das Bildverarbeitungsprogramm von Tesseract.

cd /usr/src/
wget http://leptonica.org/source/leptonica-1.77.0.tar.gz
tar xvvfz leptonica-1.77.0.tar.gz
cd leptonica-1.77.0/
./configure --prefix=/usr/local/
make
make install

Kompilieren und installieren Sie Tesseract

Diesmal 4.1.1-rc2

cd /usr/src/
wget https://github.com/tesseract-ocr/tesseract/archive/4.1.1-rc2.tar.gz
tar xvvfz 4.1.1-rc2.tar.gz #Aus irgendeinem Grund fehlt der Name Tesseract lol. Nur diese Version.
cd tesseract-4.1.1-rc2 
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
./autogen.sh
./configure --prefix=/usr/local/ --with-extra-libraries=/usr/local/lib/ --disable-openmp
make install

Wenn es erfolgreich gemacht wurde, ist alles in / usr / local / lib / Erstellen Sie einen "linux-x86-64" -Ordner, wo immer Sie möchten Kopieren Sie dies. cp file file... dir

Kopieren Sie dies direkt in den Ordner src / main / resources des Projekts, das Tesseract of Eclipse verwendet

Starten Sie Eclipse vom Terminal aus

Stellen Sie zuerst irgendwie das Gebietsschema ein. (https://github.com/nguyenq/tess4j/issues/105)

export LC_ALL=C

Geben Sie in diesem Zustand den Pfad der Startdatei von Eclipse in das Terminal ein und starten Sie es.

Softwareveröffentlichung

Wenn Sie Ihr eigenes Java-Programm kompilieren können, Enthält jar, den Ordner tessdata und den kompilierten Ordner "linux-x86-64".

Beim Testen in einem Terminal in einer ähnlichen Umgebung exportiere dann LC_ALL = C. Befehl.

das ist alles.

Wo ich feststeckte

Reference

Visionary Imaging Services, Inc. Tatsuaki Kobayashi

Recommended Posts

Kompilieren Sie Tesseract für Tess4J, um Bilder mit CentOS zu transkribieren
Konvertieren Sie mit Python für .NET von Pandas DataFrame in System.Data.DataTable
Wechseln Sie von Python2.7 zu Python3.6 (centos7)
Laden Sie Bilder von "Irasutoya" mit Scrapy herunter
Geotag-Vorhersage aus Bildern mit DNN
Poste ein Bild von Python auf Tumblr
Von Python bis zur Verwendung von MeCab (und CaboCha)
Herstellen einer Verbindung von Python zu MySQL unter CentOS 6.4
Python> Ausgaben von 1 bis 100, 501 bis 600> Für CSV