Login



agorum core
Willkommen, Gast
Aw: OCR Erkennung unter Linux (1 Leser) (1) Gast
Zum Ende gehen Neues Thema Beliebt: 0
THEMA: Aw: OCR Erkennung unter Linux
#10520
jhub (Benutzer)
Fresh Boarder
Beiträge: 1
graphgraph
Benutzer offline Hier klicken, um das Profil dieses Benutzers zu sehen
OCR Erkennung unter Linux vor 2 Monaten, 3 Wochen Karma: 0  
Hallo,

als aller erstest möchte ich mal mein Lob aussprechen agorum core ist wirklich ein gutes und umfangreiches Produkt, ebenso die Dokumentation ist umfangreich und sehr gut und wird mit den Videos noch umfangreicher Top! Davon können sich viele Hersteller eine Scheibe abschneiden, das hat man echt selten.

Auch wenn ich den Teil der OCR Installation noch als etwas undurchsichtig sehe, das könnte aber auch daran liegen das ich genau damit noch ein Problem habe.

Wenn ich alles richtig gedeutet habe ist es mittlerweile möglich die OCR Installation vollumfänglich auf einem Linux System auf dem auch Agorum installiert ist durchzuführen?

Diesen Ansatz habe ich auch gewählt und die Installation nach folgender Anleitung durchgeführt:

https://agorumdocproxy.agorum.com/roiwebui/acds_module/overview2/index.html#/7a345050-e913-11e9-a3bc-005056aa0ecc/e3694930-6165-11e9-945c-005056aa0ecc/]agorum core ocr engine auf Debian Linux installieren

Das scheint soweit auch alles funktioniert zu haben, der unter Punkt 3 genannte Test gibt folgenden Output:
Code:

root@hostname:/opt/agorum/agorumcore/ocr/bin# wine ReadIRISOCRConverter.exe
Work directory: Z:\opt\agorum\agorumcore\ocr\bin
Usage: OCRConverter.exe Input-Folder Output-ZIP-File [additional-arguments]
Running with arguments:
--engine-version:1
--text-detection:True
--icr-encoding:UTF-8
--ocr-encoding:UTF-8
--perform-line-removal:False
--lr-horiz-minlength:128
--lr-vertic-minlength:50
--lr-horiz-maxthick:16
--lr-vertic-maxthick:4
--barcode-detection:True
--barcode-types:all
possible values: Codebar,Code128,Code39,Code39Ext,Code39Hibc,Code93,Ean13,Ean8,I2OF5,Msi,Msiph,Patchcode,Pdf417,Postnet,Postnet32,Postnet52,Postnet62,QrCode,Ucc128,Upca,Upce,DataMatrix
common barcodes: Code128,Ean13,Ean8,I2OF5,QrCode
--barcode-perform-line-removal:False
--barcode-lr-horiz-minlength:300
--barcode-lr-vertic-minlength:300
--barcode-lr-horiz-maxthick:16
--barcode-lr-vertic-maxthick:4
--barcode-encoding:UTF-8
--bitonal-smooth-level:0
--bitonal-auto:True
--bitonal-threshold:0
--bitonal-brightness:0
--bitonal-contrast:20
--despeckle:False
--despeckle-size:0
--despeckle-dilate:0
--deskew:True
--worker-threads:1
--create-bitonal-image:False
--create-pdf-output:False
--pdf-output-bookmarks:True
--use-bitonal-image:False
--from-page:1
--to-page:2147483647
--rect-left:-1
--rect-top:-1
--rect-right:-1
--rect-bottom:-1
--font-details:False
--work-depth:0

Press any key...


Ebenso Schritt 4 habe ich durchgeführt, jedoch habe ich leider keine Möglichkeit gefunden zu testen ob das soweit funktioniert hat. Die Installation verlief zumindest erfolgreich.

Die OCR Erkennung soll auch direkt auf die PDF Datei angewendet werden, auch hierfür gibt es einen Möglichkeit die auch dokumentiert ist Top!:

https://agorumdocproxy.agorum.com/roiwebui/acds_module/overview2/index.html#/7a345050-e913-11e9-a3bc-005056aa0ecc/2c35b7d0-8e61-11e8-9cae-005056aa0ecc/]Durchsuchbares PDF durch OCR erstellen

Dies habe auch soweit angewendet. Den Punkt "OCRPdfSaveAs" find ich etwas uverständlich wie genau die Konfiguration aussehen soll. Ich habe das jetzt erstmal in der default Einstellung belassen. Dadurch würde ja im "schlimmsten" Fall eine weitere Datei generiert. Der Punkt "OCRPdfOverwriteExistingFile" steht ja bereits auf True im Standard, dies habe ich auch belassen. Am Ende soll die neue Datei in eine neue OCR Datei überschrieben werden.

Schritt 2 habe ich auch durhcgeführt:

convertimage2pdf

Unix: Hier habe ich den Vorhandenen Punkt "Parameter" angepasst und um einen dritten Wert erweitert.
Windows: Hier habe ich den Vorhandenen Punkt "Parameter" angepasst und um einen dritten Wert erweitert.

Das wirkt in der Doku etwas unverständlich da für diesen Punkt beide Einträge vorhanden sind. Das kommt vermutlich da die OCR Engine durch wine emuliert wird.

convertimage2pdf

Unix: Hier habe ich den Vorhandenen Punkt "Parameter" angepasst und um einen dritten Wert erweitert.

Leider konnte ich keine Bilder anfügen daher nur in schriftlicher Ausführung.

So wie ich das Testen verstanden habe, reicht es eine PDF Datei in irgendeinem Ordner in der agorum Struktur abzulegen. Dazu gibt es sogar ein Video Perfekt!
Das habe ich auch getestet und sehe im "top" eine "iris.exe" (genauen Namen konnte ich so schnell nicht festhalten) kurz aufblizen. Es wirkt also so als würde das System etwas "tun".

Mein Problem ist jedoch dass, das Dokument in der Ansicht nicht direkt durchsuchbar ist und auch nach einem Download des Dokument dies nicht durchsuchbar ist.

Habe ich irgendwo einen Fehler gemacht oder etwas vergessen?
Ich hoffe es findet sich jemand der hier etwas Licht ins dunkle bringen kann.

Vielen Dank schon einmal vorab.


Viele Grüße
 
Moderator informieren   Gespeichert Gespeichert  
 
Letzte Änderung: 01.04.2021 11:46 von jhub. Grund: Link Anpassung
  Kein öffentlicher Schreibzugriff erlaubt, bitte erst registrieren!
#10532
forum.support (Benutzer)
Fresh Boarder
Beiträge: 8
graphgraph
Benutzer offline Hier klicken, um das Profil dieses Benutzers zu sehen
Aw: OCR Erkennung unter Linux vor 1 Monat, 2 Wochen Karma: 1  
Hallo,

an sich liest sich das alles soweit korrekt. Im Standard ist es so, dass eine PDF Datei erstmal versucht wird ohne OCR zu interpretieren, wenn da kein Text kommt, wird diese mit OCR verarbeitet. Da Sie ja schrieben, dass Sie kurz einen OCR-Iris Prozess sehen, gehe ich davon aus, dass ein Aufruf vom OCR stattfinden. Ggf. ist die PDF Datei selbst für den OCR nicht lesbar? Haben Sie es mit anderen PDF Dateien mal ausprobiert?

Da OCR ein Bestandteil von agorum core pro ist, haben Sie sicherlich einen Wartungs-/Supportvertrag und können sich gerne auch an unseren offiziellen Support wenden.
 
Moderator informieren   Gespeichert Gespeichert  
  Kein öffentlicher Schreibzugriff erlaubt, bitte erst registrieren!
Zum Anfang gehen Neues Thema
Powered by FireBoarddie neusten Beiträge direkt auf Ihrem Desktop erhalten