OCR-Engine: Texterkennung im DMS agorum core

OCR - Was ist OCR und warum ist es so wichtig?

OCR steht für Optical Character Recognition, zu Deutsch optische Zeichenerkennung. Dabei handelt es sich um eine Technologie, die es ermöglicht, gedruckten oder handschriftlichen Text in digitalen Formaten zu erkennen und zu verarbeiten. OCR wird in vielen Bereichen eingesetzt, wie zum Beispiel bei der Digitalisierung von Büchern, dem Scannen von Dokumenten oder der automatischen Texterkennung in Bildern.

Was ist eine OCR-Engine?

Eine OCR-Engine ist eine Softwarekomponente oder ein Algorithmus, der für die optische Zeichenerkennung (OCR) verwendet wird. Es handelt sich um den Kern einer OCR-Anwendung, der für die Texterkennung und -verarbeitung verantwortlich ist.

Eine OCR-Engine besteht aus mehreren Modulen, die zusammenarbeiten, um gedruckten oder handschriftlichen Text in digitale Formate umzuwandeln. Zu den Hauptfunktionen einer OCR-Engine gehören:

Bildvorverarbeitung: Die OCR-Engine bereitet das Eingangsbild vor, indem sie Helligkeit, Kontrast, Schärfe und andere Parameter anpasst, um die Texterkennung zu optimieren.
Zeichenerkennung: Die OCR-Engine analysiert das vorverarbeitete Bild und erkennt einzelne Zeichen. Dies erfolgt durch Vergleiche mit Mustern und Referenzdatenbanken.
Textsegmentierung: Die Engine trennt den erkannten Text in einzelne Wörter oder Zeilen und ordnet sie in einer logischen Reihenfolge an.
Texterkennung: Die Engine wandelt die erkannten Zeichen in maschinenlesbaren Text um. Dies kann durch die Verwendung von Mustervergleichen, maschinellen Lernalgorithmen oder neuronalen Netzen erfolgen.
Fehlerkorrektur: Die OCR-Engine kann auch Fehlerkorrekturmechanismen enthalten, um die Genauigkeit der Texterkennung zu verbessern. Dies kann beispielsweise durch Kontextanalyse oder Wörterbuchvergleiche erfolgen.

Es gibt verschiedene OCR-Engines auf dem Markt, die sich in Bezug auf Leistung, Genauigkeit und Funktionalität unterscheiden können. Einige OCR-Engines sind als Standalone-Software verfügbar, während andere als Teil größerer OCR-Softwarepakete oder Cloud-Dienste angeboten werden.

Die Wahl der passenden OCR-Engine hängt von den spezifischen Anforderungen des Projekts oder der Anwendung ab, wie zum Beispiel der Art des zu erkennenden Texts, der Genauigkeitsanforderungen oder der Skalierbarkeit.

OCR: Die digitale Erfassung und Integration von Papierdokumenten ins DMS

Warum eine Texterkennung wichtig ist

Papierdokumente werden üblicherweise durchs Einscannen digitalisiert. Handelsübliche Scanner liefern als Ergebnis lediglich Bilddateien oder PDFs ohne inhaltliche Informationen. Für die digitale Verarbeitung von Dokumenten benötigt ein DMS aber den enthaltenen Text, um Metadaten zu vergeben und das Dokument für die Volltextsuche zu indizieren. Dafür ist die OCR notwendig. Diese ist entweder bereits im Scanner integriert oder arbeitet serverseitig wie die agorum core OCR-Engine.

Dokumente einfach auslesen mit dem DMS agorum core

Die Papierdokumente können einfach im Stapel eingescannt werden und laufen ohne Zusatzarbeit für Ihre Mitarbeiter automatisch durch die Server-OCR, die zudem nicht nur den Text erkennt, sondern auch viele weitere Merkmale, die für die automatische Weiterverarbeitung der Dokumente genutzt werden können.

Das Scannen an sich geht sehr viel schneller, weil der Mitarbeiter nur den Stapel Dokumente in den Scanner legen und auf "Start" drücken muss. Alles andere erledigt agorum core. An den Scanplätzen ist keine teure und/oder komplizierte Technik nötig, Sie können mit nahezu jedem Scanner arbeiten. Einzige Bedingung: Er muss in ein Netzlaufwerk schreiben können, aber das können heute fast alle handelsüblichen netzwerkfähigen Produkte. Außerdem folgt die Texterkennung immer den gleichen Regeln, egal, über welchen Scanner das Dokument ins DMS gelangt.

Was erfasst die agorum core OCR-Engine?

Wie oben bereits angesprochen, erfasst die agorum core OCR-Engine über den reinen Text hinaus weitere Informationen, die sehr nützlich sind, wenn Sie mehr mit Ihren Dokumenten machen möchten, als sie lediglich ablegen und für die Volltextsuche indizieren.

Ausgelesen werden können:

Text
Barcodes, z. B. Strichcodes oder QR-Codes
Positionen von Texten
Farben von Text, Vorder- und Hintergrund
Schriftart, Zeichen- und Zeilenabstand
Textauszeichnungen, z. B. fett, kursiv, unterstrichen
Qualitätsmerkmal bei der Erkennung einzelner Zeichenketten

Eine XML-Datei ist der Schlüssel für die Weiterverarbeitung von Dokumenten

Die im Dokument erkannten und ausgelesenen Inhalte werden als XML-Datei ausgegeben, die wiederum als Grundlage dient, um die Dokumente mit agorum core docform automatisch zu erfassen und schnell und einfach in beliebige Workflows und Geschäftsprozesse zu integrieren.

Im Zusammenspiel mit agorum core docform ist die OCR-Engine also ein mächtiges Werkzeug für die automatisierte Dokumentenverarbeitung.
Ein Beispiel: Eine Papierrechnung wird eingescannt, die OCR liest den enthaltenen Text und seine Positionen aus. Diese Informationen nutzt docform, um das Dokument zu klassifizieren und die nötigen Metadaten zu generieren, anhand derer das Dokument als Rechnung erkannt und in den entsprechenden Workflow geleitet werden kann. Detailliertere Informationen zur automatischen Rechnungsverarbeitung finden Sie in folgenden Blogbeiträgen:

Clevere OCR-Engine mit eingebauter Selbstkontrolle

Ein Feature, das unsere Kunden immer wieder begeistert

Sehr beliebt ist die in der agorum core OCR-Engine eingebaute Selbstkontrolle. Die Engine ist in der Lage, anhand diverser Kriterien selbst zu entscheiden, wie wahrscheinlich es ist, dass sie den Inhalt des Dokumentes richtig ausgelesen hat. Sie drückt dies in einer Qualitätskennzahl von 0 bis 100 aus: 0 bedeutet unsicher, 100 sehr sicher.

Je nach Qualität und Inhalt eines Dokumentes ist es gar nicht so einfach für die OCR-Engine, den Inhalt richtig zu erkennen, wenn ihr vorher keiner sagt, ob der erkannte senkrechte Strich ein großes I, ein kleines L, eine 1 oder einfach nur ein Strich ist. Ein "Kreis" kann je nach Zusammenhang ein O oder eine Null sein. Ein großes B, ein ß und eine 8 sind sich ebenfalls sehr ähnlich und stellen daher eine potenzielle Fehlerquelle für die Texterkennung dar, insbesondere, wenn das Ursprungsdokument beispielsweise ein schlechtes Fax ist.

Die Selbstkontrolle lässt sich sogar an individuelle Bedürfnisse anpassen

Steht beispielsweise die Qualitätskennzahl per Default auf 80, kann der Administrator diese Zahl für einzelne Zeichenketten, z. B. Rechnungsnummern, Kundennummern, Firmennamen o. Ä. mittels Schieberegler erhöhen oder verringern. Dokumente mit schlechterer Qualität als dem eingestellten Wert erscheinen automatisch im docform audit, und der zuständige Mitarbeiter kann der OCR-Engine "unter die Arme greifen" und die Zweifelsfälle manuell definieren. So vermeiden Sie Fehler, steigern die Qualität der automatischen Dokumentenerfassung und verbessern nebenbei die Datenqualität in Ihrem Unternehmen.

Mit der Funktion docform-Dokumententypen können Sie die Qualität der automatischen Texterkennung weiter steigern, indem Sie der OCR-Engine einfach vorher sagen, dass an dieser Stelle beispielsweise ein Datum stehen soll. Erkennt sie nun mit diesem Wissen eine etwas unscharfe Form, die theoretisch eine 8, ein B oder ein ß sein könnte, kann sie zweifelsfrei entscheiden, dass es eine 8 sein muss - denn ein B oder ß haben in einem Datum nichts zu suchen.

Was zeichnet ein gut lesbares Dokument aus?

Je besser die Qualität des Ursprungsdokumentes, umso fehlerfreier auch die ausgelesenen Daten. Um es der OCR-Engine so einfach wie möglich zu machen, den Inhalt eines Dokumentes richtig zu erkennen, wird das Ausgangsdokument am besten mit 300 dpi eingescannt. Die Dokumente können farbig oder auch als Graustufen eingelesen werden.

Für beste Ergebnisse sollten Dokumente gar nicht oder zumindest nur gering komprimiert werden. Je stärker die Komprimierung, desto mehr störende Artefakte entstehen, die die OCR-Engine irritieren und zu unklaren Ergebnissen führen können.

Mithilfe leistungsstarker, bildbasierter Verbesserungsinstrumente kann die agorum core OCR-Engine die Lesbarkeit von Dokumenten bereits vor der eigentlichen Texterkennung steigern.

Beispiele für Dokumente, die von der OCR-Engine nicht ausgelesen werden können, haben wir in diesem Beitrag beschrieben.

Ein Mitarbeiter steht vor einem Fenster, trägt ein hellblaues Hemd und erklärt die Backup-Sicherung im Dokumentenmanagement. — Oliver Schulze

Technische Infos zur agorum core OCR-Engine

Die agorum core OCR-Engine basiert auf Readiris, das von Haus aus bereits eines der besten Texterkennungsprogramme auf dem Markt ist.

"Die OCR-Engine können Sie sowohl auf einem Windows- als auch auf einem Linux-Betriebssystem installieren und benutzen - also dort, wo auch agorum core installiert ist."

Oliver Schulze | Geschäftsführer

Lernen Sie die Funktionalitäten kennen

Im Rahmen einer Online-Demo zeigen unsere DMS-Experten, welche Möglichkeiten der Dokumentenverarbeitung unser DMS agorum core bietet. Beliebte Themen sind die digitale Rechnungsverarbeitung, E-Akten, automatisierte Geschäftsprozesse, die revisionssichere Archivierung - um nur wenige zu nennen. Wir freuen uns auf Ihre Anfrage.

Suchvorschläge