Die optische Texterkennung OCR (Optical Character Recognition) sorgt dafür, dass aus eingescannten Dokumenten der Text erkannt und erfasst werden kann. Die Qualität des Endergebnisses dieser Texterkennung und -erfassung hängt wesentlich von der Auflösung und Qualität der Bilddatei, dem Umfang und der Qualität der Muster-Datenbank und der Wörterbücher sowie der Fehlerkorrektur ab Außerdem ist selbstverständlich das Ausgangsdokument (Beleg, Rechnung etc.) entscheidend. Ist das Ausgangsdokument bereits verblasst und bietet wenig Kontrast wird das Ergebnis der Texterkennung fehlerhafter sein, als bei einem Ausgangsdokument mit hohem Kontrast.
ICR (Intelligent Character Recognition) ist eine intelligente Texterkennung für handgeschriebene Texte, die komplexer ist als die OCR Erkennung für maschinelle erstellte Texte. Bei der ICR kommen umfangreiche Vergleichs- und Erkennungsprozesse zum Einsatz. So ist ICR Software in der Regel mit einem umfangreichen Lexikon und einer Grammatik ausgestattet, so dass anhand entsprechender "Nachschlagewerke" bei unklaren Zeichen eine Entscheidung getroffen wird.
Beachten Sie bitte auch die aktuelle Marktübersicht der Softwarelösungen und Erklärungen zum Thema OCR, OMR Text- und Markierungserkennung |
Ergänzend zu den allgemeinen Kriterien zur Bewertung von Software in den vorangegangenen Abschnitten haben wir hier spezifische Kriterien für die Bewertung von OCR Software aufgeführt.
1 | vgl. auch 4 Softwaredokumentation |
2 | Wenn eine Schrifterkennung mit vielen Schriftarten klar kommt, wird von Multifontfähigkeit gesprochen. |
3 | Schriftartunabhängigkeit wird als Omnifont bezeichnet. |