13.11.2023 Babenhausen - Bildvorverarbeitung für optimale OCR-Ergebnisse: Die Optical Character Recognition (OCR) Software ermöglicht die Texterkennung in digitalen Bildern. Trotz der leistungsfähigen OCR-Technologie gibt es Einschränkungen hinsichtlich der Bildqualität. Idealerweise sollten die Bilder vertikal ausgerichtet, richtig dimensioniert und klar sein. Doch nicht alle Bilder erfüllen diese Kriterien. Daher ist es entscheidend, Vorverarbeitungsmethoden anzuwenden, um die Bilder entsprechend anzupassen und die Qualität der OCR-Ausgabe zu verbessern.
In einem Artikel werden drei Vorverarbeitungsmethoden erläutert: Bildskalierung, Binarisierung und Entzerrung. Diese Methoden werden verwendet, um die Bilder für die OCR-Verarbeitung optimal vorzubereiten.
Die beigefügte GitHub-Demo zeigt, wie diese Vorverarbeitungsmethoden mit der DarkShield-API für Bild- und Dateiverarbeitung integriert werden können. Das Demoprogramm ermöglicht die Vorverarbeitung einzelner Bilder oder ganzer Bildordner. Jedes Bild wird zunächst vorverarbeitet, dann an die DarkShield-Files-API gesendet, um nach sensiblen Daten zu suchen und diese zu maskieren. Schließlich wird das Bild nachbearbeitet, um das Original wiederherzustellen.
Die bearbeiteten Bilder werden in einem Verzeichnis namens "masked" gespeichert, das automatisch erstellt wird. Bei Anwendung der adaptiven Binarisierung als Vorverarbeitungsmethode ist zu beachten, dass die ursprüngliche Farbgebung des Bildes nicht vollständig wiederhergestellt werden kann.
Für weitere Informationen und detaillierte Anweisungen verweisen wir auf den umfassenden Blog-Artikel der alle Einzelheiten und Argumente für die Nutzung dieser OCR-Verbesserungsmethoden erklärt. Melden Sie sich gerne bei uns, wir helfen bei der Datenmakierung - egal wo sich die Daten befinden!
Weltweite Referenzen: Seit über 40 Jahren nutzen unsere Kunden wie die NASA, American Airlines, Walt Disney, Comcast, Universal Music, Reuters, das Kraftfahrtbundesamt, das Bundeskriminalamt, die Bundesagentur für Arbeit, Rolex, Commerzbank, Lufthansa, Mercedes Benz, Osram,.. aktiv unsere Software für Big Data Wrangling und Schutz! Sie finden viele unserer weltweiten Referenzen hier und eine Auswahl deutscher Referenzen hier.
Partnerschaft mit IRI: Seit 1993 besteht unsere Kooperation mit IRI (Innovative Routines International Inc.) aus Florida, USA. Damit haben wir unser Portfolio um die Produkte CoSort, Voracity, DarkShield, FieldShield, RowGen, NextForm, FACT und CellShield erweitert. Nur die JET-Software GmbH besitzt die deutschen Vertriebsrechte für diese Produkte. Weitere Details zu unserem Partner IRI Inc. hier.