Windows: Texterkennung mit IrfanView und dem KADMOS-Plugin

Wie im Beitrag Windows: Relativ günstiger Einstieg in OCR und mehr erwähnt, wurde mit  IrfanView zusammen mit dem KADMOS-Plugin herumgespielt. Dazu nun ein eigener Beitrag zu diesem Lösungsweg in Sachen OCR bzw. Texterkennung.

Für diesen Beitrag wurde die portable Ausgabe von IrfanView verwendet. Das KADMOS-Plugin gibt es zwar „nur“ als Setup, dieses kann allerdings einfach mit 7-Zip entpackt und der Inhalt in den Plugin-Ordner von IrfanView eingefügt werden.

Sobald IrfanView gestartet ist kann man entweder direkt von einem Scanner oder bereits vorhandene Bilder geöffnet werden. Die Texterkennung kann über „Optionen – OCR starten (Plugin)“ oder einen Druck auf „F9“ gestartet werden.

Daraufhin öffnet sich ein neues Fenster in dem zunächst nach Auswahl der Schriftart und Sprache der zu erkennende Text ausgewählt wird. Das Ergebnis sieht dann z.B. wie folgt aus:

Zur Erkennung wurden die ersten zwei Zeilen der eingescannten Windows-Drucker-Testseite ausgewählt. Wie man sieht, ist das Ergebnis „durchwachsen“. Während die erste Zeile unbrauchbar ist, gibt es bei der Zweiten nur einen kleinen Fehler. Fairerweise muss man sagen, das dieses Ergebnis vermutlich dem Kontrast geschuldet ist. Markiert man weitere Bereich, ist die Erkennung besser. Es kommt also immer auch auf die Vorlage darauf an. Bilder sollten mindest 300 DPI an Auflösung haben.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.