Joplin 2.14 mit OCR und Backup

Seit dem 1. März 2024 ist die finale Version von Joplin 2.14 (genau 2.14.17) verfügbar. An größeren Neuerungen hält OCR und Backup Einzug in die Open Source-Notizen-App.

Bei OCR (optical character recognition) handelt es sich um eine Texterkennung für Bilder und PDF-Dateien, d.h. enthält beispielsweise ein Foto Text, so kann dieser erkannt und nach diesem in den Notizen gesucht werden. Das Gute hieran ist, die Texterkennung erfolgt offline (kein Cloud-Dienst) auf dem eigenen Computer. Offenbar setzt Joplin hier auf Tesseract.

OCR muss in den Einstellungen zunächst aktiviert werden:

  • Auf “Werkzeuge – Optionen” klicken.
  • Bei “Allgemein” den Haken setzen bei “Aktiviere die optische Zeichenerkennung (OCR)”.
  • Die Änderung mit einem Klick auf “Anwenden” übernehmen.

Ab sofort werden bestehende und neue Anhänge (Bild- und PDF-Dateien) entsprechend analysiert.

Weitere Informationen hierzu findet man auf der Joplin-Hilfe-Seite:

Optical Character Recognition (OCR)

Hier liest man dann von aktuellen Einschränkungen:

"Searching in OCR text is enabled on the desktop and mobile app.
Scanning documents however is only available on the desktop app since this is a relatively resource-intensive process.
The mobile app will have access to that OCR data via sync.

For now OCR is reliable when scanning printed text, PDFs in particular, or images where the text is clear such as screenshots.
We do not currently support handwritten text, and text on photos may or may not be recognized depending on how clear it is."

Bei einem Test mit aktiviertem OCR, einer neuen Notiz und drei verschiedenen Screenshots wurde offenbar noch kein OCR angewendet, zumindest konnte kein Wort aus den Bildern gefunden werden. Es fiel hier auch keine besondere CPU-Last oder ein entsprechender Prozess auf, der auf eine OCR-Tätigkeit schließen ließe. Womöglich liegt das jetzt lediglich an meinem PC oder hier ist noch irgendetwas faul.

Hat jemand von euch dieses neue Feature schon zum Laufe bekommen? Feedback ist via Kommentar gerne willkommen.

Nachtrag vom 04.03.2024 – 13:11: Auch ein Test auf einem anderem PC mit frischem Windows 10 Pro und frischem Joplin 2.14 ändert nichts daran, dass das OCR offenbar nicht funktioniert. Zum Test wurde Tesseract mal installiert, auch das ändert nichts. Schade.

Nachtrag vom 05.03.2024 – 21:48: Offenbar ist es ein Bug bzw. eine Unzulänglichkeit mit der deutschen Übersetzung. Stell man Joplin auf Englisch, führt einen Neustart durch, dann funktioniert OCR. Das Ganze wird mit dem nächsten Update gefixt. Siehe: GitHub – laurent22/joplin – Issues – OCR does not start for German users #10058

Nachtrag vom 08.03.2024 – 22:09: Mit Joplin 2.14.19 funktioniert OCR nun auch mit deutscher Sprache.

Datensicherung jetzt onboard

Mit dem Update wird zudem die Backup-Erweiterung von JackGruber installiert. Unter

Werkzeuge - Optionen - Erweiterungen

findet sich ein neuer Eintrag mit dem Namen “Backup”. An dieser Stelle kann man verschiedene Einstellungen wie Backup-Ziel, Anzahl der Versionen, Sicherungsintervall, uvm. vornehmen. In der Voreinstellung wird als Ziel

C:\Users\%username%\JoplinBackup

verwendet. Unter

Werkzeuge

findet sich zudem ein Menüeintrag

Backup erstellen

um manuell eine Sicherung anzustoßen.

Natürlich gibt es noch mehr Neuerungen wie man auf der Homepage und bei GitHub in den Release Notes nachlesen kann:

Joplin – News – What’s new in Joplin 2.14

GitHub – laurent22/joplin – releases

5 Kommentare

  1. martin

    Ich habe die neue Version auf macOS installiert und OCR aktiviert. Leider konnte ich bisher auch nicht feststellen, dass es funktioniert, weder CPU Leistung noch die Suche geht dort….

  2. Andy

    Na dann bin ich ja beruhigt, dass das nicht nur bei mir (unter Windows) nicht klappt. Was mich etwas wundert ist, das man dazu weder im Forum noch bei den GitHub-Issues etwas dazu findet. Wir werden doch wohl kaum die Einzigen sein wo es nicht läuft.

  3. Andy

    Ist wohl ein Bug in Verbindung mit der deutschen Übersetzung. Setzt man Joplin auf Englisch und startet neu läuft es. Das Ganze soll mit dem nächsten Update behoben werden. Der Beitrag (inkl. Quelle/Link) wurde entsprechend aktualisiert.

  4. martin

    Vielen Dank! Dann warte ich auf das Update.

  5. Jörg

    …danke für die Infos, die OCR brauche ich nicht wirklich, Fürs Backup habe ich bislang die Daten als jex exportiert und die Datei dann extern gesichert. Bei meinem Riesen Bestand an Notizen sehr wichtig und ja das importieren funktioniert auch. Ich werde das Backup bei der nächsten Sicherung mal parallel testen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

© 2024 Andy's Blog

Theme von Anders NorénHoch ↑