Archiv für den Monat: September 2025

Bessere tesseract-Trainingsdaten „tessdata_best“ in paperless-ngx (Docker) nutzen

paperless-ngx nutzt zur Texterkennung tesseract-ocr über OCRmyPDF. Für tesseract-ocr gibt es dabei zwei unterschiedliche Arten von Texterkennungs-Trainingsdaten (tessdata_fast, tessdata_best). Wobei die standardmäßig im paperless-ngx Docker-Image installierten immer die bereitgestellten „tessdata_fast“-Trainingsdaten sind. Diese sind zügig, aber haben auch eine höhere Fehlerrate in der Erkennung.

Um für paperless-ngx „tessdata_best“ zu nutzen, empfiehlt sich eine ganz simple Lösung: Wir laden die Trainingsdaten herunter, legen sie in ein Verzeichnis unserer Wahl und mounten sie in den paperless-ngx Container an der jeweilig korrekten Stelle:

Bessere tesseract-Trainingsdaten „tessdata_best“ in paperless-ngx (Docker) nutzen weiterlesen

In paperless-ngx signierte PDF-Dokumente trotz Signatur mit OCR importieren

Um in paperless-ngx Dokumente zu importieren und OCR (Texterkennung) über jene laufen zu lassen, bedarf es einer kleinen Anpassung in den paperless-ngx-Einstellungen. Ohne die Änderung verweigert paperless-ngx und die genutzten Drittanwendungen das Einlesen des Textes mit der Meldung:

Unter „Konfiguration“ -> Reiter „OCR-Einstellungen“ > „OCR-Argumente“ muss die folgende Option in JSON-Format eingefügt werden:

In paperless-ngx signierte PDF-Dokumente trotz Signatur mit OCR importieren weiterlesen

Einmalige Email-Benachrichtigung bei Freigabe in paperless-ngx einrichten

Stand heute unterstützt paperless-ngx leider keine Email-Benachrichtigungen wenn eine Freigabe an einen anderen Benutzer erfolgt. Mit ein paar Tricks lässt sich diese Funktionalität jedoch, zumindest in einer grundlegend, nachrüsten.

Ich möchte hier kurz erläutern wie ich Email-Benachrichtigungen bei Freigabe in paperless-ngx ohne externe Tools realisiert habe:

Einmalige Email-Benachrichtigung bei Freigabe in paperless-ngx einrichten weiterlesen

Kurz: Dell R7715 mit iPXE crasht

Wenn ein ziemlich neuer Dell R7715 Server oder Server dieser Serie nach einem Bootvorgang z. B. von Ubuntu 24.04 mittels iPXE (Netzwerkboot) crasht und davor gerade noch diese Textzeilen emittieren kann:

EFI stub: Loaded initrd from LINUX_EFI_INITRD_MEDIA_GUID device path
EFI stub: Measured initrd data into PCR 9

Empfiehlt es sich, die aktuellste iPXE-Version aus dem GitHub-Repository zu laden und selbst zu kompilieren. Dabei ist darauf zu achten nicht das Release-Tag 1.21.1 zu nutzen, sondern wirklich die aktuellste Version aus dem Master-Branch. 1.21.1 ist 5 Jahre alt und mit den neuesten Hardware-Komponenten nicht mehr ganz kompatibel.

Nach dem iPXE-Update war ich in der Lage, Ubuntu 24.04 übers Netzwerk zu installieren.

Webhook-Queue in paperless-ngx löschen

Spielt man ein bisschen mit den Workflows „Arbeitsabläufen“ in paperless-ngx, kann es passieren, dass man versehentlich viele Webhook-Calls generiert, indem man z. B. für seine gesamte Dokumentensammlung Webhooks durch den Auslöser „Geplant“ auslöst, die dann allesamt in der nachgelagerten Redis-Datenbank feststecken und unter Umständen nur noch sehr langsam oder gar nicht mehr abgearbeitet werden, weil die externe API, welcher der Webhook-Call galt, nicht mehr mitmacht.

Eine pragmatische Lösung dazu ist, die gesamte Warteschlange an wartenden Webhook-Calls zu entfernen. Im Docker-basierten paperless-ngx ginge das wie folgt:

Webhook-Queue in paperless-ngx löschen weiterlesen

Google markiert mailcow SoGo Webmailer als „irreführender Inhalt“ und zeigt rote Warnung in Chrome

Absurde Geschichte in eigener Sache: Gestern Mittag begrüßte mich auf meiner geschäftlichen Webpräsenz ein knallrotes Banner „Deceptive site ahead“. Ungewöhnlich, da ich auf meine Außenwirkung achte und nur sehr ausgewählte Software und deren Plugins auf dieser Präsenz nutze. Es sieht in der Tat schlecht aus, IT-Dienstleistungen anzubieten, dann jedoch seine eigene Webseite nicht im Griff zu haben. Googles rotes Banner und der zugehörige Text implizieren zudem immer gleich einen „Hack“ der Webseite, was für Klienten und potenzielle Klienten gleich doppelt schlecht aussieht.

Google markiert mailcow SoGo Webmailer als „irreführender Inhalt“ und zeigt rote Warnung in Chrome weiterlesen