Kategorie: paperless-ngx

  • paperless-ngx: Auf Hetzner Cloud-Server eigene Domain einrichten

    Ist auf einem virtuellen Server, vgl. Hetzner Cloud-Server, einmal paperless-ngx aufgesetzt, sind gute Voraussetzungen geschaffen, vom bloßen Zugriff über eine IP im Browser auf eine menschenlesbare und -merkbare Domain zu wechseln.

    Dazu bedarf es einer Domain von einem Domainregistrar. Hiervon gibt es viele, die sich lediglich in der Verwaltung der Domain und im Preis unterscheiden. Anfängerkompatibel sind u. A.:

    • DomainFactory
    • United-Domains
    • Strato
    • viele mehr, Recherche lohnt sich unter Umständen
    (mehr …)
  • paperless-ngx: Installation auf einem Hetzner Cloud-Server

    In der folgenden Anleitung möchte ich kurz auf die Installation von paperless-ngx‘ Docker-Compose Stack unter einem frisch installierten Hetzner Cloud-Server mit Ubuntu 24.04 eingehen.

    Schritt 1: Bestellprozess

    Der Bestellprozess bei Hetzner wird durchlaufen, je nach Notwendigkeit wird ein entsprechend dimensionierter Hetzner Cloud-Server mit IPv4 oder ohne IPv4 (dann nur mit IPv6) bestellt. Wenn der Hetzner Cloud-Server verfügbar ist, erhält man die initialen Zugangsdaten zum root-Account per E-Mail.

    (mehr …)
  • Automatisch Passwörter von PDF-Dokumenten mit paperless-ngx entfernen

    Wenn man beispielsweise ein PDF-Dokument der Bank oder Krankenkasse erhält, ist es üblich, dass dieses verschlüsselt und mit einem Passwort geschützt ist. Läd man ein solches Dokument in paperless-ngx hoch, geht das grundsätzlich, aber die automatische Metadatenzuweisung und auch die Texterkennung funktionieren nicht.

    Um das Dokument in paperless-ngx zu öffnen muss zudem jedes mal das Passwort eingegeben werden. Um den Workflow zu vereinfachen gibt es eine automatische Lösung mittels Pre-Consume-Skript.

    (mehr …)
  • Bessere tesseract-Trainingsdaten „tessdata_best“ in paperless-ngx (Docker) nutzen

    paperless-ngx nutzt zur Texterkennung tesseract-ocr über OCRmyPDF. Für tesseract-ocr gibt es dabei zwei unterschiedliche Arten von Texterkennungs-Trainingsdaten (tessdata_fast, tessdata_best). Wobei die standardmäßig im paperless-ngx Docker-Image installierten immer die bereitgestellten „tessdata_fast“-Trainingsdaten sind. Diese sind zügig, aber haben auch eine höhere Fehlerrate in der Erkennung.

    Um für paperless-ngx „tessdata_best“ zu nutzen, empfiehlt sich eine ganz simple Lösung: Wir laden die Trainingsdaten herunter, legen sie in ein Verzeichnis unserer Wahl und mounten sie in den paperless-ngx Container an der jeweilig korrekten Stelle:

    (mehr …)
  • In paperless-ngx signierte PDF-Dokumente trotz Signatur mit OCR importieren

    Um in paperless-ngx Dokumente zu importieren und OCR (Texterkennung) über jene laufen zu lassen, bedarf es einer kleinen Anpassung in den paperless-ngx-Einstellungen. Ohne die Änderung verweigert paperless-ngx und die genutzten Drittanwendungen das Einlesen des Textes mit der Meldung:

    Unter „Konfiguration“ -> Reiter „OCR-Einstellungen“ > „OCR-Argumente“ muss die folgende Option in JSON-Format eingefügt werden:

    (mehr …)
  • Einmalige Email-Benachrichtigung bei Freigabe in paperless-ngx einrichten

    Stand heute unterstützt paperless-ngx leider keine Email-Benachrichtigungen wenn eine Freigabe an einen anderen Benutzer erfolgt. Mit ein paar Tricks lässt sich diese Funktionalität jedoch, zumindest in einer grundlegend, nachrüsten.

    Ich möchte hier kurz erläutern wie ich Email-Benachrichtigungen bei Freigabe in paperless-ngx ohne externe Tools realisiert habe:

    (mehr …)