Kategorie: paperless-ngx

  • paperless-ngx: Bei Hetzner Cloud-Server tägliche Backups aktivieren

    Nachdem wir unsere paperless-ngx Installation auf dem Hetzner Cloud-Server installiert haben, sind Sicherungen unverzichtbar. Sie schützen uns vor möglichen Datenverlusten. In einer anderen Variante werde ich ein anbieterunabhängiges Backup beschreiben, in diesem Artikel nutzen wir die mit Abstand einfachste Variante: Tägliche Backups über die von Hetzner angebotene Infrastruktur.

    (mehr …)
  • paperless-ngx: Auf Hetzner Cloud-Server eigene Domain einrichten

    Ist auf einem virtuellen Server, vgl. Hetzner Cloud-Server, einmal paperless-ngx aufgesetzt, sind gute Voraussetzungen geschaffen, vom bloßen Zugriff über eine IP im Browser auf eine menschenlesbare und -merkbare Domain zu wechseln.

    Dazu bedarf es einer Domain von einem Domainregistrar. Hiervon gibt es viele, die sich lediglich in der Verwaltung der Domain und im Preis unterscheiden. Anfängerkompatibel sind u. A.:

    • DomainFactory
    • United-Domains
    • Strato
    • viele mehr, Recherche lohnt sich unter Umständen
    (mehr …)
  • paperless-ngx: Installation auf einem Hetzner Cloud-Server

    In der folgenden Anleitung möchte ich kurz auf die Installation von paperless-ngx‘ Docker-Compose Stack unter einem frisch installierten Hetzner Cloud-Server mit Ubuntu 24.04 eingehen.

    Schritt 1: Bestellprozess

    Der Bestellprozess bei Hetzner wird durchlaufen, je nach Notwendigkeit wird ein entsprechend dimensionierter Hetzner Cloud-Server mit IPv4 oder ohne IPv4 (dann nur mit IPv6) bestellt. Wenn der Hetzner Cloud-Server verfügbar ist, erhält man die initialen Zugangsdaten zum root-Account per E-Mail.

    (mehr …)
  • Automatisch Passwörter von PDF-Dokumenten mit paperless-ngx entfernen

    Wenn man beispielsweise ein PDF-Dokument der Bank oder Krankenkasse erhält, ist es üblich, dass dieses verschlüsselt und mit einem Passwort geschützt ist. Läd man ein solches Dokument in paperless-ngx hoch, geht das grundsätzlich, aber die automatische Metadatenzuweisung und auch die Texterkennung funktionieren nicht.

    Um das Dokument in paperless-ngx zu öffnen muss zudem jedes mal das Passwort eingegeben werden. Um den Workflow zu vereinfachen gibt es eine automatische Lösung mittels Pre-Consume-Skript.

    (mehr …)
  • Bessere tesseract-Trainingsdaten „tessdata_best“ in paperless-ngx (Docker) nutzen

    paperless-ngx nutzt zur Texterkennung tesseract-ocr über OCRmyPDF. Für tesseract-ocr gibt es dabei zwei unterschiedliche Arten von Texterkennungs-Trainingsdaten (tessdata_fast, tessdata_best). Wobei die standardmäßig im paperless-ngx Docker-Image installierten immer die bereitgestellten „tessdata_fast“-Trainingsdaten sind. Diese sind zügig, aber haben auch eine höhere Fehlerrate in der Erkennung.

    Um für paperless-ngx „tessdata_best“ zu nutzen, empfiehlt sich eine ganz simple Lösung: Wir laden die Trainingsdaten herunter, legen sie in ein Verzeichnis unserer Wahl und mounten sie in den paperless-ngx Container an der jeweilig korrekten Stelle:

    (mehr …)
  • In paperless-ngx signierte PDF-Dokumente trotz Signatur mit OCR importieren

    Um in paperless-ngx Dokumente zu importieren und OCR (Texterkennung) über jene laufen zu lassen, bedarf es einer kleinen Anpassung in den paperless-ngx-Einstellungen. Ohne die Änderung verweigert paperless-ngx und die genutzten Drittanwendungen das Einlesen des Textes mit der Meldung:

    Unter „Konfiguration“ -> Reiter „OCR-Einstellungen“ > „OCR-Argumente“ muss die folgende Option in JSON-Format eingefügt werden:

    (mehr …)