Um in paperless-ngx Dokumente zu importieren und OCR (Texterkennung) über jene laufen zu lassen, bedarf es einer kleinen Anpassung in den paperless-ngx-Einstellungen. Ohne die Änderung verweigert paperless-ngx und die genutzten Drittanwendungen das Einlesen des Textes mit der Meldung:
[2025-09-28 12:06:12,786] [WARNING] [paperless.parsing.tesseract] This file is encrypted and/or signed, OCR is impossible. Using any text present in the original file.
[2025-09-28 12:06:12,786] [WARNING] [paperless.parsing.tesseract] No text was found in /tmp/paperless/paperless-ngxey73_jza/samplecertifiedpdf.pdf, the content will be empty.
Unter „Konfiguration“ -> Reiter „OCR-Einstellungen“ > „OCR-Argumente“ muss die folgende Option in JSON-Format eingefügt werden:
In paperless-ngx signierte PDF-Dokumente trotz Signatur mit OCR importieren weiterlesen