PDFify ist ein kleines macOS-Werkzeug zum Kombinieren von einzelnen Seiten aus verschiedenen Quellen zu einer PDF-Datei und zur Anwendung von Texterkennung, falls erforderlich.
Texterkennung - OCR
Die Texterkennung wird automatisch bei Bildern oder PDF Dateien, die keine Textinformationen enthalten, angewendet. Sind bereits Textinformationen vorhanden, kann über den OCR-Knopf die Erkennung des gesamten Dokumentes angestoßen werden. OCR kann mit verschiedenen Einstellungen auch mehrmals auf dasselbe Dokument angewendet werden, um optimale Ergebnisse zu erhalten.
Für die Texterkennung stehen zwei Einstellungen zur Auswahl:
Tesseract
Tesseract ist eine sehr ausgereifte Open-Source-Lösung, die von großen Unternehmen unterstützt wird. Die Version 4, die in PDFify verwendet wird, ist auf dem neuesten Stand der Technik und schnell genug für eine komfortable Nutzung.
Mit Tesseract sind über 100 Sprachen verfügbar. Für jede Sprache stehen separate, auf Geschwindigkeit und Qualität optimierte Datensätze zur Verfügung. Im Einstellungsdialog kannst du zwischen schnell
und beste
wählen. Wir empfehlen, nur eine begrenzte Anzahl an Sprachen auszuwählen.
Apple Vision
Apple Vision OCR ist eine in macOS und iOS integrierte Lösung, die Englisch, Französisch, Italienisch, Deutsch, Spanisch, Portugiesisch und Chinesisch unterstützt, bis macOS Big Sur lediglich nur Englisch.
PRO Zur Verbesserung der Ergebnisse ist es möglich, optional den genauesten Erkennungsmodus sowie eine Sprachkorrektur anzuwenden.Seiten hinzufügen
Du hast zwei Möglichkeiten, mit PDFify zu starten:
- Beginne mit einem leeren Dokument.
- Öffne eine vorhandene PDF-Datei mit PDFify. Wende ggf. OCR manuell an.
Durch Drag & Drop des Inhalts auf das PDFify Fenster kannst du neue Seiten hinzufügen. Auch kannst du dein Dokument auf das Dock-Icon ziehen und damit direkt die App öffnen.
Des Weiteren kannst du auch Inhalte
- durch Kopieren und Einfügen von Dateien, PDFs, Bildern, Screenshots und mehr sowie
- durch Auswahl von
Seiten hinzufügen
aus der Toolbar oder den Hauptmenü-Einträgen unterSeiten
hinzufügen.
Tipp
Du kannst immer rückgängig machen, um zum vorherigen Zustand zurückzukehren.
Die Inhalte werden am Ende Dokuments in der vom Apple Finder bekannten Sortierung importiert. Möchtest du, dass die neuen Seiten vorne eingesetzt werden, musst du ein entsprechendes Häkchen bei den Einstellungen setzen.
Tipp
Du kannst die Reihenfolge der Seiten auch manuell durch Verschieben mit der linken Maustaste anpassen.
Du kannst über die Toolbar oder Seiten
vom Hauptmenü Inhalte einfach aus einer Datei, über die Zwischenablage oder ein Bildschirmfoto in PDFify importieren. Auch kannst du dein iPhone oder iPad sowie Scanner nutzen, um Seiten in PDFify einzufügen.
Vom iPhone/iPad importieren (Continuity Camera)
Hast du ein iPhone oder iPad “in Reichweite”, erscheinen in dem Menü die Optionen, über das mobile Gerät ein Foto aufzunehmen, Dokumente einzuscannen oder eine Zeichnung hinzuzufügen. PDFify liefert ein optimales Ergebnis, indem PDFify den sonst bei dieser Option erscheinenden weißen Rand reduziert. Das mobile Gerät wird zum praktischen Dokumentenscanner.
Weitere Infos dazu findest du bei Apple.
Scans vom Desktop Scanner hinzufügen
PDFify bietet dir einen komfortablen Scanner-Dialog. Er zeigt auf der linken Seite eine Liste aller verfügbaren Geräte. Nach der Auswahl eines Scanners wird die macOS-Scan-Schnittstelle mit den üblichen Optionen angezeigt. Alle gescannten Seiten werden an das aktuelle Dokument angehängt und durchlaufen die Texterkennung. Drücke Fertig
, um den Dialog zu verlassen.
Tipp
Als gute Standardeinstellungen haben sich folgende erwiesen:
Typ: Farbe oder Grau. Auflösung: 300dpi.
Achtung
Bei manchen Scannern kommt es zu Problemen beim “Schwarz-Weiß-Modus”. Dieses Problem lässt sich beheben, indem in den Einstellungen von PDFify die Option “Aktiviere Dateityp Auswahl” gesetzt wird. Dadurch wird beim Scannen eine temporäre Datei erzeugt. Leider handelt es sich um einen Fehler im Betriebssystem, der diesen Workaround nötig macht.
Scans vom ScanSnap hinzufügen
Besonders gute Ergebnisse lassen sich mit einem Dokumentenscanner wie dem ScanSnap des Herstellers FUJITSU erzielen.
Das folgende Video zeigt, wie die App Receipts direkt in ScanSnap Home integriert werden kann. Für PDFify sind die Schritte die gleichen:
https://youtu.be/k4pOgDWYm2UDieses Video zeigt, wie die Anwendung Receipts in den älteren ScanSnap Manager integriert wird:
Drag & Drop aus Mails
Du kannst markierte Mails per Drag & Drop nach PDFify ziehen - entweder direkt aufs Fenster oder das Dock-Icon. Es wird ein PDF mit DIN A4 Seiten erstellt und somit praktischerweise der Druckdialog komplett übersprungen. Die meisten E-Mail-Anwendungen, darunter auch Apple Mail, MailMate, AirMail und Postbox werden unterstützt. Nicht unterstützt wird Spark, dort ist der Umweg über den Druckdialog zu gehen.
Drag & Drop von Webseiten
Auch Webseiten werden automatisch in PDF-Dateien konvertiert. Ziehe die URL aus deinem bevorzugten Browser in ein PDFify-Fenster. URLs, die sich in der Zwischenablage befinden, können ebenfalls einfach eingefügt werden und die Website wird an das Dokument angehängt.
Mit PDF arbeiten
Squeeze - Dateigröße anpassen
Die Größe der PDF-Datei kann optimiert werden durch Veränderung der Bildqualität. Als Standard stehen folgende Vorgaben zur Verfügung:
- Original: Die Originaldaten bleiben erhalten. Keine weitere Veränderung der Daten, dabei kann es auch sein, dass bereits Komprimierungen der Originale enthalten sind, wodurch sich ggf. ebenfalls gute Werte ergeben.
- Leichte Komprimierung: 300 dpi, 80 % Qualität.
- Mittlere Komprimierung: 144 dpi, 75 % Qualität.
- Starke Komprimierung: 72 dpi, 50 % Qualität.
Die aktuelle Größe der Datei wird nun in der unteren Statusleiste mittig angezeigt.
Nachdem die Kompression angewendet wurde, wird eine Meldung angezeigt, um wie viel sich die Dateigröße zum vorherigen Wert verändert hat.
PRO In den Einstellungen kann die Optimierung eingestellt werden, die für neu hinzugefügte Seiten verwendet werden soll.OCR anwenden
OCR auf vorhandene PDF-Seiten anwenden
Wenn Sie PDF-Dateien öffnen oder PDF-Seiten zu einem Dokument hinzufügen, enthält es möglicherweise bereits Textinformationen, die Sie vielleicht behalten möchten. Daher liegt die Entscheidung, ob diese Seiten mit OCR versehen werden sollen oder nicht, bei Ihnen.
Hintergrund Informationen
Der Grund dafür, dass dies nicht automatisiert wurde, liegt darin, dass du irgendwann einmal eine PDF-Datei haben, die Text enthält, aber wenn Sie sie kopieren und an anderer Stelle einfügen, stellen Sie fest, dass die Zeichen nicht mit ihrer Darstellung übereinstimmen und die Information daher nutzlos ist. Dies ist etwas, was ein Algorithmus nicht zu 100 % identifizieren kann, und daher bleibt diese Entscheidung Ihnen überlassen.
Text kopieren
Ein Klick, um den gesamten in der aktuellen PDF-Datei enthaltenen reinen Text zu kopieren.
Text lesen
Liest den Inhalt der PDF-Datei mit der Standardstimme, die Sie in den macOS-Einstellungen festlegen können. Klicken Sie erneut, um das Lesen zu beenden.
Drucken Sie das aktuelle Dokument aus.
Teilen
Das Dokument mit anderen Anwendungen und Diensten teilen.
Rückgängig / Wiederholen
Alle durchgeführten Operationen können auch rückgängig gemacht oder wiederholt werden. Gehen Sie in das Hauptmenü und wählen Sie Rückgängig
oder Wiederholen
aus dem Menü Bearbeiten
. Sie können auch die Tastaturkürzel CMD + Z
oder CMD + SHIFT + Z
wie in jeder anderen guten Mac-Anwendung verwenden.
Seiten löschen und rotieren
Direkt im PDF können im Kontextmenü die Aktionen zum Löschen oder drehen der aktuell unterm Cursor liegenden Seite ausgewählt werden. In der Thumbnailansicht erscheint nach kurzer Verzögerung eine entsprechende Option.
Info
Das Rotieren einer Seite hat, im Unterschied zu Veränderungen am Dokument, Einfluss auf die Texterkennung. So wird nach einer Rotation eine bereits durchgeführte Texterkennung mit rotiert. Wird allerdings erneute eine Texterkennung durchgeführt, wird die aktuelle Rotation berücksichtigt und wieder Text von oben nach unten erkannt.
Stapelverarbeitung
Dieses neue Feature ermöglicht es, mehrere Dokumente auf einmal in durchsuchbare PDFs zu verwandeln oder deren Dateigröße zu verkleinern. Die Funktion “Create Searchable PDF” lässt sich neben PDFs auch auf Bilder (PNG, JPG, etc.) anwenden, “squeezen” hingegen lassen sich nur PDFs.
Man markiert mehrere Dokumente und wendet eine sogenannte “Schnellaktion” an. Durch die jeweilige Schnellaktion entsteht am selben Speicherort pro Dokument jeweils eine neue Datei mit der Endung “.min.pdf” bzw. “.searchable.pdf”. Möchte man lieber die Original-Datei überschreiben, setzt man nach der unten beschriebenen Einstellung der “Quick Actions” unter “Actions” ein entsprechendes Häkchen.
Diese “Schnellaktionen” (“Quick Actions”) werden direkt im Finder durchgeführt:
- “Create Searchable PDF”
- “Squeeze PDF”
Vor der ersten “Stapelverarbeitung” müssen die “Quick Actions” über die rechte Maustaste angepasst…
… und entsprechend ausgewählt werden.
Die hinzugefügten “Quick Actions” werden nun zur Auswahl bei den Schnellaktionen sowie in der Ansicht unterhalb des PDFs angezeigt und können in einem Schritt im Vergleich zur umständlicheren Verarbeitung im UI angewandt werden. Die Einstellungen aus der Hauptapp für Squeeze und OCR werden übernommen.
In der Spaltenansicht im Finder:
Selbstverständlich funktioniert die Schnellaktion auch bei einzelnen Dokumenten.
Gut zu wissen
Installation
Es gibt 3 Möglichkeiten PDFify zu installieren:
- Download von dieser Homepage.
- Installation über den App Store.
- Per Kommandozeile via Homebrew:
brew install --cask pdfify
(Selbe Version wie von der Homepage).
Beta
Für PDFify (nicht via App Store) stehen Beta-Versionen zur Verfügung, die Einblick in die neueste Entwicklung bieten. Im Hauptmenü kann bei gedrückter ALT-Taste der Punkt “nach Aktualisierung suchen…” ausgewählt werden, um die neueste Beta zu laden. Ein direkter Download ist ebenfalls möglich via pdfify.app/latest-beta.
Feedback zu den neuen beschriebenen Features ist willkommen. Siehe auch “Zukunft” zu weiteren Beteiligungsmöglichkeiten.
Datenschutz
Alle Operationen finden lokal statt und kein Inhalt Ihrer Dokumente wird an irgendeinen Server gesendet. Wir stellen lediglich eine Verbindung zum Internet her, um die Sprachdateien zu laden, Absturzberichte zu versenden oder Support-Meldungen zu senden. Ansonsten findet keinerlei Datenerfassung statt.
Für Einzelheiten siehe Datenschutzerklärung.
Support
Es gibt einen eingebauten Support-Dialog in der Anwendung, der von replies.io betrieben wird und uns hilft, leichter Rückmeldungen an Sie zu erhalten. Wenn diese Dokumentation Ihre Fragen nicht beantwortet hat, ist das der bevorzugte Weg.
Abonnement oder Lizenz PRO
Um alle Funktionen der App vollständig nutzen zu können und kein Wasserzeichen im fertigen PDF zu haben, kann ein monatliches oder jährliches Abo abgeschlossen werden. Eine Testphase ist automatisch enthalten. Alternativ steht auch eine lebenslange Lizenz zur Verfügung, bei der nur ein einmaliger Preis ohne zeitliche Beschränkung zu entrichten ist.
Mit dem Abo oder einer lebenslangen Lizenz wird die Weiterentwicklung der App gefördert. Die Zukunft der App kann über Github mitgestaltet werden. Auch der Support steht jederzeit zur Verfügung.