PDF Programm gesucht

Hallo zusammen,

ich bin auf der Suche nach einem Programm, welches neue PDF Dokumente automatisiert an eine bestehende PDF Datei anhängen kann. Ich weiss das es Programme gibt, mit dem man PDF Dateien zusammen fügen kann, das ist aber nicht genau das, was ich benötige.

Ich würde gerne eine neue PDF Datei in ein entsprechendes Verzeichnis legen, diese soll dann autom. gegrabbed werden und an eine bestehende Datei angehängt werden. Dies würde ich gerne mit unterschiedlichen Verzeichnissen und PDF Dateien so realisieren.

Kennt jemand solch ein Programm f. den PC, welches diese Funktionen bieten kann, evtl. auch als Shareware?

Viele Grüße,
Doc

Hallo Doc,

ein solches Programm kenne ich zwar (fertig) nicht. Aber mit ein paar Programmierkenntnissen und den entsprechenden Libs ist so was in kurzer Zeit gebaut (ich beschäftige mich seit Jahren mit der Automatisierung von Pdf-Dokumenten.) Wenn das ein Weg für Dich ist, gebe ich Dir hierzu gerne ein paar Infos.

Viele Grüße
Wolfgang

Hallo Wolfgang,

bei den Programmierkenntnissen hört es bei mir dann leider schon auf, wenn es sich nicht mit PHP realisieren lässt.
Eigentlich suche ich so ein Programm fertig. Wäre das nicht was für dich mit deiner Hintergrunderfahrung?
Habe Google schon länger danach bemüht, ist aber nichts zu finden.
Finde ich eigentlich merkwürdig, da fast jeder Officedrucker m. Scanner als PDF in ein Verzeichniss scannen kann.

Vielleicht sollte ich aber einen anderen Weg gehen und mir mal Dokumentenarchivierungs-SW anschauen.

Kennt da jemand ein gutes Programm? Das Angebot an dieser SW ist doch schon deutlich höher …

Viele Grüße,
Doc

Hallo Doc,

kommt natürlich auch auf die spezifischen Anforderungen an, wie z.B.

  • muss die SW ereignisgesteuert reagieren oder reicht zeitgesteuert aus?
  • wie häufig müssen Dokumente verarbeitet werden und wie groß sind diese (Quell- bzw. Zieldateien)?
  • müssen die neue Seiten nur an das Zieldokument angefügt, oder muss neu paginiert (Seiten nummerieren) werden?

Wenn Du magst, kannst Du die Anforderungen präzisieren - gerne auch per PM. Dann fällt es mir leichter, Tipps zu geben.

Viele Grüße
Wolfgang

Hallo Wolfgang,

neue Dokumente brauchen nur an eine bestehende PDF angehängt werden, ohne Schnick & Schnack.
Am besten wäre es, wenn das Programm den Ordner selber überwacht und neue PDFs einfach nimmt und anhängt und die Quelle autom. löscht.
Das ganze dann für verschiedene Ordner.
Die PDFs würden im laufe der Zeit natürlich schon eine gewisse Größe bekommen.

Ich habe mir gerade mal PaperPort von Nuance angeschaut, das ist mir aber eigentlich zu oversized.

Grüße,
Doc

Es reicht aber aus, wenn alle paar Sekunden/Minuten auf neue Dokumente geprüft wird? Und es gibt prinzipiell je überwachtem Ordner ein Ziel-Pdf? Und der Sicherheit halber: Programm für Windows?

VG Wolfgang

Ich hab mir vor wenigen Wochen Omnipage Ultimate inkl. Paperport 14 für 60€ (Sonderaktion) gekauft und gerade Paperport finde ich schon extrem klasse. Die simple Archivierung in einem Standardverzeichnisbaum ist nutzerfreundlich.
Die Formtyper Funktion ist der Hammer. Du legst ein beliebiges Formular auf den Scanner und das Ergebnis ist erstaunlich genau erfasst und benötigt keine oder nur geringe Nacharbeit.
Du kannst sogar die Dokumente fotografieren und PaperPort macht den Rest.

Einzig die Farbgestaltung der Icons besonders im eingebauten PDF-Viewer ist grottig schlecht. Da kann nie und nimmer ein Graphiker auch nur kurz drübergeschaut haben.

Ja klar, reicht aus 1x die Minute.
Evtl. kann das im Hintergrund laufen?

Je Ziel PDF ein Quell Ordner, genau.
Die Ziel PDFs sollte alle in einem Ordner liegen können. Evtl. Netzwerk, NAS, …

Die Frage wäre noch, ob man es so gestalten kann, das bei erreichen einer bestimmten PDF Größe eine neue erzeugt wird mit z.B. fortlaufender Nummer um eine übergroße PDF zu vermeiden mit den Jahren?

Und klar für Windows.

Warum das ganze?
Ich möchte unabhängig bleiben von großen SW Herstellern. Diese Art von Archivierung würde sich über einen sehr langen Zeitraum erstrecken. Wer weiss was dann wieder in 5 Jahren ist und ich dann spezielle Archive nicht mehr verwenden kann. Normale gut sortierte PDFs sind dann eher kein Problem.

Viele Grüße,
Doc

@Boui

wollte mir evtl. mal die Testversion von PaperPort laden.
Aber ich würde gerne unabhängig von SW-Herstellern bleiben, die PDFs in speziellen Datenbanken ablegen und verwalten.
Wenn es dann mal mit der SW Probleme gibt nach Jahren, fängt man wieder von vorne an.

Grüsse Doc

Genau das macht PaperPort ja und Du kannst es überall nach Belieben ablegen. Lokal, Server, NAS, Cloud …

Hallo Doc,

ich stelle Dir gerne so was morgen oder übermorgen zur Verfügung, wenn Du magst.
Gib mir einfach Bescheid.

Die SW kann als Windows-Dienst laufen und damit im Hintergrund werkeln. Das Erzeugen eines neuen Pdf bei Erreichen einer vordefinierten Größe ist natürlich möglich. Wo die Ziel-Pdf liegen werden, ist letztlich unerheblich - solange der Pfad physikalisch erreichbar ist und die Berechtigungen passen.

Viele Grüße
Wolfgang

Hallo Wolfgang,

das wäre echt super.
Bin bestimmt dein bester Beta-Tester :wink:

Viele Grüße,
Doc

@Boui

Ich habe beim Test von PaperPort keine Funktion gefunden, um an ein bestehendes PDF-Dokument weitere gescannte PDF-Seiten anzufügen.
Kann selbst so ein Programm das nicht oder habe ich was übersehen?

Grüße,
Doc

Hallo Doc,

anbei mal ein Ansatz so wie ich Deine Aufgabenstellung bisher verstanden habe.

Das Zip-Archiv enthält eine ausführbare Datei (pdfMerger.exe) und eine Konfigurationsdatei (pdfMergerWatchlist.txt). In letztere trage bitte die zu überwachenden Ordner und Ziel-Pdf ein, Hinweise dazu findest Du in der Datei selbst.

Installation:
Einfach die beiden Dateien in einen Ordner Deiner Wahl extrahieren, Konfigurationsdatei anpassen und - zum Testen am sinnvollsten - in der Eingabeaufforderung ausführen. Es wird eine Log-Datei im Applikationsverzeichnis geführt.

Bitte noch beachten:

  • Die SW sollte auf jedem halbwegs aktuellen Windows laufen.
  • Die max. Dateigröße eines Ziel-Pdf wird zwar bereits geführt, bei Überschreitung werden jedoch neue Dateien noch nicht angelegt
  • Ist eine konfigurierte Zieldatei nicht vorhanden, wird sie automatisch angelegt
  • Die Quell-Pdf’s dürfen nicht kennwortgeschützt sein
  • Im Moment ist noch keine Timer-Funktionalität eingebaut. Du kannst die ausführbare Datei bei Bedarf über IPS oder den Windows-Zeitplandienst in den gewünschten Intervallen laufen lassen.

Wenn Du mit der SW klar kommst und sie verwenden möchtest, können wir natürlich die Funktion mit der max. Filegröße und dem Timer einbauen.

Viel Spaß damit und viele Grüße
Wolfgang
pdfMerger201312291.zip (502 KB)

Hallo Wolfgang,

bin leider erst heute dazu gekommen, das zu testen.
funktioniert so wie von dir beschrieben prima.
Vielen Dank.

Wenn man das jetzt noch etwas ausbauen würde, würde ich mir noch folgende Dinge wünschen.

  • autom. Neuanlegen einer Datei beim überschreiten einer bestimmten Größe
  • GUI zum anlegen der Config Datei
  • Fortschrittsbalken, gerade bei großen Dateien und viele Verzeichnissen interessant.
  • auto. prüfen der Verzeichnisse im angelegten Intervall wenn Programm geöffnet ist.

Das alles noch in eine GUI verhübschen und fertig ist das Shareware-Programm :smiley:
Wäre zu schade, wenn das nur so von mir Verwendung finden würde.
Aber das wären nur so meine Ideen dazu.

Viele Grüße,
Doc

Hallo Doc,

das mit Timer und der automatischer Datei-Erzeugung hatte ich ja schon erwähnt - wollte gerne erst mal wissen, ob die Funktionalität grundsätzlich das tut was Du Dir so vorgestellt hast.
Das mit der GUI kann man natürlich auch machen. Ich hatte es bei Dir so gelesen/verstanden, dass die SW (komplett) im Hintergrund arbeiten sollte, daher zunächst mein Ansatz als Konsolenanwendung ohne GUI (die man dann ggf. in einen Windows-Dienst überführen kann). Und für beides macht ein Fortschrittsbalken eher wenig Sinn. :wink:
Wenn eine GUI zum Einsatz kommt, fallen mir da noch ein paar andere nützliche Dinge ein…

Also - klar, wir können das gerne noch ein wenig anpassen.
Magst Du mir sagen, in welchem Umfeld Du das einsetzen würdest?

Viele Grüße
Wolfgang

Hallo Wolfgang,

ich muss gestehen, aus Zeitmangel hatte ich das gestern abend nur mit einem Verzeichnis ausprobiert.
Sobald ich mir da schlüssig bin, wie ich das alles umsetzen soll, kommen da so einige Dateien zusammen.

Das Umfeld ist rein privater Natur.
Warum das ganze?
Ich möchte sowohl meine alten, als auch alle zukünftigen Papierakten in digitaler Form verwalten. Ich habe mir jetzt auch mal spezielle Programme wie PaperPort usw. angesehen. Die sind zwar sehr mächtig, aber um mal ein neues Dokument hinzuzufügen oder viele alte Sachen zu Scannen sind leider unzählige Klicks notwendig, bis diese Akten einer anderen PDF Datei angefügt sind.
Hier möchte ich gerne die Funktion meines OfficeJets benutzen, der direkt am Display des Gerätes die Scans in versch. Verzeichnisse als durchsuchbare PDFs ablegen kann. Evtl. packe ich diese gleich auf den IPS Server, so brauche ich um die Dokumente mal eben zu archivieren nicht mal meinen Rechner hochzufahren. Dadurch entstehen nicht wie sonst viele kleine PDFs, sondern sind gleich zu einer großen zusammen gefügt.

Folgende Punkte sind mir noch eingefallen:

  • ich weiss nicht, ob sich das zeitl. gesteuerte so umsetzten lässt. Was passiert, wenn die PDF von Scanner noch nicht vollständig geschrieben ist? Verhindern die Dateirechte dann ein vorzeitiges mergen?

  • was passiert, wenn die Begrenzung der Größe auf 50MB steht und ein neues, kleines PDF an ein Ziel mit z.B. 75MB angefügt wird? Wo erfolgt der Split?

  • können Quelldatei und Zieldatei im gleichen Ordner liegen? Wäre ganz gut … Name der Zeildatei ist ja im Config bekannt, Quelle heißt eh nur Scan_1, Scan_2, …

  • es sollte die Möglichkeit bestehen, eine neue PDF am Anfang des Ziel-PDFs anzufügen und nicht nur am Ende. Im Aktenordner landen diese neuen Dokumente auch immer oben drauf. Weiss nicht, ob sich das einfach lösen lässt, evtl. konfiguriertbar … ?

In der Nacht sind mir noch so einige Punkte eingefallen, fallen mir aber jetzt gerade mal wieder nicht ein.
Verstehe nicht, das andere Nutzer der OfficeJets nicht diesen „Wunsch“ haben, das so unkompliziert zu lösen?
Habe im Web nicht ein „einfaches“ Programm gefunden, das das so kann.

Viele Grüße,
Doc

edit:
da ist noch was eingefallen- evtl. werden auch nur dateien gemerged, die mit einem bestimmten Namen beginnen wie Scan_(1)…, Dokument(1)…, usw., anstelle ein spezielles Verzeichniss. Die OfficeJets kann man so konfigurieren, das sie mit versch. Namen beginnen.

Hallo Doc,

Danke für Deine Antworten.

ich weiss nicht, ob sich das zeitl. gesteuerte so umsetzten lässt. Was passiert, wenn die PDF von Scanner noch nicht vollständig geschrieben ist? Verhindern die Dateirechte dann ein vorzeitiges mergen?

Das kommt sicher auch darauf an, wie der Scanner die Dateien liefert. Optimalerweise wird die Datei erst dann erzeugt und geschrieben, wenn der Scan vollständig ist - dann ist es unproblematisch. Ggf. wird die Datei auch erst mit der Länge 0 erzeugt und nach dem Scan geschrieben. Das müsstest Du mal nachvollziehen.
Auf die Dateilänge 0 kann man natürlich prüfen und/oder ggf. auch einen Time-Offset verwenden, z.B. 5 Minuten nach dem letzten Schreibvorgang in die Datei.
Abgesehen davon kann aber auch geprüft werden, ob es sich tatsächlich um ein korrektes Pdf handelt (was ja gleichbedeutend damit sein sollte, dass der Scan vollständig ist).
Ein andere Vorgehensweise - siehe hierzu auch weiter unten - wäre ggf. die interaktive Arbeitsweise, d.h. Du bestimmst das Einlesen/Mergen interaktiv per Klick.

was passiert, wenn die Begrenzung der Größe auf 50MB steht und ein neues, kleines PDF an ein Ziel mit z.B. 75MB angefügt wird? Wo erfolgt der Split?

mhh - das könnte man vor jedem Quelldokument oder vor jedem Merge-Vorgang prüfen.

können Quelldatei und Zieldatei im gleichen Ordner liegen? Wäre ganz gut … Name der Zeildatei ist ja im Config bekannt, Quelle heißt eh nur Scan_1, Scan_2, …

Da sehe ich kein Problem, es ist ja das Zieldokument bzw. dessen Nomenklatur bekannt, ergo kann die als Quelldokument ausgeschlossen werden.

es sollte die Möglichkeit bestehen, eine neue PDF am Anfang des Ziel-PDFs anzufügen und nicht nur am Ende. Im Aktenordner landen diese neuen Dokumente auch immer oben drauf. Weiss nicht, ob sich das einfach lösen lässt, evtl. konfiguriertbar … ?

Das kann man entweder per Quellordner voreinstellen. Oder - wenn es von Fall zu Fall entschieden werden soll (und damit hier der Punkt zu dem Verweis oben), dann macht es vielleicht mehr Sinn, den Einlese/Merge-Vorgang komplett interaktiv in der GUI zu machen. So kann man eine Fortschrittsanzeige einbauen oder z.B. Infos über das Zieldokument abrufen (Anzahl Seiten, wann angelegt oder zuletzt angefügt (Pdf-Meta-Daten)).

da ist noch was eingefallen- evtl. werden auch nur dateien gemerged, die mit einem bestimmten Namen beginnen wie Scan_(1)…, Dokument(1)…, usw., anstelle ein spezielles Verzeichniss. Die OfficeJets kann man so konfigurieren, das sie mit versch. Namen beginnen.

Klar, kann man machen.

Überleg doch mal bitte, ob eine komplett interaktive SW die bessere Alternative wäre. Ich meine schon - und der Vorgang des Mergen ist nicht so zeitintensiv.

Viele Grüße
Wolfgang

Hallo Wolfgang,

was meinst du mit interaktiver Software.
Schon eine extistierende oder willst du selber so etwas erstellen?
Ich möchte dich nicht mit sowas jetzt über die Feiertage beschäftigen.
Allerdings denke ich immer noch, das der eine oder andere mal mit einem OfficeJet so etwas gebrauchen könnte.
Quasi als einfache Dokumentenarchivierung.

Viele Grüße,
Doc

Ich komme aktuell leider nicht an mein System.