PDF Programm gesucht

Ich hab mir vor wenigen Wochen Omnipage Ultimate inkl. Paperport 14 für 60€ (Sonderaktion) gekauft und gerade Paperport finde ich schon extrem klasse. Die simple Archivierung in einem Standardverzeichnisbaum ist nutzerfreundlich.
Die Formtyper Funktion ist der Hammer. Du legst ein beliebiges Formular auf den Scanner und das Ergebnis ist erstaunlich genau erfasst und benötigt keine oder nur geringe Nacharbeit.
Du kannst sogar die Dokumente fotografieren und PaperPort macht den Rest.

Einzig die Farbgestaltung der Icons besonders im eingebauten PDF-Viewer ist grottig schlecht. Da kann nie und nimmer ein Graphiker auch nur kurz drübergeschaut haben.

Ja klar, reicht aus 1x die Minute.
Evtl. kann das im Hintergrund laufen?

Je Ziel PDF ein Quell Ordner, genau.
Die Ziel PDFs sollte alle in einem Ordner liegen können. Evtl. Netzwerk, NAS, …

Die Frage wäre noch, ob man es so gestalten kann, das bei erreichen einer bestimmten PDF Größe eine neue erzeugt wird mit z.B. fortlaufender Nummer um eine übergroße PDF zu vermeiden mit den Jahren?

Und klar für Windows.

Warum das ganze?
Ich möchte unabhängig bleiben von großen SW Herstellern. Diese Art von Archivierung würde sich über einen sehr langen Zeitraum erstrecken. Wer weiss was dann wieder in 5 Jahren ist und ich dann spezielle Archive nicht mehr verwenden kann. Normale gut sortierte PDFs sind dann eher kein Problem.

Viele Grüße,
Doc

@Boui

wollte mir evtl. mal die Testversion von PaperPort laden.
Aber ich würde gerne unabhängig von SW-Herstellern bleiben, die PDFs in speziellen Datenbanken ablegen und verwalten.
Wenn es dann mal mit der SW Probleme gibt nach Jahren, fängt man wieder von vorne an.

Grüsse Doc

Genau das macht PaperPort ja und Du kannst es überall nach Belieben ablegen. Lokal, Server, NAS, Cloud …

Hallo Doc,

ich stelle Dir gerne so was morgen oder übermorgen zur Verfügung, wenn Du magst.
Gib mir einfach Bescheid.

Die SW kann als Windows-Dienst laufen und damit im Hintergrund werkeln. Das Erzeugen eines neuen Pdf bei Erreichen einer vordefinierten Größe ist natürlich möglich. Wo die Ziel-Pdf liegen werden, ist letztlich unerheblich - solange der Pfad physikalisch erreichbar ist und die Berechtigungen passen.

Viele Grüße
Wolfgang

Hallo Wolfgang,

das wäre echt super.
Bin bestimmt dein bester Beta-Tester :wink:

Viele Grüße,
Doc

@Boui

Ich habe beim Test von PaperPort keine Funktion gefunden, um an ein bestehendes PDF-Dokument weitere gescannte PDF-Seiten anzufügen.
Kann selbst so ein Programm das nicht oder habe ich was übersehen?

Grüße,
Doc

Hallo Doc,

anbei mal ein Ansatz so wie ich Deine Aufgabenstellung bisher verstanden habe.

Das Zip-Archiv enthält eine ausführbare Datei (pdfMerger.exe) und eine Konfigurationsdatei (pdfMergerWatchlist.txt). In letztere trage bitte die zu überwachenden Ordner und Ziel-Pdf ein, Hinweise dazu findest Du in der Datei selbst.

Installation:
Einfach die beiden Dateien in einen Ordner Deiner Wahl extrahieren, Konfigurationsdatei anpassen und - zum Testen am sinnvollsten - in der Eingabeaufforderung ausführen. Es wird eine Log-Datei im Applikationsverzeichnis geführt.

Bitte noch beachten:

  • Die SW sollte auf jedem halbwegs aktuellen Windows laufen.
  • Die max. Dateigröße eines Ziel-Pdf wird zwar bereits geführt, bei Überschreitung werden jedoch neue Dateien noch nicht angelegt
  • Ist eine konfigurierte Zieldatei nicht vorhanden, wird sie automatisch angelegt
  • Die Quell-Pdf’s dürfen nicht kennwortgeschützt sein
  • Im Moment ist noch keine Timer-Funktionalität eingebaut. Du kannst die ausführbare Datei bei Bedarf über IPS oder den Windows-Zeitplandienst in den gewünschten Intervallen laufen lassen.

Wenn Du mit der SW klar kommst und sie verwenden möchtest, können wir natürlich die Funktion mit der max. Filegröße und dem Timer einbauen.

Viel Spaß damit und viele Grüße
Wolfgang
pdfMerger201312291.zip (502 KB)

Hallo Wolfgang,

bin leider erst heute dazu gekommen, das zu testen.
funktioniert so wie von dir beschrieben prima.
Vielen Dank.

Wenn man das jetzt noch etwas ausbauen würde, würde ich mir noch folgende Dinge wünschen.

  • autom. Neuanlegen einer Datei beim überschreiten einer bestimmten Größe
  • GUI zum anlegen der Config Datei
  • Fortschrittsbalken, gerade bei großen Dateien und viele Verzeichnissen interessant.
  • auto. prüfen der Verzeichnisse im angelegten Intervall wenn Programm geöffnet ist.

Das alles noch in eine GUI verhübschen und fertig ist das Shareware-Programm :smiley:
Wäre zu schade, wenn das nur so von mir Verwendung finden würde.
Aber das wären nur so meine Ideen dazu.

Viele Grüße,
Doc

Hallo Doc,

das mit Timer und der automatischer Datei-Erzeugung hatte ich ja schon erwähnt - wollte gerne erst mal wissen, ob die Funktionalität grundsätzlich das tut was Du Dir so vorgestellt hast.
Das mit der GUI kann man natürlich auch machen. Ich hatte es bei Dir so gelesen/verstanden, dass die SW (komplett) im Hintergrund arbeiten sollte, daher zunächst mein Ansatz als Konsolenanwendung ohne GUI (die man dann ggf. in einen Windows-Dienst überführen kann). Und für beides macht ein Fortschrittsbalken eher wenig Sinn. :wink:
Wenn eine GUI zum Einsatz kommt, fallen mir da noch ein paar andere nützliche Dinge ein…

Also - klar, wir können das gerne noch ein wenig anpassen.
Magst Du mir sagen, in welchem Umfeld Du das einsetzen würdest?

Viele Grüße
Wolfgang

Hallo Wolfgang,

ich muss gestehen, aus Zeitmangel hatte ich das gestern abend nur mit einem Verzeichnis ausprobiert.
Sobald ich mir da schlüssig bin, wie ich das alles umsetzen soll, kommen da so einige Dateien zusammen.

Das Umfeld ist rein privater Natur.
Warum das ganze?
Ich möchte sowohl meine alten, als auch alle zukünftigen Papierakten in digitaler Form verwalten. Ich habe mir jetzt auch mal spezielle Programme wie PaperPort usw. angesehen. Die sind zwar sehr mächtig, aber um mal ein neues Dokument hinzuzufügen oder viele alte Sachen zu Scannen sind leider unzählige Klicks notwendig, bis diese Akten einer anderen PDF Datei angefügt sind.
Hier möchte ich gerne die Funktion meines OfficeJets benutzen, der direkt am Display des Gerätes die Scans in versch. Verzeichnisse als durchsuchbare PDFs ablegen kann. Evtl. packe ich diese gleich auf den IPS Server, so brauche ich um die Dokumente mal eben zu archivieren nicht mal meinen Rechner hochzufahren. Dadurch entstehen nicht wie sonst viele kleine PDFs, sondern sind gleich zu einer großen zusammen gefügt.

Folgende Punkte sind mir noch eingefallen:

  • ich weiss nicht, ob sich das zeitl. gesteuerte so umsetzten lässt. Was passiert, wenn die PDF von Scanner noch nicht vollständig geschrieben ist? Verhindern die Dateirechte dann ein vorzeitiges mergen?

  • was passiert, wenn die Begrenzung der Größe auf 50MB steht und ein neues, kleines PDF an ein Ziel mit z.B. 75MB angefügt wird? Wo erfolgt der Split?

  • können Quelldatei und Zieldatei im gleichen Ordner liegen? Wäre ganz gut … Name der Zeildatei ist ja im Config bekannt, Quelle heißt eh nur Scan_1, Scan_2, …

  • es sollte die Möglichkeit bestehen, eine neue PDF am Anfang des Ziel-PDFs anzufügen und nicht nur am Ende. Im Aktenordner landen diese neuen Dokumente auch immer oben drauf. Weiss nicht, ob sich das einfach lösen lässt, evtl. konfiguriertbar … ?

In der Nacht sind mir noch so einige Punkte eingefallen, fallen mir aber jetzt gerade mal wieder nicht ein.
Verstehe nicht, das andere Nutzer der OfficeJets nicht diesen „Wunsch“ haben, das so unkompliziert zu lösen?
Habe im Web nicht ein „einfaches“ Programm gefunden, das das so kann.

Viele Grüße,
Doc

edit:
da ist noch was eingefallen- evtl. werden auch nur dateien gemerged, die mit einem bestimmten Namen beginnen wie Scan_(1)…, Dokument(1)…, usw., anstelle ein spezielles Verzeichniss. Die OfficeJets kann man so konfigurieren, das sie mit versch. Namen beginnen.

Hallo Doc,

Danke für Deine Antworten.

ich weiss nicht, ob sich das zeitl. gesteuerte so umsetzten lässt. Was passiert, wenn die PDF von Scanner noch nicht vollständig geschrieben ist? Verhindern die Dateirechte dann ein vorzeitiges mergen?

Das kommt sicher auch darauf an, wie der Scanner die Dateien liefert. Optimalerweise wird die Datei erst dann erzeugt und geschrieben, wenn der Scan vollständig ist - dann ist es unproblematisch. Ggf. wird die Datei auch erst mit der Länge 0 erzeugt und nach dem Scan geschrieben. Das müsstest Du mal nachvollziehen.
Auf die Dateilänge 0 kann man natürlich prüfen und/oder ggf. auch einen Time-Offset verwenden, z.B. 5 Minuten nach dem letzten Schreibvorgang in die Datei.
Abgesehen davon kann aber auch geprüft werden, ob es sich tatsächlich um ein korrektes Pdf handelt (was ja gleichbedeutend damit sein sollte, dass der Scan vollständig ist).
Ein andere Vorgehensweise - siehe hierzu auch weiter unten - wäre ggf. die interaktive Arbeitsweise, d.h. Du bestimmst das Einlesen/Mergen interaktiv per Klick.

was passiert, wenn die Begrenzung der Größe auf 50MB steht und ein neues, kleines PDF an ein Ziel mit z.B. 75MB angefügt wird? Wo erfolgt der Split?

mhh - das könnte man vor jedem Quelldokument oder vor jedem Merge-Vorgang prüfen.

können Quelldatei und Zieldatei im gleichen Ordner liegen? Wäre ganz gut … Name der Zeildatei ist ja im Config bekannt, Quelle heißt eh nur Scan_1, Scan_2, …

Da sehe ich kein Problem, es ist ja das Zieldokument bzw. dessen Nomenklatur bekannt, ergo kann die als Quelldokument ausgeschlossen werden.

es sollte die Möglichkeit bestehen, eine neue PDF am Anfang des Ziel-PDFs anzufügen und nicht nur am Ende. Im Aktenordner landen diese neuen Dokumente auch immer oben drauf. Weiss nicht, ob sich das einfach lösen lässt, evtl. konfiguriertbar … ?

Das kann man entweder per Quellordner voreinstellen. Oder - wenn es von Fall zu Fall entschieden werden soll (und damit hier der Punkt zu dem Verweis oben), dann macht es vielleicht mehr Sinn, den Einlese/Merge-Vorgang komplett interaktiv in der GUI zu machen. So kann man eine Fortschrittsanzeige einbauen oder z.B. Infos über das Zieldokument abrufen (Anzahl Seiten, wann angelegt oder zuletzt angefügt (Pdf-Meta-Daten)).

da ist noch was eingefallen- evtl. werden auch nur dateien gemerged, die mit einem bestimmten Namen beginnen wie Scan_(1)…, Dokument(1)…, usw., anstelle ein spezielles Verzeichniss. Die OfficeJets kann man so konfigurieren, das sie mit versch. Namen beginnen.

Klar, kann man machen.

Überleg doch mal bitte, ob eine komplett interaktive SW die bessere Alternative wäre. Ich meine schon - und der Vorgang des Mergen ist nicht so zeitintensiv.

Viele Grüße
Wolfgang

Hallo Wolfgang,

was meinst du mit interaktiver Software.
Schon eine extistierende oder willst du selber so etwas erstellen?
Ich möchte dich nicht mit sowas jetzt über die Feiertage beschäftigen.
Allerdings denke ich immer noch, das der eine oder andere mal mit einem OfficeJet so etwas gebrauchen könnte.
Quasi als einfache Dokumentenarchivierung.

Viele Grüße,
Doc

Ich komme aktuell leider nicht an mein System.

Hallo Doc,

vorab: IPS/Hausautomation ist - wie wohl für die meisten hier - ein Hobby für mich. Sozusagen das Alternativprogramm zum Beruf, wo ich mich jedoch auch mit Software beschäftige. Einer meiner Schwerpunkte ist, wie schon erwähnt, Automatisierung von u.a. Pdf - allerdings (web-)serverbasierend. Insofern ist auch schon das erste Stückchen SW, was ich Dir geschickt habe, erstellt und nicht irgendwo „im Web gefunden“.
Die Zeit um die Jahreswende nutze ich immer gerne für etwas, wozu ich halt Lust habe - ich hätte ja auch nicht auf Deinen Thread antworten müssen. Also mach Dir hier keinen Kopf. Wenn es wirklich „to much“ wird, sag ich einfach Bescheid.

Nun aber zu Deinen Fragen: Unter „interaktiv“ verstehe ich eine echte Windows-Anwendung - so mit Fenster, Klicken und Gucken. Bisher ist es ja nur eine Kommandozeilen-Anwendung - ausführen und fertig - eben ohne jegliche Interaktion (mit dem Anwender).
Wenn ich es mir so recht überlege, meintest Du das wahrscheinlich auch. Und Deine Formulierung „im Hintergrund“ bezog sich wohl eher darauf, dass Du nicht so viel klicken musst beim Zufügen zum Archiv. Kann das sein? Ich hatte unter „Hintergrund“ eben das Arbeiten im Hintergrund - also ohne Benutzer(inter)aktion - verstanden.

Klar - die Erstellung einer SW mit GUI braucht mehr Zeit als eine reine Kommandozeilen-SW, wo es ja eigentlich nur um die Funktion geht. Daher kann ich Dir sicher nicht „morgen“ eine fertige GUI präsentieren. Wenn Du also 1 oder 2 Wochen hast, können wir immer wieder mal dran gehen. Aus meiner Sicht zunächst mal just for fun.

Viele Grüße
Wolfgang

Hallo Wolfgang,

schön das du das auch so entspannt siehst.
Mit im Hintergrund meinte ich das so wie von dir beschrieben.
Dabei kann die Anwendung natürlich manuell gestartet werden, aber die PDFs werden dann automatisiert gemerged nach Intervall. Muss aber nicht unbedingt sein, ein „Merge“ Button tut es da auch.

Dann bin ich mal gespannt, was da noch kommt. Leider kann ich dir da auf Grund fehlender Kenntnis ausser Tips und Anregungen nicht wirklich viel helfen.

Viele Grüße v. Doc

Hallo Doc,

ich wünsche Dir noch ein gutes Jahr 2014 - es hat ein wenig länger gedauert als geplant, sorry.
Hier nun aber eine mit GUI versehene Version und ein paar Erläuterungen dazu (ich denke, dass meiste erklärt sich von selbst).

Nach dem ersten Start solltest Du zunächst im linken Bereich Quellordner definieren. Der Klick auf den Button „+“ erzeugt einen neuen Eintrag, den Du dann auf der rechten Seite mit Namen und Beschreibung versehen sowie die das Archiv-Pdf und weitere Optionen bestimmen kannst.
Bei der Auswahl Archiv-Pdf (Button „…“) wird nur ein Zielordner gewählt, der Dateiname selbst wird aus der Bezeichnung abgeleitet.
Die Option „Trennblatt für jedes Quell-Pdf zufügen“ ist noch deaktiviert.
Sobald ein Quellordner vollständig und korrekt definiert ist (Quellordner existiert und enthält Quell-Pdf, Zielordner existiert), wird der Button „Starten“ aktiv. Der Klick darauf verarbeitet den gewählten Ordner - im Moment nur den einzelnen. Sobald alles soweit durchgetestet ist, können wir ggf. wieder die Stapelverarbeitung rein machen.

Ich teste heute und morgen noch ein wenig, wäre toll wenn Du das auch machen könntest.

Viele Grüße
Wolfgang
pdfMerger201401251.zip (513 KB)

Hallo Wolfgang,

gerade erst gesehen, das du schon weiter gearbeitet hast.

Ein gutes neues Jahr wünsche ich dir auch noch, wenn man das im Februar noch darf :wink:

Ich werde das in den nächsten Tagen mal durchtesten. Bin im Moment etwas eingespannt.
Wird aber wieder Zeit, der Papierstapel auf dem Schreibtisch wächst und wächst und sucht den Weg in den Rechner.
Danke dir für deine Mühen.

Viele Grüße,
Doc

Hallo Doc,

alles gut - freue mich auf Dein Feedback.
Bis dann.

Wolfgang

Hallo alle zusammen im Forum,

ich habe auch schon seit einigen Monaten den Paperport und bin bisher von der Leistung des Programmes außerordentlich zufrieden. Die Eigenschaften sind für PDFs bestens geeignet.

Grüße
Tobi