22.10.2020, 14:24 UTC+2

Sie sind nicht angemeldet.

  • Anmelden
  • Registrieren

Lieber Besucher, herzlich willkommen bei: Knoppix Forum | www.KnoppixForum.de. Falls dies Ihr erster Besuch auf dieser Seite ist, lesen Sie sich bitte die Hilfe durch. Dort wird Ihnen die Bedienung dieser Seite näher erläutert. Darüber hinaus sollten Sie sich registrieren, um alle Funktionen dieser Seite nutzen zu können. Benutzen Sie das Registrierungsformular, um sich zu registrieren oder informieren Sie sich ausführlich über den Registrierungsvorgang. Falls Sie sich bereits zu einem früheren Zeitpunkt registriert haben, können Sie sich hier anmelden.

lino

Fortgeschrittener

1

28.07.2020, 12:27

Mutools und MuPDF - Probleme mit der Paginierung der Ausgabe

Hallo Zusammen, guten Tag Ubuntuli, hallo pit234a, hallo Klaus,


heute Eine andere Frage - mal keine zu Knoppix oder Linux oder auch CPUs -

Das Thema: muss ein PDF-Dokument mit x A4 Seiten in zwei Hälften (A 5) teilen: mit Adobe, Briss u. Co!? Welche Tools oder Verfahren eignen sich hier am besten?

Muss ein Scan mehrerer hundert Seiten der als A4 vorliegt in zwei gleich große Teile (A5) aufteilen. Das habe ich noch nie gemacht - und leider habe ich auch keine ADOBE-Spetailtools hier - dafür aber einen Linux und einen Windows-Rechner:


Die Aufgabe: von A4 nach A 5











einige Verfahren und Tools - aber die (aktuelle) Lage ist etwas unübersichtlich - die Hinweise und Techniken z.T. auch etwas in die Jahre gekommen. Deshalb hier ide Frage, ob Ihr denn ein Verfahren kennt, das hier angewandt werden kann!?

was ich bis dato zusammengetragen habe - ein bisheriger Überblick auf die Tools und Techniken bzw. die Software (die man hier einetzen kann)_


- Acrobat: Split ONE PDF page down the middle into TWO new pages (Acrobat XI Pro), can it be done?
https://community.adobe.com/t5/acrobat/s…ile.language=de


Die Diskussion der versch. tools - Briss / Adobe Acrobat etc. etx:

a. How can I split in half a double-page scanned PDF in a single pass? How can I split in half a double-page scanned PDF in a single pass?
b. How to split a PDF page into 2 pages? How to split a PDF page into 2 pages?


wie oben bereits festgestellt sind diese Diskussionen bereits schon 5 Jahre alt oder älter...

Die Tools:

- Briss - 0.8 Briss PDF cropping tool. leider im Mai 2013 zum letzen Mal updatet briss


- und hier noch: ein Update auf Briss: Briss 2.0 is intended to be a GUI Update for the Briss PDF cropping tool.
mbaeuerle/Briss-2.0


- PDF-Sam: PDF Split And Merge


wollte das noch mit Euch teilen: Habe das dann mit mupfd / mutool (s) gemacht: - auf einem Linux-Notebook auf der Kommandozeile

hier das Tool u. die Dokumentation: MuPDF Documentation


pdftk kann zwar ein mehrseitiges PDF in Einzelseiten auftrennen (je Seite eine Datei),
aber nicht Doppelseiten „zerschneiden“. Dazu muss mupdf und die mupdf-tools her.


Quellcode

1
apt install mupdf-tools



Ein einseitiges aber auch ein mehrseitiges PDF wird dann Seite für Seite in zwei Seiten vertikal zerschnitten [schnipp-schnapp] mit:


Quellcode

1
mutool poster -x 2 input.pdf output.pdf 



Die Option -x2 sagt aus, dass das Dokument in der X-Achse in zwei Teile geteilt werden soll. Die Schnittachse ist dementsprechend in der Mitte von oben nach unten, damit links und rechts zwei gleich große Seiten entstehen.
das Tolle: man kann die Schnittachsen einfach in der kommandozeile festlegen - x und y Achsen lassen sich auf der Kommandozeile einfach mit verarbeiten u. festlegen.

Fazit: auf der Kommandozeile sind das für die 370 Seiten - vorliegend in 4 Tranchen genau vier Befehl
Ein Dokument in einzelne Seiten aufsplitten - das geht sehr schnell - das macht man dann mit pdftk


Quellcode

1
pdftk input.pdf burst



Die Ausgabefiles finden sich dann schlicht im selben Verzeichnis als pg_0001.pdf, pg_0002.pdf usw.

vgl. auch hier: Doppelseitiges PDF vertikal teilen – Jakob und Linux


und die ganze Dokumentation:
a. weitere Kommandos: mupdf command man page | ManKier
b. das Tool: MuPDF Documentation: MuPDF is an open source software framework for viewing and converting PDF, XPS, and E-book documents.
Fazit: auf der Kommandozeile sind das für die 370 Seiten - vorliegend in 4 Tranchen genau vier Befehle - und fertig ist der Job.



- update: jetzt hab ich aber fest gestellt dass die Ausgabe irgendwie komisch ist - die Seitenfolge ist nicht ganz linear - also etwa so


1.2.3.4.6.5.7.8.9.10.13.11 und so weiter.


hier ist das Beispielfile mit dem ich das mal beispielhaft versucht hab:


File-Upload.net - __0_100__20200413204027.pdf


hat jemand eine idee!? Ubuntuli und Pit234a -und Klaus - euch falllen ja immer wieder echt gute Lösungen ein. Im Moment hab ich keine Idee - ich muss ggf. am Wochenende nochmals versuchen - das zu lösen - Oben hab ich wie gesagt ein PDF als Beispiel ( also als allgemeines Beispiel eingestellt)

freue mich auf einen Tipp von Euch

viele Grüße

2

28.07.2020, 19:38

Ubuntuli und Pit234a -und Klaus - euch falllen ja immer wieder echt gute Lösungen ein


oh, danke für die Blumen, die aber zumindest in meinem Falle nicht angebracht sind.
Dadurch, dass ich ein wenig anders bin, nutze ich seit vielen Jahren ausschließlich OpenSource-Systeme und SW. Und das bedeutete, dass ich einige Dinge erlernen musste. Es ist aber nicht mein Thema! Weder bin ich IT-Fachkraft, noch bin ich in Abläufe eingeweiht, die mit Entwicklung von SW zu tun haben. Ich bin einfacher Endanwender geblieben und will auch nicht mehr sein.

Mit PDF-Dateien hat man natürlich immer wieder zu tun und als ich das vor vielen Jahren ein klein wenig inniger brauchte, gab es noch pdfedit, das aber nicht mehr weiter entwickelt worden ist.
Manipulationen, die ich heute brauche, nehme ich meist mit GIMP vor. Für eine Aufgabe, wie die deine, ist das eher nicht geeignet und es behandelt PDF grundsätzlich als Grafik.
Inkscape und LibreOffice sind zwei weitere Programme, mit denen man PDFs erstellen und in geringem Umfang auch bearbeiten kann. Jenachdem, was man machen möchte und was man als Ergebnis will, kann man damit dann schon leben.

Das einfache Teilen (Beschneiden/Aufsplitten) von PDF-Dateien erledige ich mit einer alten Version von pdfsam, als Java-Applikation.
briss habe ich vorhin zum ersten Mal gestartet und sehe noch nicht so richtig, wie ich das für mich nutzen kann, aber ich bin jedenfalls dankbar für den Hinweis und glaube, dass es eine einfache und gute Lösung für deine aktuelle Aufgabe sein kann.
mupdf und seine Tools habe ich natürlich auch schon lange installiert, allerdings habe ich nur selten Bedarf dafür gefunden. Der PDF-Viewer ist zwar schnell und schmal, aber schon ein Wenig beschränkt.

Normalerweise nutze ich lieber atril als bloßen Viewer. Es ist allerdings immer schwieriger, bloße PDF-Viewer mit wenigen Abhängigkeiten (zu einem DesktopEnvironment) zu finden. Okular zB ist sicher einer der schönsten PDF-Viewer, aber, wenn ich den nun in meinem System installieren wollte, müsste ich 31 weitere Pakete als Abhängigkeit installieren. Diese Abhängigkeiten betreffen fast nur die Einbettung in die grafische Umgebung, also keine direkten Funktionen. Das ist anbetrachts neuer PC-HW zwar nicht wirklich ein Argument, aber ich schrecke davor zurück, derartig viele Abhängigkeiten zu installieren, nur um ein "etwas besseres Programm" nutzen zu können.

Zurück, zu deinem aktuellen Problem.
Eigentlich würde ich glauben, dass ein einziges Kommando mit mutool poster ausreichend sein müsste, wenn deine Vorgabe so exakt ist.
mutool poster -x 2 teilt horizontal einfach in der Mitte der Seite.
Dazu muss dann natürlich der Ursprung für deinen Fall als Seite-Quer verfügbar sein. Manchmal ist es das nicht und der benutzte PDF-Viewer stellt das trotzdem passend dar (weil er komfortabel ist). Vor allem muss also herausgefunden werden, wie das Ursprungs-PDF tatsächlich die Seiten füllt.
Ist es Quer-A4, dann wirkt mutool poster -x 2 genau richtig.
Ist es Hochkant-A4, dann wirkt mutool poster -y 2 entsprechend und teilt die Seite in zwei Hälften, entlang ihrer horizontalen Mittellinie.
Dabei wird Seite für Seite eingelesen und umgewandelt. Seitennummern werden nicht erzeugt und nicht bedacht!
Jede Seite hat für die SW also immer das gleiche Format (A4-Quer) und wird immer genau in der Mitte geteilt und in zwei Seiten verwandelt. Es werden dabei keine Seitennummern beachtet oder vergeben! Das neu entstehende Dokument ist fortlaufend und muss erst mal wieder in einem Viewer betrachtet werden, der dann auch wieder (vielleicht) Seiten-Nummern zuteilt.

Du brauchst auch kein Script und keine vier Zeilen auf der Kommando-Zeile, sondern nur eine einzige.

Vielleicht habe ich da auch was falsch verstanden, dann erkläre es vielleicht bitte noch einfacher und ausführlicher für mich.

Linux HardwareLinux Computer & PCs | Linux Notebooks & Laptops | Geek Shirts | Geek und Nerd Shirt Shop