Jun 092013
 

PDFtk o Il PDF Toolkit è uno strumento open source cross-platform per manipolare documenti PDF. pdftk è fondamentalmente un front-end per la libreria iText (compilata in codice nativo utilizzando GCJ), capace di dividere, unire, cifrare, decifrare, decomprimere, ricomprimere, e riparare file PDF.

Se il formato PDF è carta elettronica, allora pdftk rappresenta l’insieme di tutti gli strumenti che si possono usare per rilegare, cancellare, cifrare qualsiasi documento.
pdftk è un semplice strumento per fare le cose di tutti i giorni con i documenti PDF. Sempre meglio avere questo strumento uno nel primo cassetto della scrivania e usarlo per:

  • Unire documenti PDF
  • dividere le pagine PDF in un nuovo documento
  • decifrare il documento se necessario (richiesta password)
  • cifrare il documento, se si vuole
  • compilare moduli PDF con dati FDF
  • applicare una filigrana allo sfondo
  • Report sulel metriche del PDF, tra cui i metadati e segnalibri
  • aggiornare i metadati del PDF
  • allegare file a pagine PDF o al documento PDF
  • scompattare gli allegati pdf
  • Dividere un documento PDF in pagine singole
  • decomprimere e ri-comprimere la pagina
  • Riparazione di un file pdf danneggiato (se possibile)



Installazione

Installation

Il pacchetto pdftk dovrebbe essere disponibile in tutti i repository delle distribuzioni più comuni, quindi per installarlo in genere è possibile utilizzare il gestore di pacchetti della propria distribuzione come ad esempio:

Debian, Ubuntu, Mint:

apt-get install pdftk

Fedora

yum install pdftk

Arch Linux

yaourt -Sy pdftk

Debian, Ubuntu, Mint:

apt-get install pdftk

Fedora

yum install pdftk

Arch Linux

yaourt -Sy pdftk

Uso di base

La sintassi di base del PDFTK è la seguente:

pdftk input_file operazione output_file

Le operazioni corrispondono all’azione desiderata che si vuole fare sui file.

  • cat concatenazione
  • burst Divide un unico documento PDF in ingresso in pagine singole.
  • dump_data Estrazione di metadati, segnalibri (bookmarks) e le etichette delle pagine da un PDF
  • uncompress decompressione
  • attach_files Include allegati in un documento PDF
  • unpack_files Estrazione di allegati da un documento PDF
  • fill_form Compila moduli PDF con dati FDF1) o XFDF2)
  • background Applica un watermark PDF per lo sfondo ad un PDF in ingresso
  • stamp Questo fà esattamente la stessa cosa dell’operazione background tranne che sovrappone sulla parte superiore della pagina PDF delle pagine di ingresso
  • generate_fdf Legge un unico file PDF di input e genera un file FDF adatto per fill_form
  • dump_data_fields Legge un unico file PDF di input e riporta i suoi metadati, i segnalibri e le pagine metriche.
  • update_info Aggiorna i metadati

PDFtk Examples

Unire i files

Supponiamo di voler unire due documenti (1.pdf e 2.pdf) in un unico file (both.pdf), il comando sarà:

$ pdftk 1.pdf 2.pdf cat output both.pdf

Il comando cat assembla le pagine da file PDF di input per creare un nuovo PDF. Usare cat per unire pagine PDF o dividere pagine PDF da documenti. È anche possibile utilizzarlo per ruotare le pagine in formato PDF. L’ordine delle pagine nel nuovo PDF è specificato dal ordine delle pagine e degli intervalli di pagina dati, questo può essere utile per:

Unire pagine specifiche da file diversi

Supponiamo di voler unire due documenti (1.pdf e 2.pdf) in questo modo: le prime 2 pagine del file 1.pdf e le pagine pari da 10 a 20 del 2.pdf, il comando sarà:

pdftk A=1.pdf B=2.pdf cat A1-2 B10-20even output out.pdf

Dividere file

E’ anche possibile dividere i file PDF con pdftk. L’opzione burst scompone un PDF in più file – un file per ogni pagina:

pdftk mylong_guide.pdf burst

Questo comando creerà un sacco di file con nomi corrispondenti ai loro numeri di pagina, come ad esempio pg_0001 fino a pg_0125.

Sicurezza

Crittografare un documento PDF con una chiave a 128 bit e rimuovere tutti i diritti (default):

pdftk mydoc.pdf output mycrypted_doc.128.pdf owner_pw foo

Idem come sopra, tranne la password baz deve essere utilizzata per aprire il PDF prodotto

pdftk 1.pdf output mycrypted_doc.128.pdf owner_pw foo user_pw baz

Decifrare un PDF :

pdftk mycrypted_doc.128.pdf input_pw  foo output déchiffré.pdf

Aggiunta di allegati

Questa caratteristica può essere utile per includere un documento in un altro formato, immagini, o ulteriori informazioni in un PDF pubblicato
Con pdftk è possibile allegare binari e file di testo in un PDF con facilità. È anche possibile specificare in quale pagina del file PDF si desidera che compaia l’allegato con un comando come questo:

pdftk html_tidy.pdf attach_files command_ref.html to_page 24 output html_tidy_book.pdf

Questo collega alla pagina 24 del documento html_tidy_book.pdf il file html: command_ref.html

Conclusioni

Probabilmente non avete bisogno di queste funzionalità tutti i giorni, ma se si deve manipolare dei file pdf in Linux, pdftk è lo strumento che fa per voi.
Con esso sarete in grado di fare un sacco di cose diverse con facilità, ottenendo buoni risultati in poco tempo.

Riferimenti

Manipulating PDFs with the PDF Toolkit

PDFtk Examples


Popular Posts:

Flattr this!

 Leave a Reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

(required)

(required)

*