PDFtk o Il PDF Toolkit è uno strumento open source cross-platform per manipolare documenti PDF. pdftk è fondamentalmente un front-end per la libreria iText (compilata in codice nativo utilizzando GCJ), capace di dividere, unire, cifrare, decifrare, decomprimere, ricomprimere, e riparare file PDF.
Se il formato PDF è carta elettronica, allora pdftk rappresenta l’insieme di tutti gli strumenti che si possono usare per rilegare, cancellare, cifrare qualsiasi documento.
pdftk è un semplice strumento per fare le cose di tutti i giorni con i documenti PDF. Sempre meglio avere questo strumento uno nel primo cassetto della scrivania e usarlo per:
- Unire documenti PDF
- dividere le pagine PDF in un nuovo documento
- decifrare il documento se necessario (richiesta password)
- cifrare il documento, se si vuole
- compilare moduli PDF con dati FDF
- applicare una filigrana allo sfondo
- Report sulel metriche del PDF, tra cui i metadati e segnalibri
- aggiornare i metadati del PDF
- allegare file a pagine PDF o al documento PDF
- scompattare gli allegati pdf
- Dividere un documento PDF in pagine singole
- decomprimere e ri-comprimere la pagina
- Riparazione di un file pdf danneggiato (se possibile)
Installazione
Installation
Il pacchetto pdftk dovrebbe essere disponibile in tutti i repository delle distribuzioni più comuni, quindi per installarlo in genere è possibile utilizzare il gestore di pacchetti della propria distribuzione come ad esempio:
Debian, Ubuntu, Mint:
apt-get install pdftk |
Fedora
yum install pdftk |
Arch Linux
yaourt -Sy pdftk |
Debian, Ubuntu, Mint:
apt-get install pdftk |
Fedora
yum install pdftk |
Arch Linux
yaourt -Sy pdftk |
Uso di base
La sintassi di base del PDFTK è la seguente:
pdftk input_file operazione output_file
Le operazioni corrispondono all’azione desiderata che si vuole fare sui file.
- cat concatenazione
- burst Divide un unico documento PDF in ingresso in pagine singole.
- dump_data Estrazione di metadati, segnalibri (bookmarks) e le etichette delle pagine da un PDF
- uncompress decompressione
- attach_files Include allegati in un documento PDF
- unpack_files Estrazione di allegati da un documento PDF
- fill_form Compila moduli PDF con dati FDF1) o XFDF2)
- background Applica un watermark PDF per lo sfondo ad un PDF in ingresso
- stamp Questo fà esattamente la stessa cosa dell’operazione background tranne che sovrappone sulla parte superiore della pagina PDF delle pagine di ingresso
- generate_fdf Legge un unico file PDF di input e genera un file FDF adatto per fill_form
- dump_data_fields Legge un unico file PDF di input e riporta i suoi metadati, i segnalibri e le pagine metriche.
- update_info Aggiorna i metadati
PDFtk Examples
Unire i files
Supponiamo di voler unire due documenti (1.pdf e 2.pdf) in un unico file (both.pdf), il comando sarà:
$ pdftk 1.pdf 2.pdf cat output both.pdf |
Il comando cat assembla le pagine da file PDF di input per creare un nuovo PDF. Usare cat per unire pagine PDF o dividere pagine PDF da documenti. È anche possibile utilizzarlo per ruotare le pagine in formato PDF. L’ordine delle pagine nel nuovo PDF è specificato dal ordine delle pagine e degli intervalli di pagina dati, questo può essere utile per:
Unire pagine specifiche da file diversi
Supponiamo di voler unire due documenti (1.pdf e 2.pdf) in questo modo: le prime 2 pagine del file 1.pdf e le pagine pari da 10 a 20 del 2.pdf, il comando sarà:
pdftk A=1.pdf B=2.pdf cat A1-2 B10-20even output out.pdf |
Dividere file
E’ anche possibile dividere i file PDF con pdftk. L’opzione burst scompone un PDF in più file – un file per ogni pagina:
pdftk mylong_guide.pdf burst |
Questo comando creerà un sacco di file con nomi corrispondenti ai loro numeri di pagina, come ad esempio pg_0001 fino a pg_0125.
Sicurezza
Crittografare un documento PDF con una chiave a 128 bit e rimuovere tutti i diritti (default):
pdftk mydoc.pdf output mycrypted_doc.128.pdf owner_pw foo |
Idem come sopra, tranne la password baz deve essere utilizzata per aprire il PDF prodotto
pdftk 1.pdf output mycrypted_doc.128.pdf owner_pw foo user_pw baz |
Decifrare un PDF :
pdftk mycrypted_doc.128.pdf input_pw foo output déchiffré.pdf |
Aggiunta di allegati
Questa caratteristica può essere utile per includere un documento in un altro formato, immagini, o ulteriori informazioni in un PDF pubblicato
Con pdftk è possibile allegare binari e file di testo in un PDF con facilità. È anche possibile specificare in quale pagina del file PDF si desidera che compaia l’allegato con un comando come questo:
pdftk html_tidy.pdf attach_files command_ref.html to_page 24 output html_tidy_book.pdf |
Questo collega alla pagina 24 del documento html_tidy_book.pdf il file html: command_ref.html
Conclusioni
Probabilmente non avete bisogno di queste funzionalità tutti i giorni, ma se si deve manipolare dei file pdf in Linux, pdftk è lo strumento che fa per voi.
Con esso sarete in grado di fare un sacco di cose diverse con facilità, ottenendo buoni risultati in poco tempo.
Riferimenti
Manipulating PDFs with the PDF Toolkit
Popular Posts:
- None Found