Convertire documenti .pdf in files .txt – guida

Una facile guida che spiega come effettuare la conversione tra documenti pdf e semplici files di testo in formato txt. A cosa serve tale conversione, vantaggi e svantaggi, come effettuarla utilizzando i programmi per visualizzare PDF oppure ricorrendo a delle comode applicazioni online gratuite.

[ad#h]Il PDF, acronimo per Portable Document Format, è un formato di files ideato e diffuso dalla società Acrobat, rappresenta oggi uno standard ufficiale e di fatto per la distribuzione e stampa di documenti di vario tipo. Il numero di periferiche in grado di aprire, visualizzare, documenti pdf è elevatissimo, dai classici computer fino ai più recenti smartphone e tabletPC. Vi sono però situazioni in cui si vorrebbe poter gestire documenti in un formato più semplice, magari un file di testo piano.
Certo, con un .txt si ha il solo testo, i segni di punteggiatura, i ritorni a capo e null’altro; niente immagini, links, colori o altri elementi di formattazione, di sicuro un bel limite. Di contro i semplici txt possono vantare dimensioni estremamente ridotte, un intero libro può essere infatti contenuto in poche centinaia di Kb (kilobytes).
Personalmente posseggo un paio di telefonini cellulari, si tratta di modelli cinesi senza alcun brand, i quali hanno in dotazione una sorta di eBook reader. Purtroppo tale applicazione offre unicamente funzionalità di base, in pratica può visualizzare solo dei comunissimi files di testo e nessuno degli altri formati comunemente urilizzati per gli ebook (pdf, ePub, Lit e così via).
Trovandomi a possedere diversi libri in pdf mi sono quindi adoperato per una conversione, trasformare questi files in txt al fine di poterli leggere anche sul piccolo schermo del telefonino.

Il metodo più semplice e diretto per effettuare tale operazione è copiare il testo dall’interno del pdf ed incollarlo in un qualunque documento di testo. Molti programmi dedicati alla visualizzazione di Pdf, tra cui il notissimo Adobe Acrobat Reader, permettono di selezionare il testo, allo stesso modo di come si farebbe con un comune documento di Word oppure con l’apposita voce Seleziona Tutto nel menu modifica. Quindi selezioniamo tutto o la porzione che ci interessa, premiamo CTRL+C per copiarlo negli appunti, poi apriamo un editor (ad esempio il classico notepad) e incolliamo il testo nel documento vuoto con i tasti CTRL+V (incolla). Infine salviamo il documento ed abbiamo ottenuto il nostro Txt.

Chi non si trova bene con questo metodo oppure ha a che fare con molti pdf e trova noiosa la pratica del copia incolla, può ricorrere a delle semplici applicazioni online che svolgono tale compito in maniera veloce e soprattutto gratuita.
A tal proposito vi segnalo ConvertPdfToText, cliccate sul pulsante  scegli file al centro della pagina, selezionate il Pdf che volete convertire e infine cliccate sul pulsante Convert and Download, in breve tempo potrete scaricare il file di testo risultante dalla conversione.
Un’altra applicazione online utilizzabile per questo scopo è quella offerta da Online-Convert, il funzionamento è simile al precedente: si seleziona il file da convertire e si preme quindi l’apposito bottone per avviare l’operazione. Online convert può generare txt anche da documenti doc, docx, odt, rtf, html ed altri formati.

Qualunque sia il metodo che voglia utilizzare, alla fine mi ritroverò con un normalissimo file di testo, il cui contenuto è visualizzabile senza problemi anche da molti telefoni non avanzatissimi.
Tra l’altro c’è anche un vantaggio in termini di spazio. Giusto per citare un esempio, un libro PDF da 350 kylobytes circa, una volta convertito in TXT pesa appena 140 Kb, un risparmio di spazio superiore al 50%. Tale vantaggio appare ancora più evidente se si applica una compressione Zip (invia a cartella compressa da Windows), il pdf è assai poco comprimibile ed in effetti a seguito della creazione di un file zip risparmio solo pochi Kb, il TXT zippato pesa invece solo 50Kb, non male vero?

[ad#rpsx]Problemi e limiti. Per quanto appena visto la conversione pdf>txt appare semplicissima, ma il risultato può essere considerato buono solo nel caso in cui il testo è contenuto nel pdf sotto forma di caratteri alfanumerici. Situazione assai diversa se il testo è invece contenuto in una immagine (ad es Jpg) poi inserita all’interno del pdf, in tale caso infatti ciò che appare ai nostri occhi come una sequenza di lettere (e numeri) è considerato dal PC come un insieme di punti componenti in effetti un disegno. Per estrarre testo da una immagine si ha bisogno di un avanzato programma di riconoscimento (detto OCR), ma l’uso di tali tecniche esula dagli scopi di questa semplice guida.

Lascia un commento