Apr 242011
 

gImageReaderTesseract-ocr: come trasformare in testo editabile i documenti acquisiti tramite scanner su Ubuntu o Debian, Articolo originale di Gabriele, pubblicato su Gmstyle.

Ho appreso, dalle richieste pervenutemi via email, che alcuni dei miei lettori utilizzano Ubuntu (o Linux in generale) per lavorare ed occuparsi di grafica o editoria, chi per professione e chi per hobby. Prendo spunto proprio dalla richiesta di un caro ed affezionato utente di questo piccolo spazio web, che ringrazio per l’input fornitomi, per fare un pò di chiarezza su di un argomento che, da quanto mi è parso capire durante le mie ricerche su internet, sembra aver creato qualche difficoltà di applicazione.

L’argomento in questione riguarda la tecnologia OCR (Optical Character Recognition) e cioè quella “tecnica” che permette di riconoscere caratteri testuali, per poi rendere tale testo editabile, partendo da immagini di documenti cartacei, precedentemente digitalizzati attraverso lo scanner.

Continue reading »

Flattr this!