Controlla la velocità della tua connessione

VAI AL CONTENUTO DELLA PAGINA | VAI AL MENU PRINCIPALE

ONLUS
via Borgognona, 38 - 00187 Roma Tel 06.69.98.81 - Fax 06.67.86.815 - numero verde 800 682682 - Part. I.V.A. 00989551007

U I C - Osservatorio Siti Internet - OSI -

VAI AL MENU PRINCIPALE

TopOCR. OCR freeware.

Salvo specifici casi di attività professionale in ambito editoriale, non è frequente trovare persone che utilizzano ogni giorno un programma di OCR (Optical Character Recognition). Nel momento in cui diventa necessario recuperare testo da un'immagine per incollarlo in altri documenti, però, è importante averne uno che sia agevole da utilizzare ed efficiente nelle funzionalità.

Perché un OCR sia valido, il primo requisito da possedere è l'efficacia del riconoscimento. In mancanza, si rischia di impiegare tempo in operazioni che conducono a un esito finale insoddisfacente. Proprio per questo, chi ne ha bisogno di solito acquista uno dei programmi più noti, in commercio da anni, spesso con un costo di acquisto non propriamente basso.

TopOCR, invece, è freeware. Ciò nonostante, svolge il suo compito con semplicità e buoni risultati. Tra l'altro, oltre al puro riconoscimento del testo, integra un certo numero di strumenti aggiuntivi. Utilizzandoli, si migliora la qualità del lavoro e si ottiene una più comoda fruizione dei risultati.

Tra essi ci sono la lettura del testo attraverso gli altoparlanti, la generazione di file audio MP3 e l'acquisizione di immagini da cellulari e da altre periferiche. Il modulo OCR Nella fase di lettura, TopOCR riconosce testo appartenente a undici lingue, tra cui l'italiano e quelle occidentali più diffuse: inglese, francese, spagnolo e tedesco. Non gestisce lingue come arabo, cinese e giapponese.

Lanciandolo in esecuzione, si aprono due finestre affiancate che rimangono agganciate tra loro anche quando se ne sposta una sul Desktop.

In quella di sinistra avviene il riconoscimento dei caratteri. Quella di destra, TopOCR Text, corrisponde a un vero e proprio programma di gestione testi.

Quando si apre il file di un'immagine, il programma ne visualizza il contenuto nella finestra di sinistra e lancia immediatamente il motore di riconoscimento del testo. Il risultato dell'elaborazione viene visualizzato sulla destra, dove può essere corretto e modificato a piacere.

Per evitare di sottoporre l'intera immagine al motore di conversione da immagine a testo, se ne può delimitare un'area rettangolare con il mouse. Successivamente la si copia e la si incolla nella finestra di sinistra, in modo da lanciare il riconoscimento del testo solo nella zona che interessa.

Secondo il produttore, la qualità del riconoscimento può raggiungere la percentuale del 99,8%, a patto di avere un'immagine di partenza di buona qualità. Un modo per migliorare la percentuale è ingrandire il testo con un fattore di zoom 2x o 4x. Nel programma, l'intervento può essere eseguito con uno dei comandi del menu Image ed essere ripetuto più volte. Oltre che in formato testo TXT, in uscita il programma genera file nei formati RTF, PDF e HTML.

TopOCR integra anche la funzione di acquisizione diretta di immagini da scanner, da webcam o da altri dispositivi di cattura immagini, purché abbiano interfaccia standard TWAIN.

Funzioni di TopOCR Text Le funzionalità sono del tutto analoghe a quelle di un programma di gestione testi. Si possono formattare caratteri e paragrafi e gestire elenchi puntati e numerati. In ogni pagina si possono inserire immagini, semplici tabelle e interruzioni di pagina. Inoltre, si possono gestire intestazione e piè di pagina e inserire campi il cui valore viene generato automaticamente, come la data di sistema o il numero della pagina corrente.

Una funzione utile è TextToSpeech. Attivandola, il testo viene riprodotto ad alta voce per ascoltarlo attraverso gli altoparlanti o le cuffie. La voce predefinita in Windows, però, ha inflessione in inglese (Microsoft SAM). Per ascoltare il testo con dizione in italiano, occorre installare il relativo motore di riproduzione audio.

Un'altra interessante funzione di TopOCR Text permette di registrare la lettura audio del testo in un file. Si può generare un file WAV e, da esso, un MP3 da ascoltare quando e dove lo si desidera, magari con un cellulare o con un riproduttore tipo iPod. Ne consegue una comodità da non trascurare per chi viaggia di frequente o si sposta in tragitti di una certa durata da un posto a un altro.

Aperto al mondo del lavoro TopOCR è stato sviluppato anche per recuperare testi da immagini catturate con fotocamere digitali o da cellulari, purché i dispositivi abbiano un obiettivo di almeno 3 Megapixel e l'illuminazione del supporto di partenza sia corretta. Nel caso contrario la qualità dell'immagine potrebbe non essere sufficiente per garantire un corretto riconoscimento. In ambito lavorativo la caratteristica può essere sfruttata per acquisire le scritte stampate sui biglietti da visita e ridurre il tempo necessario per inserirle nella propria rubrica informatizzata.

Un altro impiego potrebbe essere l'acquisizione di testi da documenti cartacei ricevuti in una riunione di lavoro o consegnati da interlocutori istituzionali, per inviarli telematicamente al proprio ufficio in tempo reale. Anche per questo, del programma esiste una versione installabile in un palmare/smartphone con Windows Mobile 6.0 e interfaccia Web. Con questa configurazione, si può acquisire un testo al volo per inviarlo come allegato in posta elettronica o direttamente a un server Web in Internet.

Nella pagina Web http://www.topocr.com/mtutorial.html sono pubblicati diversi consigli su cosa fare per avere una buona immagine da convertire in testo. Dalla stessa pagina si può prelevare un file PDF con una pagina campione da utilizzare per la calibrazione delle periferiche di cattura delle immagini.