Da un post di Salvatore Aranzulla sono venuto a conoscenza di TopOCR, un software OCR dalla caratteristiche davvero interessanti.
L’acronimo OCR designa un tipo di programma dedicato alla conversione di un’immagine contenente testo in un testo in formato modificabile con un normale programma di videoscrittura come Microsoft Word, Writer, o Abiword. Solitamente le immagini sono acquisite da uno scanner d’immagini o da un sistema di digitalizzazione che si avvale di una fotocamera, telecamera o di una webcam.
Nel lavoro quotidiano dell’insegnante, software di questo tipo sono utili quando, ad esempio, ci si trova nella necessità di ricopiare un testo lungo o di rielaborarne il contenuto. Nel panorama di software OCR esistono applicazioni davvero performanti quali Abbyy Finereader o OmniPage, tanto per citarne alcune, che purtroppo hanno l’unica pecca di non essere gratuite.
TopOCR, pur essendo un software libero rilasciato con licenza open source, non sfigura difronte ai suoi concorrenti più importanti, dimostrandosi un buon software OCR dalle ricche funzionalità. Qui sotto trovate elencate le principali caratteristiche.
- Possibilità di acquisire immagini di testi da convertire mediante più periferiche (scanner tradizionale, fotocamera digitale, cellulare dotato di fotocamera con risoluzione minima di 3 megapixel).
- Grado di accuratezza vicino al 99,8%.
- Gestione di pagine con sia testo che grafica.
- Esportazione in diversi formati inclusi PDF e HTML.
- Riconoscimento dei caratteri in 11 lingue diverse.
- Editor di testo ed immagini incluso.
- Spell cheker in 11 lingue diverse.
- Supporto per creare dal testo un file sonoro attraverso l’utilizzo di codec esterni per la sintesi vocale (Text To Speech).
Quest’ultima caratteristica offre delle interessanti prospettive di utilizzo nei casi di bambini con disturbo specifico di apprendimento (es. dislessia). Dotandosi di voce sintetizzata da installare nel computer (se ne possono acquistare ad un prezzo accessibile a questo indirizzo), si possono sfruttare le funzioni integrate in TopOCR di lettura sintetizzata e salvataggio del testo acquisito o salvato in un file di testo (.txt) in formato audio (.wav). Queste funzioni, accessibili dal pulsante “TextToSpeech” nel pannello di destra del programma, possono a mio avviso rivelarsi utili per creare audiolibri a supporto della didattica o dello studio individuale, trasferibili su cd o chiavette usb.
Andate a questa pagina per scaricare l’ultima versione di TopOCR (cliccate sul pulsante a forma di macchina fotografica per far partire il download).
Prima di cimentarvi nell’utilizzo di TopOCR, consiglio di leggere il tutorial presente nell’articolo di Salvatore Aranzulla citato sopra. Troverete delle chiare e dettagliate spiegazioni che vi aiuteranno ad installare e ad utilizzare correttamente il programma.
antonio dice
Non so se posso aiutarti Davide dal momento che ho usato Topocr esclusivamente per testi scritti in italiano. Mandami un file d’immagine di una parte del testo che vuoi digitalizzare e vedo cosa posso fare. Ciao!
Davide dice
Ciao Antonio, avrei una richiesta da farti se puoi aiutarmi: devo, utilizzando topocr, creare un testo sia in lingua francese che in lingua italiana. Quando pero’ apro il testo in francese, nella parte destra(quella in cui si dovrebbe trasferire il testo editabile) , il testo non viene fuori. Viene fuori una serie indecifrabile di caratteri. Come posso risolvere il problema? Non penso che tra le undici lingue il francese sia escluso.
Grazie
annarita dice
Ottimo, Antonio! Un software imperdibile. Grazie:)
Annarita
elisa dice
Ciao Antonio, grazie della visita nel blog! mi spiace che non riesca a visualizzare bene il blog, ma ciò è dovuto al fatto che navighi molto probabilmente firefox , mentre con internet explorer si visualizza benissimo! comunque toglierò quello sfondo perchè già diverse persone mi hanno segnalato questo problema che io non rilevo poichè uso internet explorer. Ciao e a risentirci
elisa