OCR online gratuito

Collegandosi ai siti di Novadys Italia oppure Synchronice è possibile utilizzare un OCR online per convertire immagini digitali in files di testo. Il servizio permette in maniera del tutto gratuita, e con buoni risultati, di effettuare il riconoscimento ottico dei caratteri presenti in files grafici come Tiff, Jpeg e Pdf (non protetti da password).

Quattro sono i semplici passi da seguire per servirsi dell’OCR online:

  1. caricare l‘immagine o il pdf dal nostro computer
  2. impostare la lingua del testo contenuto (italiano, inglese, tedesco)
  3. impostare il formato del file di testo nel quale si desidera convertire il file grafico (DOC, PDF con testo selezionabile)
  4. indicare l’indirizzo email al quale si desidera che venga inviato il file di testo.

Ricordo che è possibile convertire 10 files al giorno. Per avere un buon risultato si consiglia di caricare immagini a 300 dpi. La dimensione massima consentita è di 3 MB. Ho testato il servizio e devo riconoscere che i tempi richiesti per la conversione e l’invio del file sono davvero brevi: il documento mi è stato recapitato nella mia casella di posta direi quasi istantaneamente. Per quanto riguarda il rispetto della privacy, Novadys Italia garantisce che non saranno memorizzati né l’immagine originaria, né il file di testo risultante dall’OCR, né l’indirizzo del messaggio elettronico per la fornitura del file di testo. Questi dati saranno cancellati automaticamente una volta inoltrata l’email con in allegato il file convertito.

[Via Consulente Informatico]

Riconoscere un font da un’immagine

Se siete alla ricerca del font usato in un documento scritto su carta stampata o magari in una pagina web, vi consiglio di provare ad usare What The Font, un servizio online offerto dal sito di Myfonts. Grazie a questa applicazione, infatti, è possibile individuare il nome di un dato font a partire da un’immagine.

Vediamo brevemente qual è la procedura da seguire. Se il font da analizzare si trova sulla carta stampata, basta utilizzare uno scanner e fare la scansione di una piccola porzione del testo (bastano alcune parole) in cui è usato il font da riconoscere.  Se si tratta, invece, di un font trovato all’interno di un documento virtuale, come ad esempio una pagina web, un file pdf o nella didascalia di un’immagine, occorre effettuare uno “screenshot” selezionando la regione che presenta il font da individuare. Per effettuare lo screenshot consiglio di utilizzare il software opensource gratuito Greenshot, davvero semplice ed efficace. L’immagine acquisita via scanner o tramite screenshot non deve superare la dimensione 360 X 275 pixel. Molti sono i formati supportati da What The Font, tra cui GIF, JPEG, TIFF, BMP.

Una volta creata l’immagine,  occorre caricarla tramite l’uplouder di What The Font. In alternativa, si può inserire l’URL corrispondente alla relativa immagine.  Per il mio test ho usato l’ immagine qui sotto “scattata” da un foglio di Word, optando per un font un po’ complesso: Galeforce BTN.

Nel passaggio successivo mi è stato richesto di verificare se la casella di testo concordava con il carattere evidenziato nell’immagine. In aggiunta ho scritto nelle caselle a quali lettere corrispondevano le lettere in grassetto.

Ad analisi compiuta, mi sono state proposte diverse possibili opzioni sul probabile tipo di font. Tra i 41 tipi di font suggeriti, il 6° font è proprio quello da me usato per digitare il testo di esempio.

Come avete visto, la procedura da seguire per usare What The Font è davvero semplice e i risultati ottenuti dimostrano l’ottima qualità del servizio offerto da Myfonts.

[Via The Next Web]

Digitalizzare un testo con TopOCR

Da un post di Salvatore Aranzulla sono venuto a conoscenza di TopOCR, un software OCR dalla caratteristiche davvero interessanti.

L’acronimo OCR designa un tipo di programma dedicato alla conversione di un’immagine contenente testo in un testo in formato modificabile con un normale programma di videoscrittura come Microsoft Word, Writer, o Abiword. Solitamente le immagini sono acquisite da uno scanner d’immagini o da un sistema di digitalizzazione che si avvale di una fotocamera, telecamera o di una webcam.

Nel lavoro quotidiano dell’insegnante, software di questo tipo sono utili quando, ad esempio, ci si trova nella necessità di ricopiare un testo lungo o di rielaborarne il contenuto. Nel panorama di software OCR esistono applicazioni davvero performanti quali Abbyy Finereader o OmniPage, tanto per citarne alcune, che purtroppo hanno l’unica pecca di non essere gratuite.

TopOCR, pur essendo un software libero rilasciato con licenza open source, non sfigura difronte ai suoi concorrenti più importanti, dimostrandosi un buon software OCR dalle ricche funzionalità. Qui sotto trovate elencate le principali caratteristiche.

  • Possibilità di acquisire immagini di testi da convertire mediante più periferiche (scanner tradizionale, fotocamera digitale, cellulare dotato di fotocamera con risoluzione minima di 3 megapixel).
  • Grado di accuratezza vicino al 99,8%.
  • Gestione di pagine con sia testo che grafica.
  • Esportazione in diversi formati inclusi PDF e HTML.
  • Riconoscimento dei caratteri in 11 lingue diverse.
  • Editor di testo ed immagini incluso.
  • Spell cheker in 11 lingue diverse.
  • Supporto per creare dal testo un file sonoro attraverso l’utilizzo di codec esterni per la sintesi vocale (Text To Speech).

Quest’ultima caratteristica offre delle interessanti prospettive di utilizzo nei casi di bambini con disturbo specifico di apprendimento (es. dislessia). Dotandosi di voce sintetizzata da installare nel computer (se ne possono acquistare ad un prezzo accessibile a questo indirizzo), si possono sfruttare le funzioni integrate in TopOCR di lettura sintetizzata e salvataggio del testo acquisito o salvato in un file di testo (.txt) in formato audio (.wav). Queste funzioni, accessibili dal pulsante “TextToSpeech” nel pannello di destra del programma, possono a mio avviso rivelarsi utili per creare audiolibri a supporto della didattica o dello studio individuale, trasferibili su cd o chiavette usb.

Andate a questa pagina per scaricare l’ultima versione di TopOCR (cliccate sul pulsante a forma di macchina fotografica per far partire il download).

Prima di cimentarvi nell’utilizzo di TopOCR, consiglio di leggere il tutorial presente nell’articolo di Salvatore Aranzulla citato sopra. Troverete delle chiare e dettagliate spiegazioni che vi aiuteranno ad installare e ad utilizzare correttamente il programma.