Prova tecnica di SiRecognizer UMPC.

Di Gianluca Casalino.

Tratto da: http://www.spazioausili.net/

Premessa:

Comincio questa prova tecnica raccontando come ho conosciuto SiRecognizer e perch ho deciso di acquistarlo.

Mi trovavo a sfogliare le pagine del sito di Handimatica, alla ricerca delle novit che sarebbero state presentate durante l'imminente edizione della famosa fiera.

Svogliato e deluso dalla noia del programma, e dalla presenza dei soliti ausili e delle solite ditte che da tempo non facevano altro che ripresentare le medesime cose ormai "trite e ritrite", clickando in un'area del sito che non avrebbe dovuto contenere informazioni su ausili per non vedenti, (compresi in seguito trattarsi di un errore), qualcosa aveva calamitato la mia attenzione.

Era appunto la presentazione di Itex e dei suoi prodotti.

Incuriosito, ho cambiato subito parere e ho deciso di partecipare alla manifestazione in cerca di questo nuovo soggetto.

Per mia fortuna, trovai lo stand subito all'inizio del mio percorso, ma quando appresi cosa doveva fare SiRecognizer, reagii in modo molto istintivo e "presi in giro" gli autori affermando: "ma come? Mi distingue le belle donne dai manichini?".

Compresi l'enorme "gaffe" che avevo commesso. Infatti, non voleva essere un riconoscimento di oggetti tridimensionali in senso letterario, ma appunto si trattava di un OCR di testo applicato ad immagini di oggetti tridimensionali. Tramite una serie di elaborazioni e aggiustamenti, il programma  in grado di sottoporre all'OCR il testo presente su etichette e/o sfondi di ogni genere, sia esso lineare, circolare, dritto, obliquo, colorato, perch questo sia in seguito riconosciuto e letto al non vedente. Ho sottoposto alcuni oggetti provocatori per capire con cosa avessi a che fare, ma fui subito spiazzato.

SiRecognizer (che era in quel tempo alle prime beta), fu in grado di leggermi il testo scritto sul retro di un mio antennino gps e sul retro della batteria del mio cellulare, seriali compresi.

Era proprio il sussidio adatto per chi, della propria autonomia, oltre ad un'esigenza, ne fa una scelta di vita.

Comprai la versione da tavolo e a distanza di un'anno ho comprato anche la versione portatile.

Il mio intento, attraverso questa prova,  di focalizzare cos' SiRecognizer esattamente e quali potenzialit offre, non mancando di evidenziare cosa ancora rimane difficoltoso o cosa necessita di ulteriore sviluppo.

Descrizione:

Come si presenta

SiRecognizer  un sistema composto da vari elementi. La parte principale  costituita da un apposito software dall'interfaccia amichevole (della quale parleremo dopo), che si occupa di accogliere le immagini provenienti da differenti fonti e che incorpora il vero motore di riconoscimento e di trattamento delle immagini. La fonte principale  la fotocamera digitale, mentre in alternativa abbiamo lo scanner tradizionale e il caricamento diretto delle immagini/foto/pdf.

Non mi soffermer molto sulle ultime due, perch abbastanza simili a ci a cui siamo gi stati abituati da altri software di riconoscimento caratteri. Se ci limitiamo a considerare il software, parliamo di Si Recognizer Professional, nella versione da tavolo, poich necessita di un pc per poter funzionare.

Il prodotto Si Recognizer UMPC, invece  la versione trasportabile del sistema, poich l'applicazione  installata su un computer UMPC dalle dimensioni superiori a quelle di un palmare, ma molto inferiori a qualsiasi notebook o tabletPc.
Potete leggerne le caratteristiche in questa parte del sito: http://www.spazioausili.net/sistemi_di_lettura/sirecognizer_umpc

Tra gli accessori, invece degno di nota in questa prova tecnica,  il cubo per fotografare che non  altro che una struttura in plexiglass voluta per assistere e facilitare le operazioni di scatto ad un non vedente, grazie agli accorgimenti adottati per eliminare riflessi ombre o in generale disturbi che possono compromettere l'ottimale operazione di OCR.

La fotocamera,  accuratamente selezionata dalla ditta perch risponda a determinate caratteristiche di qualit. Tra le pi importanti ricordo l'autofocus, lo stabilizzatore d'immagine e una risoluzione pari o superiore a 5 megapixel.

Come potete capire, il sistema  completamente configurabile e personalizzabile e si presta in futuro ad aggiornamenti sia hardware che software.

Per questa prova, utilizzer SiRecognizer UMPC , composto da fotocamera Nikon s500, UMPC Samsung Q1 Ultra e uno Scanner Canon.

Interfaccia <

L'interfaccia semplice, composta da una fila di pulsanti, un'area di sola lettura, nella quale, vengono poi mostrati i risultati, da un controllo per lo scorrimento delle pagine (solo nella versione da tavolo), e dalla classica barra dei menu con le opzioni proprie di questa applicazione, non presenta particolari problemi d'accessibilit.

Usando jaws 8, tutto viene seguito correttamente, tranne qualche volta nell'area di lettura che pare non presentare una classe dell'oggetto familiare a questo screen reader.

Col braille abbiamo qualche problema in + soprattutto nel focalizzare i controlli in modo fluido e preciso, e addirittura si verifica uno strano bug su ogni prima opzione di menu, che, se pur vocalizzata, non appare sul display.

Suppongo che tali inconvenienti, si verifichino a causa dell'ambiente di sviluppo utilizzato per scrivere SiRecognizer. Infatti, penso trattarsi di Microsoft framework, che attualmente non  completamente supportato dagli screen readers.

Nvda, non presenta nessun ostacolo a patto che si utilizzi la versione allegata alla sua scheda tecnica su questo sito o non si chieda a Itex di fornire la build appositamente compilata, perch Nvda riconosca ogni controllo di SiRecognizer.

Utilizzando invece la sintesi inclusa col pacchetto, tutto viene prontamente vocalizzato, ma non in modo completo come ci si aspetterebbe e come avviene utilizzando gli screen readers citati sopra. In particolare, non sono riuscito a impostare lo scanner, perch la sintesi ha smesso di parlare e non sono stato in grado di riascoltare la finestra di editing senza spostare altrove il fuoco per poi riportarlo indietro.

L'ultima nota abbastanza curiosa  che non tutte le voci di menu sono tradotte in italiano e quando lo sono,  grazie agli script allegati con jaws.

Non sono presenti il menu d'aiuto e una guida in linea, dei quali se ne sente la mancanza, considerato il fatto che fino ad oggi non ci sono stati programmi simili e che la materia  completamente nuova anche per chi "bazzica" da tempo nel mondo dell'informatica.
 Acquisizione da scanner e da immagini o pdf caricati

Pur non essendo tra le caratteristiche principali e fondamentali del programma,tramite queste due operazioni, otteniamo risultati davvero degni di nota. Non possiamo disporre di tutte le funzioni presenti in un programma tradizionale, come ad esempio dizionario, controllo ortografico ed editing del testo riconosciuto, ma la semplicit dell'interfaccia e l'immediatezza dei comandi rendono le operazioni davvero pratiche in svariate situazioni, come ad esempio il riconoscimento in tempi rapidi di posta cartacea o bigliettini da visita ETC. La configurazione delle caratteristiche di scansione  completa e l'acquisizione di + pagine  efficace poich, senza dover decidere nulla a priori, basta semplicemente premere la barra spaziatrice per acquisire un nuovo foglio. Possibile anche il riconoscimento differito.

Per quanto riguarda il caricamento di immagini (quindi non foto), ho provato spesso ad importare immagini di scarsa risoluzione trovate in pagine web. Nel caso di numeri verdi o indirizzi o informazioni mostrate tramite "gif" anzich scritte, ho potuto recuperare nella maggior parte dei casi, ci che mi serviva.

Purtroppo sui box anti hacker, non si ottengono risultati soddisfacenti a causa delle distorsioni volute per confondere anche l'occhio umano.

Sui pdf abbiamo una delle vere sorprese presenti in questo prodotto. Ho potuto riconoscere con soddisfazione, bollette , fatture o documenti anche gi teoricamente accessibili con acrobat reader, ma comprendenti tabelle che solo tramite il riconoscimento ho potuto consultare.

Ottime le opzioni di esportazione che possono contare su un numero davvero esteso di formati.

Non penso ci si debba aspettare di pi per funzioni cos secondarie rispetto allo scopo primario del software. Risulta comodo, tuttavia poter disporre anche di queste in un ambiente unico e dall'utilizzo immediato.

Scatti con la fotocamera: risultati e considerazioni

Ho compiuto diversi test attorno alla fotocamera, per capire meglio, in presenza di scarsi risultati, se imputare questi a limiti oggettivi degli algoritmi, a problemi nell'utilizzo della fotocamera da parte di un privo della vista, o se la mancanza del cubo in plexiglass costituisce un insormontabile ostacolo.

Ho rinunciato a quest'ultimo strumento, per motivi di spazio, di praticit, ma anche per sviluppare capacit tali da poter acquisire foto in ambienti diversi e in condizioni disparate.

Infatti, da prove che avevo fatto o alle quali avevo assistito in molte dimostrazioni, appariva chiaro che nel cubo fosse ricreata la situazione ottimale per scattare foto precise e chiare dalle quali fosse possibile trarre i migliori risultati.

NEI casi come il mio, vengono forniti degli speciali filtri, montati sulla fotocamera, per trarre le stessefacilitazioni del cubo almeno per quanto riguarda luce eriflessi. Per la direzione dello scatto, la messa "in asse" dell'inquadratura e la sua centratura, senza cubo, non c' nulla a disposizione che non le proprie capacit e le indicazioni che durante il corso o assieme alla consegna del prodotto vengono fornite.

Possiamo, tuttavia contare su suggerimenti che il software fornisce dopo il primo scatto, su come spostare la fotocamera per migliorare la foto.

I primi risultati furono pessimi e scoraggianti. Ottenevo scarsi riconoscimenti anche su cose semplici. La mancanza d'esperienza e del cubo si facevano sentire. Seguendo per scrupolosamente le avvertenze dei produttori, e sforzandomi di ricreare le condizioni di scatto necessarie, ho cominciato a raccogliere successi significativi.

Scatto dopo scatto il posizionamento dell'oggetto davanti alla fotocamera, mi appariva come un'operazione naturale tranne che per oggetti pi complessi come bottiglie o in generale cose circolari e alte per le quali  difficile prendere punti di riferimento.

Ho provato il riconoscimento del retro di un cd, prima dalla foto e poi dallo scanner. Quest'ultimo mezzo fornisce risultati pi puliti, ma riconosce soltanto le scritte principali, mentre tramite foto, con qualche "sporcizia" ho potuto recuperare tutte le informazioni presenti.

Da confezioni di medicinali o del latte, ho letto scadenza, ingredienti o composizione del prodotto. Sulle bottiglie, invece, qualche manovra in pi mi  occorsa, ma le 9 strategie d'elaborazione sulle quali possiamo contare, hanno permesso comunque di recuperare ci che ci si aspettava.

Uso molto il termine recuperare, perch  chiaro che non otteniamo copie conformi delle etichette, ma spesso una buona percentuale di conformit mischiata a "sporco (caratteri incerti o non esistenti) che ci nonostante bastano a capire il senso del testo.

A volte, ci che non viene mostrato col primo scatto, viene poi ottenuto tramite le strategie di riconoscimento successive.

Le cose cambiano, quando si ha l'ambizione di voler fotografare oggetti in mobilit o in generale tenendo la fotocamera lontana da un piano d'appoggio. Probabilmente il sottoscritto non  molto abile a tenere la macchina in asse, ma coll'esperienza qualcosa si riesce a migliorare.

I primi giorni ho abbandonato ogni speranza, ma in ultimo ho preso coraggio e ho cercato di fotografare i cartelli che mostrano gli orari del bus.

Chi ha potuto controllare i risultati, mi conferma trattarsi di foto storte o mezze tagliate. SiRecognizer, invece tramite un primo raddrizzamento e qualche altra rielaborazione, ha in modo insperato riconosciuto l'elenco degli orari con la chiarezza sufficiente per la necessaria consultazione.

Mi riserver di fare altre prove in futuro, soprattutto quando personalmente mi sentir completamente disinvolto nell'effettuare le foto.

Conclusioni::

Siamo di fronte ad un prodotto interessante che, a mio avviso, centra gran parte degli obiettivi fissati. Adatto a chi vive da solo per i propri oggetti quotidiani, risolve i bisogni contingenti.

Chiedere a qualcuno di leggerci le etichette  sicuramente ancora la via pi rapida, ma spesso le urgenze non ci permettono di aspettare ed ecco che anche se dopo qualche manovra laboriosa, in pochi minuti otteniamo le informazioni attese.

Le 9 strategie di riconoscimento costituiscono il punto forte del sistema, mentre, invece, l'interfaccia e l'utilizzo incompleto senza screen reader, sono i punti deboli. A questi aggiungo l'assenza di documentazione che non pu assolutamente mancare in un pacchetto del genere.

Non posso negare che il supporto di Itex non si fa attendere ed  sempre preciso e puntuale, tuttavia  giusto che anche chi non possiede il prodotto, o chi non abbia tempo di mettersi in contatto con loro, possa poter disporre su help in linea, manuali o tutorial che guidino attraverso questo nuovo strumento per l'autonomia.

Siamo infatti di fronte a concetti difficili ed insoliti che non appartengono al mondo del "non vedere". Si  obbligati ad astrarre situazioni o nozioni totalmente privi di senso per chi, ad esempio non ha mai visto.

SiRecognizer Attualmente  un sistema trasportabile,ma non completamente utilizzabile in mobilit. E' comodo poter scattare foto da importare e riconoscere in un secondo momento, ma l'utilizzo diretto  ancora un po' scomodo.

Speriamo in futuro di poter contare su un hardware all in one, compatto che permetta l'uso di SiRecognizer in ogni situazione. Del prezzo non ho parlato poich esula dagli scopi di questa prova. Tuttavia, mi pare costituisca un ostacolo, per chi non riesca a contare su qualche contributo in sussidio.

La ricerca che sta alla base di SiRecognizer merita di essere sostenuta e probabilmente giustifica o spiega il motivo di tale importo elevato.

Di fronte per all'abbattimento delle barriere che ci legano ancora alla dipendenza di qualcuno che vede, non sono convintoci si possa fermare ad una mera questione di prezzo.

Ad esempio, i cartelli dei bus, avrei potuto farmeli leggere, ma non considerando il fatto che ora, posso archiviare gli orari per la loro consultazione in ogni momento mi occorra, avere fatto tale operazione in completa autonomia, credetemi, ha tutto un altro sapore!!

`Gianluca Casalino. <gilucasa@gmail.com>`_
