Scritto da Ana Canteli il 6 maggio 2022
L'origine del riconoscimento ottico dei caratteri - Optical Character Recognition (OCR) - può essere fatta risalire all'inizio del XX secolo, quando nel 1914 Emanuel Goldberg sviluppò una macchina che legge i caratteri e li converte in codice telegrafico standard. Tuttavia, fu solo nel 1974 che i progressi più notevoli furono raggiunti per mano di Ray Kurzweil, che migliorò il riconoscimento ottico dei caratteri stampati indipendentemente dal tipo di carattere; con l'obiettivo di realizzare una macchina di lettura per non vedenti o ipovedenti.
Questa origine aneddotica e con uno sviluppo così esteso nel tempo e disparato nei suoi obiettivi, ha portato a una tecnologia rivoluzionaria come l'OCR. Attualmente è incluso in smartphone, smart glass, dispositivi connessi a Internet che leggono testi grazie alle fotocamere integrate in essi. E dove prima era concepito per migliorare l'accessibilità alle informazioni per persone con bisogni speciali, oggi viene utilizzato massicciamente in innumerevoli operazioni, per beneficiare dei vantaggi che offre e migliorare l'efficienza dei processi organizzativi a livello globale.
Se hai mai utilizzato un'app sul tuo telefono che traduce automaticamente i segni scritti in una lingua straniera, quell'app sta utilizzando l'OCR. Né la tipografia né la lingua sono già un limite. Le condizioni di illuminazione o di risoluzione non devono più essere ottimali.
Sin dal suo inizio , la tecnologia di riconoscimento ottico dei caratteri (OCR) è diventata una soluzione commerciale utilizzata per automatizzare l'estrazione di dati, sia dal testo stampato che dall'immagine scansionata di un documento, in modo leggibile da un computer. Pertanto, i dati così ottenuti diventano utili per gli utenti che possono effettuare ricerche o attività di modifica.
Il sistema di gestione dei documenti OpenKM include un motore di riconoscimento ottico dei caratteri ( Tesseract o Cuneiform ) per ampliare i casi d'uso ed estendere così le potenzialità delle funzionalità del software, ovunque l'organizzazione lo richieda.
I vantaggi che offre zonal ocr sono i seguenti:
Il riconoscimento ottico dei caratteri è spesso una tecnologia nascosta in molti processi aziendali, che guida una varietà di servizi su base giornaliera. La capacità di estrarre testo stampato a macchina da un'immagine digitale è solo un aspetto dell'acquisizione dei dati. Infatti, il software di gestione dei documenti di OpenKM può eseguire l'estrazione di testo da documenti in diversi formati: check box (OMR), codici a barre, ecc. Il sistema di riconoscimento ottico dei caratteri di OpenKM funziona con dei plugin, in modo che il sistema possa essere adattato alla lettura dei dati in ingresso richiesta: testo, cifre, codici alfanumerici, codici a barre di qualsiasi tipo, ecc.
Un altro utilizzo molto comune della tecnologia OCR è la conversione automatica di un file in formato immagine, jpg, jpeg, png, bmp, in PDF, per garantire una migliore usabilità e neutralità del formato. In questo modo possono essere trattati molti tipi di documenti come contratti, ricevute, fatture, estratti conto bancari, ecc.
OpenKM fornisce il riconoscimento ottico dei caratteri per indicizzare e facilitare le attività di ricerca, anche a livello di corpo del documento. Applica anche il riconoscimento ottico dei caratteri zonale, in modo che il sistema di gestione dei documenti sia addestrato in modo che sia in grado di identificare tipi di documenti ed estrarre le informazioni in essi contenute sotto forma di metadati.
Una società di autonoleggio desidera controllare lo stato di ogni operazione di autonoleggio in tempo reale. Questa azienda ha molti uffici in tutto il paese.
Inoltre, hai informazioni importanti in un database in una terza applicazione.
Per gestire tutta la documentazione relativa ad ogni operazione di noleggio autoveicolo, verranno predisposti i template OCR relativi alla documentazione legata all'eventuale noleggio, uno di questi è il template “permesso di circolazione”.
L'OCR zonale incluso come standard in OpenKM viene utilizzato per acquisire informazioni che appaiono sempre nello stesso posto e che soddisfano sempre le stesse caratteristiche. In questo caso, fintanto che l'OCR rileva una targa e un numero di telaio in punti specifici del documento, OpenKM riconoscerà il tipo di documento “Permesso di circolazione”. Si tratta di informazioni di cui l'Amministratore deve tenere conto.
Un utente normale, un impiegato, quello che deve fare è scansionare la documentazione obbligatoria per poter noleggiare un'auto. Tra questa documentazione deve esserci il permesso di circolazione del cliente.
Il percorso automatico per il documento inizia nella cartella Scanner automatizzato. In questo scenario il dipendente al servizio del cliente ha terminato il suo compito.
Ora immaginiamo di essere un altro dipendente dell'azienda; Lavoriamo per il reparto servizio clienti e abbiamo ricevuto una chiamata. (Andiamo nel motore di ricerca / ricerca avanzata / Metadati / selezioniamo il gruppo di metadati “Registrazione” e selezioniamo il campo di ricerca “Registrazione”) La prima cosa che dobbiamo fare è verificare se stiamo parlando con un cliente o se abbiamo per rilasciare la linea.
La persona che ci chiama lo fa dalla strada; c'è rumore e non capiamo bene. Siamo riusciti a sentire le prime 2 cifre della targa e possiamo verificare come OpenKM sia in grado di darci informazioni con questi dati. Dal motore di ricerca possiamo vedere che abbiamo un permesso di circolazione nella documentazione; possiamo continuare a porre domande ai clienti e continuare con il servizio.
Inoltre, se analizziamo il gruppo di metadati legati al permesso di circolazione, possiamo vedere come OpenKM ha gestito la documentazione in questo caso d'uso.
Tanto per cominciare, ha rinominato il documento, con gli attributi più importanti per l'azienda: la targa e il tipo di documento. (Quando il documento entra in OpenKM entra con un codice automatico come nome). Ha anche convertito il file in PDF, per consentire l'accesso a lungo termine alle informazioni.
E a sua volta ha collegato più informazioni al documento. Nel gruppo di metadati compare la targa, il numero di telaio e il tipo di documenti. Informazioni che provengono dal riconoscimento ottico dei caratteri. Ma anche la data, la marca, il modello e il codice fiscale del cliente; che sono informazioni che provengono dal database integrato con OpenKM.
E soprattutto: dov'è questo documento? Dal motore di ricerca, il software di gestione documentale ci porta nel percorso in cui il documento è stato archiviato automaticamente sotto il nome dell'ufficio, che ha gestito l'operazione, e dove compare il documento, accanto al campo dei metadati aggiunto e compilato automaticamente da OpenKM.
Il sistema di gestione dei documenti OpenKM può essere adattato a qualsiasi scenario. Se vuoi sapere come implementare i miglioramenti che il riconoscimento ottico dei caratteri può portarti, non esitare a contattarci.