|
L'OCR permet de renter de manière automatique
et rentable les textes imprimés dans notre système informatique.
|
|
Bien que les travaux sur l'OCR aient commencé
il y a plus de 30 ans, ce domaine reste encore peu connu |
|
d'un grand nombre de gens concernés
par les problèmes d'entrée de documents. |
|
Aujourd'hui il est possible d'équiper
notre bureau de cet outil pour des prix très raisonables et nous
décharger |
|
des codages et réencodages
fastidieux. |
|
L'OCR est le moyen le plus efficace et le plus
rapide pour rentrer des textes automatiquement dans l'ordinateur. |
|
|
|
Comment est-ce possible ? |
| 1. |
Le document est lu par le scanner, qui agit
comme l'oeil de l'ordinateur et lui envoie l'image du document. |
| 2. |
Le logiciel du scanner va extraire de cet ensemble
de points noirs et blancs, les symboles alphanumériques |
| |
du document. |
| 3. |
S'il n'a pas reconnu un caractère ou
s'il n'a pas bien lu celui-ci, il faut corriger manuellement |
| |
le texte (par exemple si au lieu de "d"
on trouve "cl"). |
| 4. |
Cet apprentissage permet au logiciel de reconnaître
de plus en plus de caractères en nous faisant gagner du temps. |
| |
|
| |
OCR = acronyme de
Optical Character
Recognition (Reconnaissance
optique de caractères).
|
| |
On appelle OCR tout
procédé qui permet d'analyser des images acquises par le scanner
et d'en extraire le texte |
| |
sous forme d'un document exploitable par un
traitement de texte. |