cover image

Reconnaissance optique de caractères

procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte / De Wikipedia, l'encyclopédie libre

La reconnaissance optique de caractères (ROC, ou OCR pour l'anglais optical character recognition), ou océrisation, désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte.

Vidéo montrant un processus de reconnaissance optique de caractères effectué en direct grâce à un scanner portable.

Un ordinateur réclame pour l'exécution de cette tâche un logiciel d'OCR. Celui-ci permet de récupérer le texte dans l'image d'un texte imprimé et de le sauvegarder dans un fichier pouvant être exploité dans un traitement de texte pour enrichissement, et stocké dans une base de données ou sur un autre support exploitable par un système informatique.