Reconnaissance optique de caractères (ocr), Technologie ocr d’omnipage pro – Xerox WorkCentre C2424-12291 Manuel d'utilisation

Page 24

Advertising
background image

24

Introduction

Reconnaissance optique de caractères (OCR)

La reconnaissance optique de caractères (OCR) est une opération qui
consiste à extraire du texte d’une image obtenue par numérisation d’un
document papier ou par ouverture d’un fichier image électronique. Le texte
d’une image n’est pas directement utilisable car ses caractères se composent
de groupes de points (pixels).

Pendant la reconnaissance, OmniPage Pro analyse l’image proposée, identifie
les caractères qu’elle contient et définit les solutions permettant de les
transformer en texte éditable. À l’issue de la reconnaissance, le texte peut être
enregistré dans la plupart des applications (logiciels de traitement de texte ou
de PAO, tableurs, etc.).

Technologie OCR d’OmniPage Pro

Outre le texte, OmniPage Pro peut reconnaître les éléments et
caractéristiques suivants du document :

Éléments graphiques
Photos, logos, illustrations, etc.

Formatage du texte
Format des caractères, tel que type (Arial, Times New Roman...), corps
(8, 12…) et style (gras, italique, souligné) d’une police. Format des
paragraphes, tel que retraits, tabulations, marges et interlignes.

Mise en page
Agencement des colonnes, agencement des tableaux, emplacement des
éléments graphiques et des en-têtes.

Les éléments et caractéristiques conservés par OmniPage Pro dépendent des
réglages sélectionnés pour chaque document. Pour plus de détails sur le choix
des réglages, consultez la rubrique Conseils de réglages de l’aide en ligne
OmniPage Pro.

OmniPage Pro reconnaît uniquement les caractères imprimés, tels que les sorties
imprimante ou le texte tapé à la machine. Vous pouvez toutefois lui demander de
conserver un bloc de texte manuscrit (une signature, par exemple) en affectant
celui-ci du type de zone Graphique.

Advertising
Ce manuel est liée aux produits suivants: