Reconnaissance optique de caractères (ocr), Technologie ocr d’omnipage se – Xerox WorkCentre M118-M118i-12708 Manuel d'utilisation

Page 22

Advertising
background image

22

Introduction

Reconnaissance optique de caractères (OCR)

La reconnaissance optique de caractères (OCR) est une opération qui consiste à
extraire du texte d’une image obtenue par numérisation d’un document papier
ou par ouverture d’un fichier image électronique. Le texte d’une image n’est pas
directement utilisable car ses caractères se composent de groupes de points
(pixels).

Pendant la reconnaissance, OmniPage SE analyse l’image proposée, identifie les
caractères qu’elle contient et définit les solutions permettant de les transformer
en texte éditable. À l’issue de la reconnaissance, le texte peut être enregistré dans
la plupart des applications (logiciels de traitement de texte ou de PAO,
tableurs, etc.).

Technologie OCR d’OmniPage SE

Outre le texte, OmniPage SE peut reconnaître les éléments et caractéristiques
suivants du document :

Éléments graphiques
Photos, logos, illustrations, etc.

Formatage du texte
Format des caractères, tel que type (Arial, Times New Roman...), corps
(8, 12…) et style (gras, italique, souligné) d'une police. Format des paragraphes,
tel que retraits, tabulations, marges et interlignes.

Mise en page
Agencement des colonnes, agencement des tableaux, emplacement des éléments
graphiques et des en-têtes.

Les éléments et caractéristiques conservés par OmniPage SE dépendent des
réglages sélectionnés pour chaque document. Pour plus de détails sur le choix
des réglages, consultez la rubrique Conseils de réglages de l’aide en ligne
OmniPage SE.

OmniPage SE reconnaît uniquement les caractères imprimés, tels que les sorties
imprimante ou le texte tapé à la machine. Vous pouvez toutefois lui demander de
conserver un bloc de texte manuscrit (une signature, par exemple) en affectant
celui-ci du type de zone Graphique.

Advertising
Ce manuel est liée aux produits suivants: