Reconnaissance optique de caractères (ocr), Ocr) – Xerox WorkCentre PE16-i-12388 Manuel d'utilisation

Page 22

Advertising
background image

22

I

NTRODUCTION

R

ECONNAISSANCE

OPTIQUE

DE

CARACTÈRES

(OCR)

La reconnaissance optique de caractères (OCR) est une opération qui
consiste à extraire du texte d’une image obtenue par numérisation d’un
document papier ou par ouverture d’un fichier image électronique.

Le texte

d’une image n’est pas directement utilisable car ses caractères se composent
de groupes de points (pixels).

Pendant la reconnaissance, OmniPage SE analyse l’image proposée, identifie
les caractères qu’elle contient et définit les solutions permettant de les
transformer en texte éditable. À l’issue de la reconnaissance, le texte peut être
enregistré dans la plupart des applications (logiciels de traitement de texte ou
de PAO, tableurs, etc.).

Technologie OCR d’OmniPage SE

Outre le texte, OmniPage SE peut reconnaître les éléments et
caractéristiques suivants du document.

Éléments graphiques
Photos, logos, illustrations, etc.

Formatage du texte
Format des caractères, tel que type (Arial, Times New Roman...), corps
(8, 12…) et style (gras, italique, souligné) d'une police. Format des
paragraphes, tel que retraits, tabulations, marges et interlignes.

Mise en page
Agencement des colonnes, agencement des tableaux, emplacement des
éléments graphiques et des en-têtes.

Les éléments et caractéristiques conservés par OmniPage SE dépendent des
réglages sélectionnés pour chaque document. Pour plus de détails sur le
choix des réglages, consultez la rubrique Conseils de réglages de l’aide en ligne
OmniPage SE.

Remarque :

OmniPage SE reconnaît uniquement les caractères imprimés,

tels que les sorties imprimante ou le texte tapé à la machine. Vous pouvez
toutefois lui demander de conserver un bloc de texte manuscrit (une
signature, par exemple) en affectant celui-ci du type de zone Graphique.

Advertising
Ce manuel est liée aux produits suivants: