Chapitre 10 - reconnaissance des documents, Introduction, 10 r – I.R.I.S. Readiris Corporate 12 for Windows User Guide Manuel d'utilisation

Page 65: Hapitre, Econnaissance des documents

Advertising
background image

Readiris

TM

Corporate 12 – Guide utilisateur

59

C

HAPITRE

10

R

ECONNAISSANCE DES

DOCUMENTS

I

NTRODUCTION

Pour reconnaître des documents, Readiris applique une analyse
linguistique au cours de l'étape de reconnaissance. En conséquence,
il reconnaît du texte, des tableaux, des images, des codes à barres et
du texte manuscrit dans tous les types de documents. Readiris traite
même les documents disposés en colonnes complexes ou de piètre
qualité, des télécopies, des impressions matricielles, des documents
mal numérisés ou copiés contenant des caractères trop clairs ou trop
foncés, etc.

Readiris prend en charge 128 langues

: toutes les langues

d’Amérique et d’Europe, y compris les langues d’Europe centrale,
les langues baltes, le grec, le turc et le cyrillique. Grâce à des
modules complémentaires, Readiris peut lire des documents en
arabe, persan et hébreu et dans quatre langues asiatiques, à savoir le
japonais, le coréen, le chinois simplifié et le chinois traditionnel.
Readiris peut même traiter des alphabets mélangés : le logiciel
détecte les mots « occidentaux » qui ressortent des documents en
grec, en cyrillique, en langue asiatique, en hébreu et en arabe
puisque beaucoup de noms propres intranscriptibles, des noms de
marques etc., sont écrits à l’aide des symboles occidentaux.

Readiris repose sur les technologies de reconnaissance les plus
évoluées. La reconnaissance du texte indépendante de la police est
complétée par des techniques d’auto-apprentissage. Le système est

Advertising