ABBYY FlexiCapture™ 1.5

Download Report

Transcript ABBYY FlexiCapture™ 1.5

P R O D U C T I N F O R M AT I O N
P R O D U K T I N F O R M AT I O N
I N F O R M AT I O N P R O D U I T
ABBYY FlexiCapture™ 1.5
Technologie intelligente pour
documents et formulaires
semi-structurés
Une réponse au traitement de documents semi-structurés
Chaque jour, des entreprises du monde entier sont confrontées à une tâche monumentale : le traitement de millions de
documents papier, qui doivent tous être saisis de la manière la plus rapide et économique possible. Bien que les
systèmes actuels de traitement de formulaires aient fait des progrès considérables, les options disponibles pour le
traitement de documents semi-structurés, ou « formulaires flexibles », sont restées limitées.
Les méthodes traditionnelles de capture de documents semi-structurés nécessitent des heures, des jours ou des mois
de personnalisation : la création de nombreux modèles de formulaire pour chaque mise en page, l’actualisation et
l’adaptation technologique. L’autre solution reste la saisie manuelle. ABBYY propose aujourd’hui une alternative.
ABBYY FlexiCapture Studio est une solution simple d'utilisation pour le traitement de documents contenant des
informations similaires mais dont la structure et la mise en page varient. Conçu pour compléter ABBYY FormReader et
ABBYY FineReader Engine, ABBYY FlexiCapture Studio permet la création de « FlexiLayout » intelligents, qui
fonctionnent avec le logiciel de reconnaissance d’ABBYY, pour détecter les données des champs clés du formulaire,
malgré les différences d’emplacement et de mise en page. Il s’agit d’une solution idéale pour le traitement d’un large
éventail de documents semi-structurés dans les domaines suivants :
Finance/Banque
■ Ordres de paiement
■ États financiers
■ Notes de crédit
■ Documents de prêt /
d’hypothèque
Comptabilité
■ Factures
■ Bons de commande
■ Bordereaux de paiement
Assurance
■ Formulaires de demande
d’indemnité
■ Déclarations de sinistres
Juridique
■ Contrats basés sur des
modèles
■ Contrats de leasing
Transports
■ Bordereaux d’expédition
■ Bons de livraison
■ Déclarations en douane
Le fonctionnement de FlexiCapture Studio : le FlexiLayout
FlexiCapture Studio étend les capacités de capture de données et de reconnaissance d’ABBYY FormReader et ABBYY
FineReader Engine au-delà du traitement de formulaires classique. Un FlexiLayout permet de créer facilement, de tester
et de déboguer un FlexiLayout, c’est-à-dire une description formelle ou un « plan » des champs et des mises en page
variables d’un jeu de formulaires donné. Les FlexiLayout peuvent être crées à deux niveaux :
■
■
A l’aide de l’interface FlexiCapture Studio : descriptions suivant les boîtes de dialogue intuitives
FlexiCapture. Permet à une personne sans expérience de programmation de créer un FlexiLayout.
A l’aide du « fine-tuning » de FlexiLayout : descriptions utilisant le langage de programmation spécial
d’ABBYY FlexiCapture pour la création de modèle.
Un FlexiLayout est composé de blocs et d’éléments définis par l’utilisateur. Ces blocs sont les champs de données à
partir desquels la technologie de reconnaissance d’ABBYY doit capturer les données telles que nom, adresse, etc. Les
éléments dans le FlexiLayout constituent un ensemble de règles ou de descriptions des objets et leurs relations dans le
document afin d’aider la technologie de reconnaissance d’ABBYY à trouver les champs de données nécessaires lors du
traitement de formulaire et de la reconnaissance de documents. Les éléments incluent le texte statique, les chaînes de
caractères, les espaces, etc. Les blocs décrivent les éléments à partir desquels les données doivent être capturées.
Il s’agit des zones où la technologie de reconnaissance d’ABBYY doit extraire les données.
Précision et vitesse sont atteintes grâce à l'utilisation d'algorithme unique par FlexiCapture pour détecter des champs
de données en analysant des ensembles entiers d’éléments du formulaire. Ceci diffère totalement de la technologie de
traitement de formulaire traditionnelle qui analyse les éléments un par un. En analysant un ensemble d’éléments en
tant que groupe, ABBYY FlexiCapture peut améliorer la précision en traitant les éléments dans un « contexte » et
accélère les étapes requises pour traiter le formulaire entier. Un FlexiLayout complété et testé est facilement exporté
vers un des produits ABBYY FormReader ou ABBYY FineReader Engine, pour la capture des données de documents
semi-structurés, quelle que soit la complexité de la mise en page.
ABBYY FlexiCapture :
technologie intelligente
Comment un utilisateur entre-t-il les
données de formulaires semi-structurés
dans un ordinateur ? Lors de la
recherche de données, l’utilisateur
visualise l’ensemble du document, puis
analyse différents éléments du
formulaire et les informations
spécifiques, telles que : les champs de
capture ou les unités de mesure.
L’utilisateur visualise ensuite les
informations environnantes pour
déterminer les informations à saisir en
fonction de chaque champ de base de
données.
ABBYY FlexiCapture utilise
l’intelligence artificielle, à la base des
technologies de reconnaissance
d’ABBYY (ABBYY FormReader et
ABBYY FineReader Engine), pour agir
de façon similaire. ABBYY FlexiCapture
est basé sur les principes de la
reconnaissance IPA (Intelligent,
Purposeful, Adaptable).
L’IPA imite la manière dont l’être
humain reconnaît les objets. Avec les
descriptions définies par l’utilisateur,
ABBYY FlexiCapture guide les moteurs
de reconnaissance d’ABBYY vers les
champs requis sur les formulaires à
mises en pages variées. Par
conséquent, le logiciel de reconnaissance peut trouver un champ clé et
une donnée, telle que « date », sur
différents formulaires, quel que soit
son emplacement sur le document
(en haut à gauche, en bas à droite,
etc.).
A B BY Y – D E F I N I N G R E C O G N I T I O N
Les fonctionnalités clés
Interface
■
Environnement visuel pour faciliter la création, la modification et le test du
FlexiLayout
■
Option de « Vue arborescente » pour une visualisation facile des blocs, des
hypothèses et des propriétés du FlexiLayout
■
Fenêtres de programme personnalisables
■
Fonctionnalité « Glisser-Déplacer »
Objets du FlexiLayout
■
Types de bloc (objet contenant les données requises) :
texte, tableaux, codes barres, cases à cocher et images.
■
Types d’élément (objet qui aide à localiser les blocs) :
– éléments simples (texte statique, séparateurs, espace, codes barres,
chaîne de caractères, fragment de texte, ensemble d’objets, tableau,
date, téléphone, devise)
– éléments composés (éléments simples joints par ET)
Création de FlexiLayout
■
Pré-reconnaissance dans 172 langues OCR avec la possibilité de
sélectionner plusieurs combinaisons de langues
■
Boîtes de dialogue intuitives pour la définition des propriétés des éléments
■
Sélection de propriétés d’éléments sur la base du type :
– texte à rechercher avec les alternatives possibles et les nombres
d’erreurs
– colonnes, lignes, propriétés d’en-tête et de bas de page pour les
tableaux
■
Sélection de contraintes de recherche avec les coordonnées absolues de zone de recherche et la position
relative par rapport à d’autres éléments
■
Paramètres d’écriture de code avancés pour le langage de programmation de FlexiCapture tels que le
contrôle automatique de la syntaxe de message d’erreur
■
Possibilité d’établir une à plusieurs relations entre des éléments
■
Contrôle d’erreur de FlexiLayout aisé lors du processus de création
Test et ajustement du FlexiLayout
■
Test et ajustement « on-the-fly » des FlexiLayouts à l’aide d’un lot d’échantillons d’images
■
Formulation d’hypothèses (suppositions que les objets détectés correspondent aux éléments) qui sont :
– créées pour tout l’ensemble des éléments (et non pour un élément unique),
– organisées dans une structure arborescente et classées d’après la qualité
– analysées avec les meilleures hypothèses sélectionnées
■
Visualisation de la relation entre une hypothèse possible et un élément du FlexiLayout
■
Utilisation d’hypothèses nulles lorsque les éléments optionnels ne peuvent être trouvés
■
Regroupement d’hypothèses en clusters
■
Affichage des hypothèses sur la base des types d’élément et des résultats de recherche (trouvé/non trouvé).
■
Test aisé des FlexiLayout en comparant les résultats avec un modèle de référence créé :
– en dessinant les éléments manuellement
– en corrigeant les résultats de la mise en correspondance
Prix et disponibilité
ABBYY FlexiCapture Studio 1.5 peut être acheté
pour être utilisé avec ABBYY FormReader 6.5. Le
produit sera également disponible pour être utilisé
avec les futures versions du SDK ABBYY
FineReader Engine qui seront lancées
ultérieurement. Au moins une licence d’exécution
du produit de base (ABBYY FormReader ou ABBYY
FineReader Engine) est requise pour le traitement
de formulaires à l’aide d’ABBYY FlexiCapture. Pour
une liste de prix détaillée, veuillez contacter vos
représentants commerciaux locaux.
Configuration requise
Pour une liste de la configuration requise complète
et des autres spécifications, veuillez consulter
le document de spécifications et le tarif joints.
Avantages pour les développeurs, les intégrateurs et
les prestataires de services
■
■
■
■
■
■
Développement des options de votre entreprise. Il s’agit d’un outil modulable pour proposer des solutions
fiables et efficaces pour le traitement de formulaires semi-structurés.
Support pour un large éventail de marchés et de documents semi-structurés. Il est possible de définir
des mises en page de complexité diverse : factures, documents avec en-tête spécial, pages avec tableaux.
Facilité d’utilisation. Grâce à l’interface souple et visualisable, il est possible d’utiliser l’outil sans
connaissance de programmation poussée.
Déploiement rapide. Des outils simples et des échantillons accélèrent la configuration et le test.
Rentabilité. Grâce au tarif compétitif et à la facilité d’utilisation, les ressources nécessaires pour développer
des solutions puissantes sont limitées.
Technologie éprouvée. ABBYY FlexiCapture est basé sur plus de 4 années de développement et de travail
en étroite collaboration avec de grandes entreprises sur des projets de formulaire flexible. Des produits
basés sur la technologie FlexiCapture d’ABBYY sont déjà utilisés par d’importants organismes financiers
d’Europe de l’Est.
© 2005 ABBYY Software Ltd. Tous droits réservés. ABBYY, FINEREADER et ABBYY FineReader sont des marques déposées d’ABBYY Software Ltd. Toutes les autres
marques commerciales sont la propriété de leurs détenteurs respectifs.
ABBYY Europe GmbH
D - 80339 Munich, Tel: +49 89 511159 - 0, Fax: +49 89 511159 - 59 , [email protected], www.ABBYY.com
A B BY Y – D E F I N I N G R E C O G N I T I O N