Extraction de données automatisée.

Compatible avec Image ou PDF, PX vous permet d'extraire des données structurées à partir de documents semi-structurés.

forumDemander une dêmo

Voir documentationarrow_right_alt

refresh

En temps réel

Extraire automatiquement les données du document via un traitement en temps réel

select_all

Améliorer la qualité

Évitez les erreurs liées au traitement manuel

euro

Réduire les coûts

Pas de frais associés à la saisie manuelle

tune

Intégration facile

Intégrez-vous en douceur dans votre processus avec seulement 3 lignes de code

keyboard_arrow_downComment ça marche

Studio

Obtenez des données structurées

horizontal_ruleConnexion au navigateur

horizontal_ruleWeb gratté

horizontal_ruleConnexion API

Améliorez, simplifiez et augmentez la productivité des workflows de données grâce à la technologie d'apprentissage automatique.

L'API ParseXtract vous permet d'entraîner et d'extraire des données dans un document PDF et de les transformer dans un format structuré JSON.

Models

Pré-formé

PX peut être intégré, facilement et rapidement, pour extraire des données de vos documents.

Factures, relevés bancaires et fiches de paie ont déjà été modélisés et pré-formés.

Document de facture (exemple) : Cette facture d'exemple (n° 2234567) datée du 18 septembre 2019 illustre comment ParseXtract extrait des données structurées, y compris les informations fournisseur (Ma Société SARL, SIRET : 554 874 445), les coordonnées client (Pénélope D. Seguin, 51 rue Nationale, 75003 Paris), les totaux de facture (276,00 EUR HT, 55,20 EUR TVA, 331,20 EUR TTC) et la devise (EUR).

Numéro de facture: 2234567
Date de facture: 18/09/2019
Fournisseur: Ma Société SARL (SIRET : 554 874 445)
Client: Pénélope D. Seguin, 51 rue Nationale, 75003 Paris
Total TTC: 331,20 EUR
Devise: EUR

Output

{
    "detailedLabelId": "3f18d4a6bb6979ea3e9f7bce6ac61abc",
    "extractedData": [
        {
            "name": "Invoice.Type.Identifier",
            "value": "Invoice"
        },
        {
            "name": "Invoice.Date",
            "value": "18/09/2019"
        },
        {
            "name": "Invoice.Number.Identifier",
            "value": "2234567"
        },
        {
            "name": "Supplier.Name.Literal",
            "value": "Ma Société SARL"
        },
        {
            "name": "Supplier.National.Identifier",
            "value": "000000000000"
        },
        {
            "name": "Supplier.Siret.Identifier",
            "value": "554 874 445"
        },
        {
            "name": "Supplier.Vatnumber.Identifier",
            "value": "FR 000000000000"
        },
        {
            "name": "Invoice.Currency",
            "value": "EUR"
        },
        {
            "name": "Invoice.TotalAmount.WithoutTaxes.Amount",
            "value": "276,00"
        },
        {
            "name": "Invoice.VATTotal.Amount",
            "value": "55,20"
        },
        {
            "name": "Invoice.TotalAmount.WithTaxes.Amount",
            "value": "331,20"
        },
        {
            "name": "Customer.Contact.Name.Literal",
            "value": "Pénélope D. Seguin"
        },
        {
            "name": "Customer.VATNumber.Identifier",
            "value": ""
        },
        {
            "name": "Customer.Address.Line1",
            "value": "51 rue Nationale"
        },
        {
            "name": "Customer.Address.ZipCode",
            "value": "75003"
        },
        {
            "name": "Customer.Address.City",
            "value": "Paris"
        }
    ],
    "id": "DemoTrial_20100831_Armstrong_Neil_0014.pdf",
    "labelId": "FactureMaSociete"
}

Document de bulletin de paie (exemple) : Cet exemple de bulletin de paie de Ma Société SARL (SIRET : 55487445) pour l'employée Pénélope D Séguin (ID : 078904) montre comment ParseXtract extrait des données structurées, notamment les informations de l'employée (numéro de sécurité sociale, adresse : 51 rue Nationale, 75003 Paris), la période de paie (01/08/2019–31/08/2019) et les informations de l'entreprise.

Employée: Pénélope D Séguin (ID : 078904)
Adresse: 51 rue Nationale, 75003 Paris
Entreprise: Ma Société SARL (SIRET : 55487445)
Période de paie: 01/08/2019 à 31/08/2019

Output

{
    "detailedLabelId": "3f18d4a6bb6979ea3e9f7bce6ac61abc",
    "extractedData": [
        {
            "name": "Employee.Identifier",
            "value": "078904"
        },
        {
            "name": "Employee.Full.Name",
            "value": "Pénélope D Séguin"
        },
        {
            "name": "Employee.SocialSecurityNumber",
            "value": "2651132254647 79"
        },
        {
            "name": "Employee.Address.Line1",
            "value": "51 rue Nationale"
        },
        {
            "name": "Employee.Address.ZipCode",
            "value": "75003"
        },
        {
            "name": "Employee.Address.City.Name",
            "value": "Paris"
        },
        {
            "name": "Payslip.StartDate",
            "value": "01/08/2019"
        },
        {
            "name": "Payslip.EndDate",
            "value": "31/08/2019"
        },
        {
            "name": "Company.Name",
            "value": "Ma Société SARL"
        },
        {
            "name": "Company.SIRET.Identifier",
            "value": "55487445"
        }
    ],
    "id": "Bulletin_de_paie.pdf",
    "labelId": "MaSociete_label"
}

Output

Service

Découvrez notre approche, faites évoluer votre entreprise !

Nous le faisons à notre manière : en nous basant sur notre famille de classificateurs non supervisés, notre langage de requête de document et notre moteur de génération de requêtes.

— Voir la documentation

chevron_right

Divide et impera

L'utilisation de plusieurs classificateurs non supervisés non corrélés nous permet de regrouper des documents similaires.

Par exemple, nous sommes capables de reconnaître une marque dans l'en-tête du document ou un paragraphe récurrent dans le pied de page. Une fois les documents regroupés dans les bonnes collections homogènes, il est plus facile de trouver les bonnes règles d'extraction.

chevron_right

Whitebox

Nous avons développé notre propre langage de requête (PQL) qui nous permet de naviguer dans la structure de mise en page du document, de sauter à un point spécifique et d'utiliser des sélecteurs d'expression régulière.

Des techniques d'apprentissage automatique sont utilisées pour générer automatiquement les règles d'extraction. Comme ces requêtes sont lisibles par l'homme, nous pouvons toujours les corriger ou les améliorer en cas de surajustement ou d'autres problèmes.

La sécurité,
toujours la priorité..

Le trafic de notre site Web et de nos applications s'exécute entièrement via une sécurité de transport SSL et HTTP stricte cryptée pour garantir que les navigateurs interagissent avec Securibox exclusivement via HTTPS, ce qui signifie que les informations d'identification et autres données sensibles ne sont jamais divulguées sur le réseau.

"Lors de l'accès à notre application, avec chaque demande, un jeton unique est envoyé, protégeant ainsi contre la contrefaçon de requêtes croisées (CSRF). Toutes les données sensibles stockées sur nos serveurs sont cryptées avec des clés AES 256 bits et rotatives, de sorte que la façon dont le cryptage change constamment."

Extraction de données automatisée.

En temps réel

Améliorer la qualité

Réduire les coûts

Intégration facile

Obtenez des données structurées

Pré-formé

horizontal_ruleComptes fournisseurs

horizontal_ruleCotation de crédit

horizontal_ruleRemises en argent

Découvrez notre approche, faites évoluer votre entreprise !

Divide et impera

Whitebox

La sécurité,
toujours la priorité..

Entrer en contact

Vous cherchez plus d'informations? Nous sommes toujours disponibles*

ParseXtract - PX

ParseXtract - PX

Features

En temps réel

Améliorer la qualité

Réduire les coûts

Intégration facile

Obtenez des données structurées

Pré-formé

horizontal_ruleComptes fournisseurs

horizontal_ruleCotation de crédit

horizontal_ruleRemises en argent

Découvrez notre approche, faites évoluer votre entreprise !

Divide et impera

Whitebox

La sécurité, toujours la priorité..

Entrer en contact

Vous cherchez plus d'informations? Nous sommes toujours disponibles*

La sécurité,
toujours la priorité..