ParseXtract - PX

ParseXtract - PX

securibox Parse Xtract

Extraction de données automatisée.

Compatible avec Image ou PDF, PX vous permet d'extraire des données structurées à partir de documents semi-structurés.

Voir documentation

Features

$

En temps réel

Extraire automatiquement les données du document via un traitement en temps réel

Améliorer la qualité

Évitez les erreurs liées au traitement manuel

Réduire les coûts

Pas de frais associés à la saisie manuelle

Intégration facile

Intégrez-vous en douceur dans votre processus avec seulement 3 lignes de code

Comment ça marche
Studio

Obtenez des données structurées

Connexion au navigateur
Web gratté

Connexion API

Améliorez, simplifiez et augmentez la productivité des workflows de données grâce à la technologie d'apprentissage automatique.

L'API ParseXtract vous permet d'entraîner et d'extraire des données dans un document PDF et de les transformer dans un format structuré JSON.

USERData ownerYOUR APPProcess or Solution.DOCImage basedPDFPXSecuribox ParseXtractJSONStructured extracted data.CLASSIFICATIONIdentify and group files into homogeneous collectionsEXTRACTIONExtract, validate and format document dataUSERData ownerYOUR APPProcess or Solution.DOCImage basedPDFPXSecuribox ParseXtractJSONStructured extracted data.CLASSIFICATIONIdentify and group files into homogeneous collectionsEXTRACTIONExtract, validate and format document dataUSERData ownerYOUR APPProcess or Solution.DOCImage basedPDFPXSecuribox ParseXtractJSONStructured extracted data.CLASSIFICATIONIdentify and group files into homogeneous collectionsEXTRACTIONExtract, validate and format document dataUSERData ownerYOUR APPProcess or Solution.DOCImage basedPDFPXSecuribox ParseXtractJSONStructured extracted data.CLASSIFICATIONIdentify and group files into homogeneous collectionsEXTRACTIONExtract, validate and format document data
Models

Pré-formé

PX peut être intégré, facilement et rapidement, pour extraire des données de vos documents.

Factures, relevés bancaires et fiches de paie ont déjà été modélisés et pré-formés.

Output
{
    "detailedLabelId": "3f18d4a6bb6979ea3e9f7bce6ac61abc",
    "extractedData": [
        {
            "name": "Invoice.Type.Identifier",
            "value": "Invoice"
        },
        {
            "name": "Invoice.Date",
            "value": "18/09/2019"
        },
        {
            "name": "Invoice.Number.Identifier",
            "value": "2234567"
        },
        {
            "name": "Supplier.Name.Literal",
            "value": "Ma Société SARL"
        },
        {
            "name": "Supplier.National.Identifier",
            "value": "000000000000"
        },
        {
            "name": "Supplier.Siret.Identifier",
            "value": "554 874 445"
        },
        {
            "name": "Supplier.Vatnumber.Identifier",
            "value": "FR 000000000000"
        },
        {
            "name": "Invoice.Currency",
            "value": "EUR"
        },
        {
            "name": "Invoice.TotalAmount.WithoutTaxes.Amount",
            "value": "276,00"
        },
        {
            "name": "Invoice.VATTotal.Amount",
            "value": "55,20"
        },
        {
            "name": "Invoice.TotalAmount.WithTaxes.Amount",
            "value": "331,20"
        },
        {
            "name": "Customer.Contact.Name.Literal",
            "value": "Pénélope D. Seguin"
        },
        {
            "name": "Customer.VATNumber.Identifier",
            "value": ""
        },
        {
            "name": "Customer.Address.Line1",
            "value": "51 rue Nationale"
        },
        {
            "name": "Customer.Address.ZipCode",
            "value": "75003"
        },
        {
            "name": "Customer.Address.City",
            "value": "Paris"
        }
    ],
    "id": "DemoTrial_20100831_Armstrong_Neil_0014.pdf",
    "labelId": "FactureMaSociete"
}
Output
{
    "detailedLabelId": "3f18d4a6bb6979ea3e9f7bce6ac61abc",
    "extractedData": [
        {
            "name": "Employee.Identifier",
            "value": "078904"
        },
        {
            "name": "Employee.Full.Name",
            "value": "Pénélope D Séguin"
        },
        {
            "name": "Employee.SocialSecurityNumber",
            "value": "2651132254647 79"
        },
        {
            "name": "Employee.Address.Line1",
            "value": "51 rue Nationale"
        },
        {
            "name": "Employee.Address.ZipCode",
            "value": "75003"
        },
        {
            "name": "Employee.Address.City.Name",
            "value": "Paris"
        },
        {
            "name": "Payslip.StartDate",
            "value": "01/08/2019"
        },
        {
            "name": "Payslip.EndDate",
            "value": "31/08/2019"
        },
        {
            "name": "Company.Name",
            "value": "Ma Société SARL"
        },
        {
            "name": "Company.SIRET.Identifier",
            "value": "55487445"
        }
    ],
    "id": "Bulletin_de_paie.pdf",
    "labelId": "MaSociete_label"
}
Output
c
Service

Découvrez notre approche, faites évoluer votre entreprise !

Nous le faisons à notre manière : en nous basant sur notre famille de classificateurs non supervisés, notre langage de requête de document et notre moteur de génération de requêtes.

— Voir la documentation

Divide et impera

L'utilisation de plusieurs classificateurs non supervisés non corrélés nous permet de regrouper des documents similaires.

Par exemple, nous sommes capables de reconnaître une marque dans l'en-tête du document ou un paragraphe récurrent dans le pied de page. Une fois les documents regroupés dans les bonnes collections homogènes, il est plus facile de trouver les bonnes règles d'extraction.

Whitebox

Nous avons développé notre propre langage de requête (PQL) qui nous permet de naviguer dans la structure de mise en page du document, de sauter à un point spécifique et d'utiliser des sélecteurs d'expression régulière.

Des techniques d'apprentissage automatique sont utilisées pour générer automatiquement les règles d'extraction. Comme ces requêtes sont lisibles par l'homme, nous pouvons toujours les corriger ou les améliorer en cas de surajustement ou d'autres problèmes.


La sécurité,
toujours la priorité..

Le trafic de notre site Web et de nos applications s'exécute entièrement via une sécurité de transport SSL et HTTP stricte cryptée pour garantir que les navigateurs interagissent avec Securibox exclusivement via HTTPS, ce qui signifie que les informations d'identification et autres données sensibles ne sont jamais divulguées sur le réseau.

"Lors de l'accès à notre application, avec chaque demande, un jeton unique est envoyé, protégeant ainsi contre la contrefaçon de requêtes croisées (CSRF). Toutes les données sensibles stockées sur nos serveurs sont cryptées avec des clés AES 256 bits et rotatives, de sorte que la façon dont le cryptage change constamment."

Entrer en contact

Vous cherchez plus d'informations? Nous sommes toujours disponibles*

*Ce formulaire permet de contacter Securibox pour toute question générale ! Vous pouvez accéder, obtenir une copie des données vous concernant, vous opposer au traitement de ces données, les faire rectifier effacer ainsi que limiter leur traitement.
Les données envoyées par ce formulaire peuvent être transférées hors Europe, dans le respect du RGPD.**