PDF data-extractie

PDF data-extractie

Upload PDF-, Word-, Excel- of e-mailbestanden en ontvang gestructureerde data als Excel, CSV, JSON of UBL. Verwerk tot 10 bestanden tegelijk. Kies uit zes extractietypes: facturen, plattegronden, formulieren, tabellen, e-mails en juridische documenten.

invoice-2025-042.pdf
Vendor Acme Corp B.V.
Invoice # INV-2025-0042
Date 2025-01-15
Total € 1.512,50
VAT € 262,50
Line items 3 items
6 velden succesvol geëxtraheerd

Wat wil je extraheren?

Kies het type data dat je uit je PDF's wilt halen.

Plattegrond

Haal kamernamen, afmetingen en oppervlaktes uit architectuurtekeningen en bouwtekeningen.

Room names
Dimensions
Floor area (m\u{00B2})
AI Excel CSV JSON
Probeer nu

Factuur

Haal regelitems, totalen, BTW-bedragen en leveranciersinformatie uit facturen.

Line items
VAT breakdown
IBAN / vendor
UBL API
Probeer nu

Formulier

Extraheer veldnamen, waarden, selectievakjes en secties uit ingevulde formulieren.

Text fields
Checkboxes
Sections & groups
AI Excel CSV JSON
Probeer nu

E-mail

Haal afzender, ontvangers, onderwerp en inhoud uit gearchiveerde e-mails.

Sender & recipients
Subject & date
Body & attachments
Direct parse Excel CSV JSON
Probeer nu

Tabel

Haal tabelgegevens met automatische kolomdetectie en datatypes.

Headers
Rows & columns
Data types

Juridische documenten

Analyseer contracten en overeenkomsten: partijen, clausules, kernvoorwaarden en risicovlaggen.

Contract type
Parties & clauses
Risk flags
AI Excel CSV JSON
Probeer nu

Aangepast

Definieer je eigen extractieregels met AI-gestuurde prompts.

Your own fields
AI-powered prompts
Any document
AI JSON
Binnenkort

Hoe het werkt

Drie stappen van document naar gestructureerde data.

1

Upload je bestanden

Upload PDF-, Word-, Excel- of e-mailbestanden. Tot 10 bestanden tegelijk, maximaal 50 MB per bestand.

2

Automatische analyse

Het document wordt geanalyseerd en relevante velden worden gedetecteerd. E-mailbestanden worden direct geparsed, andere documenttypen worden visueel verwerkt.

3

Download gestructureerde data

Exporteer als Excel, CSV, JSON of UBL. Per bestandstype krijg je de velden die bij dat documenttype horen.

api-example.sh
# Extract invoice data from PDF
curl -X POST https://api.pdfen.com/v2/extract \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@invoice.pdf" \
  -F "type=invoice" \
  -F "format=json"

# Response
{
  "vendor": "Acme Corp B.V.",
  "invoice_number": "INV-2025-0042",
  "total": 1512.50,
  "vat": 262.50,
  "line_items": [...]
}

Automatiseer met onze API

Integreer data-extractie in je eigen applicatie. Dien bestanden in via de REST API en ontvang gestructureerde data terug als JSON.

  • Batchverwerking

    Verwerk meerdere bestanden per API-aanroep. Ondersteunt PDF, Word, Excel en e-mail.

  • Webhooks

    Ontvang een callback wanneer de extractie klaar is — geen polling nodig.

  • Meerdere formaten

    Ontvang resultaten als JSON, CSV, Excel of UBL (voor facturen).

Uitvoerformaten

Exporteer je geëxtraheerde data in het formaat dat past bij je workflow.

.xlsx

Excel

Spreadsheet-klaar met opmaak en meerdere tabbladen.

.csv

CSV

Universeel formaat voor databases en datatools.

.json

JSON

Gestructureerde data voor API's en applicaties.

.xml

XML

Enterprise-formaat voor systeemintegraties.

UBL

UBL

Europese e-facturatie standaard (EN 16931).

Veelgestelde vragen

Welke bestandstypen kan ik uploaden?

Je kunt PDF, Word (.doc, .docx), Excel (.xls, .xlsx) en e-mailbestanden (.eml, .msg) uploaden. Word-, Excel- en e-mailbestanden worden automatisch geconverteerd voor verwerking. E-mailbestanden worden direct geparsed zonder conversie. Maximaal 10 bestanden tegelijk, tot 50 MB per bestand.

Hoe nauwkeurig zijn de resultaten?

Dat hangt af van het extractietype. E-mailextractie is 100% nauwkeurig omdat bestanden direct worden geparsed. PDF-formulieren met ingebouwde velden (AcroForm) zijn eveneens 100% nauwkeurig. Voor visuele extractie (facturen, tabellen, juridisch) worden elk geëxtraheerd veld voorzien van een betrouwbaarheidsscore (hoog/gemiddeld/laag) zodat je kunt zien waar handmatige controle nuttig is.

Welke talen worden ondersteund?

De visuele extractie werkt met documenten in alle gangbare talen, waaronder Nederlands, Engels, Duits, Frans en Spaans. De geëxtraheerde datavelden worden gestandaardiseerd ongeacht de brontaal. E-mailextractie is taalonafhankelijk.

Wat kost data-extractie?

De kosten variëren per extractietype. PDF-formulieren met AcroForm-velden kosten 1 credit. Facturen en tabellen kosten 2 credits per PDF (3 per Word/Excel-bestand). Juridische documenten kosten 3 credits per PDF (4 per Word-bestand). E-mails kosten 2 credits per bestand. Nieuwe gebruikers ontvangen 15 gratis credits bij registratie.

Kan ik extractie automatiseren via een API?

Ja. Via de REST API kun je bestanden indienen en gestructureerde resultaten ontvangen als JSON. Webhooks geven een melding wanneer de verwerking klaar is. De API ondersteunt alle zes extractietypes en alle bestandsformaten.

Klaar om data uit je documenten te halen?

Maak een gratis account aan en ontvang 15 credits om direct te starten.