Upload PDF-, Word-, Excel- of e-mailbestanden en ontvang gestructureerde data als Excel, CSV, JSON of UBL. Verwerk tot 10 bestanden tegelijk. Kies uit zes extractietypes: facturen, plattegronden, formulieren, tabellen, e-mails en juridische documenten.
Kies het type data dat je uit je PDF's wilt halen.
Haal kamernamen, afmetingen en oppervlaktes uit architectuurtekeningen en bouwtekeningen.
Haal regelitems, totalen, BTW-bedragen en leveranciersinformatie uit facturen.
Extraheer veldnamen, waarden, selectievakjes en secties uit ingevulde formulieren.
Haal afzender, ontvangers, onderwerp en inhoud uit gearchiveerde e-mails.
Haal tabelgegevens met automatische kolomdetectie en datatypes.
Analyseer contracten en overeenkomsten: partijen, clausules, kernvoorwaarden en risicovlaggen.
Definieer je eigen extractieregels met AI-gestuurde prompts.
Drie stappen van document naar gestructureerde data.
Upload PDF-, Word-, Excel- of e-mailbestanden. Tot 10 bestanden tegelijk, maximaal 50 MB per bestand.
Het document wordt geanalyseerd en relevante velden worden gedetecteerd. E-mailbestanden worden direct geparsed, andere documenttypen worden visueel verwerkt.
Exporteer als Excel, CSV, JSON of UBL. Per bestandstype krijg je de velden die bij dat documenttype horen.
# Extract invoice data from PDF
curl -X POST https://api.pdfen.com/v2/extract \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@invoice.pdf" \
-F "type=invoice" \
-F "format=json"
# Response
{
"vendor": "Acme Corp B.V.",
"invoice_number": "INV-2025-0042",
"total": 1512.50,
"vat": 262.50,
"line_items": [...]
}
Integreer data-extractie in je eigen applicatie. Dien bestanden in via de REST API en ontvang gestructureerde data terug als JSON.
Verwerk meerdere bestanden per API-aanroep. Ondersteunt PDF, Word, Excel en e-mail.
Ontvang een callback wanneer de extractie klaar is — geen polling nodig.
Ontvang resultaten als JSON, CSV, Excel of UBL (voor facturen).
Exporteer je geëxtraheerde data in het formaat dat past bij je workflow.
Spreadsheet-klaar met opmaak en meerdere tabbladen.
Universeel formaat voor databases en datatools.
Gestructureerde data voor API's en applicaties.
Enterprise-formaat voor systeemintegraties.
Europese e-facturatie standaard (EN 16931).
Je kunt PDF, Word (.doc, .docx), Excel (.xls, .xlsx) en e-mailbestanden (.eml, .msg) uploaden. Word-, Excel- en e-mailbestanden worden automatisch geconverteerd voor verwerking. E-mailbestanden worden direct geparsed zonder conversie. Maximaal 10 bestanden tegelijk, tot 50 MB per bestand.
Dat hangt af van het extractietype. E-mailextractie is 100% nauwkeurig omdat bestanden direct worden geparsed. PDF-formulieren met ingebouwde velden (AcroForm) zijn eveneens 100% nauwkeurig. Voor visuele extractie (facturen, tabellen, juridisch) worden elk geëxtraheerd veld voorzien van een betrouwbaarheidsscore (hoog/gemiddeld/laag) zodat je kunt zien waar handmatige controle nuttig is.
De visuele extractie werkt met documenten in alle gangbare talen, waaronder Nederlands, Engels, Duits, Frans en Spaans. De geëxtraheerde datavelden worden gestandaardiseerd ongeacht de brontaal. E-mailextractie is taalonafhankelijk.
De kosten variëren per extractietype. PDF-formulieren met AcroForm-velden kosten 1 credit. Facturen en tabellen kosten 2 credits per PDF (3 per Word/Excel-bestand). Juridische documenten kosten 3 credits per PDF (4 per Word-bestand). E-mails kosten 2 credits per bestand. Nieuwe gebruikers ontvangen 15 gratis credits bij registratie.
Ja. Via de REST API kun je bestanden indienen en gestructureerde resultaten ontvangen als JSON. Webhooks geven een melding wanneer de verwerking klaar is. De API ondersteunt alle zes extractietypes en alle bestandsformaten.
Maak een gratis account aan en ontvang 15 credits om direct te starten.