Waarom de moeite doen om iets te bewaren, als u het later niet eens goed kan openen?
Dat snapt u natuurlijk ook, maar wat heeft u gedaan om dit ook daadwerkelijk in de praktijk te brengen?
Of het nu gaat om office documenten, e-mails of zelfs webpagina's: als u zeker wilt zijn dat u later de informatie kunt terugvinden, kunt openen en dat het er ook nog uitziet als het moment dat u het had opgeslagen, dan zal uw document aan een aantal voorwaarden moeten voldoen... En het perfecte bestandsformaat hiervoor is PDF/A (PDF/Archief)!
Wat is PDF/A?
PDF/A is een PDF formaat met extra restricties en uitgangspunten. Deze eisen liggen vast in ISO voorwaarden, zoals bijvoorbeeld PDF/A-1 = ISO 19005-1, PDF/A-2 = ISO 32000-1 of PDF/A3=ISO 32000-2. Er zijn nog veel meer gestandaardiseerde PDF formaten zoals bijvoorbeeld PDF/UA en PDF-X. Ik zal daar in een later artikel nog op terugkomen.
Eisen voor langdurige opslag
De onderstaande eisen zijn van belang bij langdurige opslag en dit zijn nu juist de kenmerken van het PDF/A formaat.
1. Apparaat onafhankelijk
U wilt er zeker van zijn, dat uw bestand op verschillende apparaten te openen is. 10 jaar geleden wilde u het waarschijnlijk alleen kunnen openen op uw desktop; inmiddels zijn daar de laptop, tablet en telefoons bijgekomen. Wij kunnen onszelf niet voorstellen waarmee wij over nog eens 10 jaar onze documenten openen. Gebruik daarom PDF! Het PDF formaat is van oorsprong ontwikkeld om apparaat onafhankelijk te zijn. Dus wat voor apparaat er ook uitgevonden wordt: het zal PDF bestanden kunnen openen.
2. Zelfstandig
Een PDF/A bezit alle informatie die nodig is om het bestand weer te geven zoals het oorspronkelijk is gemaakt. Een PDF/A bestand bevat informatie over o.a. de tekst, afbeeldingen, grafieken, lettertypen en kleurinformatie.
PDF/A heeft ook de restrictie dat verwijzingen naar externe bronnen niet zijn toegestaan, omdat tegen de tijd dat het bestand weer geopend wordt, deze bronnen misschien niet meer bestaan.
3. Zelfbeschrijvend
Een PDF/A bestand kan metadata bevatten (informatie die wat zegt over het bestand zelf). U kunt denken aan de auteur, wanneer het gemaakt is, wanneer het geconverteerd is, trefwoorden, titel, omschrijving, een referentie nummer, etc. Metadata kan bijvoorbeeld van grote waarde zijn om later het bestand snel weer terug te vinden als men zoekt op bepaalde kenmerken.
Metadata kan via de standaard metadata van PDF worden toegevoegd of via een XMP schema/bestand. Over XMP vertel ik binnenkort meer.
4. Transparant
Een PDF/A bestand is geen complex bestandsformaat. Het is makkelijk te analyseren en de structuur is eenvoudig te begrijpen. Dit is bijvoorbeeld een grote pre voor huidige of toekomsite PDF readers.
Niet alleen voor archivarissen een 'best practise'
Binnen uw bedrijf (maar misschien ook thuis) zijn er talloze documenten denkbaar die u zeker wilt kunnen open over 10 jaar. Denk hierbij aan contracten, afspraken, voorwaarden, belangrijke e-mail conversaties, etc. Om hier zeker van te zijn hoeft uw bedrijf echt niet per se te voldoen aan NEN norm XYZ of iets dergelijks, maar het is al een basis stap om deze bestanden op te slaan als PDF/A. Dit geldt uiteraard ook voor belangrijk e-mail conversaties.
En nee, het maken van een PDF/A formaat is geen 'rocket sience'. Bij nieuwe of bestaande office bestanden kunt dit makkelijk zelf doen, door bij 'opslaan als' te kiezen voor het bestandstype *.pdf en dan onder opties een van de ISO normen te kiezen die ik hierboven heb genoemd (zie ook afbeelding).
Moet ik ook 'tussen' versies opslaan?
Mijn antwoord daarop is altijd ja!. Hoe weet u zeker dat het gaat om een 'tussen' of draft versie? Het kan zomaar eens de laatste zijn.
Is PDF/A echt het enige formaat voor langdurige opslag?
Er zijn wel andere archief formaten zoals TIFF, die gebruikt kunnen worden voor langdurige opslag, maar PDF/A is een moderner en gestandariseerd formaat met meer functionele voordelen. Deze verschillen zal ik in een latere blog ook bespreken.