De standvastige en vertrouwde wereld van papier wordt ingeruild voor de permanent veranderende wereld van de informatietechnologie. Het gevaar om gegevens te verliezen, is nooit groter geweest.

Steeds meer informatie gaat digitaal. Bibliotheken, bedrijven, de overheid, het publiek: allemaal zijn ze papieren documenten naar een elektronische vorm aan het omzetten. Tegelijk wordt meer en meer informatie meteen digitaal aangemaakt. De voordelen van een digitaal archief zijn dan ook onmiskenbaar groot. Elektronische en gedigitaliseerde bestanden nemen natuurlijk veel minder ruimte in dan dezelfde informatie op papier, maar minstens even belangrijk is de veel grotere beschikbaarheid van de gegevens. Een document uit een elektronisch archief kan door verschillende mensen tegelijk geraadpleegd worden. Kan dat elektronische archief bovendien geconsulteerd worden via internet, dan is de informatie dag en nacht waar ook ter wereld te raadplegen. Tegelijkertijd kunnen de originele documenten, als die er zijn, niet beschadigd of gestolen worden. Eigen aan een elektronische archief zijn ten slotte de krachtige zoek- en navigatiefuncties: het intikken van een zoekterm volstaat om het gewenste document op het scherm te toveren.

Maar het elektronische medium kent ook nadelen. In een papieren document zijn drager en informatie onlosmakelijk verbonden. Om de informatie te bewaren, volstaat het dus om de drager te bewaren. Je hoeft een boek alleen maar open te slaan om het te kunnen lezen. Dat is anders bij een digitaal document. De drager op zich is daar niet voldoende om het document te kunnen raadplegen. Dat is natuurlijk ook zo bij een muziekcassette of langspeelplaat, maar bij elektronische informatie gaat het veel verder dan dat. De toegankelijkheid van een digitaal document is afhankelijk van een bepaalde configuratie, een bepaalde combinatie van hard- en software. Een tekstdocument vereist een tekstverwerkingsprogramma dat op zijn beurt van een computerplatform en een specifiek besturingssysteem afhankelijk is. Staat het document op een extern opslagmedium, dan is er ook een welbepaald leestoestel nodig. Is een van die voorwaarden niet vervuld, dan blijven de gegevens ontoegankelijk en dus nutteloos. De razendsnelle ontwikkelingen in de informatietechnologie en de vele verschillende gebruikte platformen, softwaretoepassingen en opslagmedia dreigen de levensduur van de nu massaal aangemaakte digitale informatie dan ook heel kort te maken.

De onderkenning van dit probleem is recent. Aanvankelijk ging de aandacht naar de fysieke houdbaarheid van de elektronische dragers, die merkelijk korter is dan die van papier of microfilm. Maar zelfs de fragielste opslagmedia zullen langer beschikbaar zijn dan de hard- en software waarmee ze gelezen kunnen worden. Dat betekent dat de digitale gegevens voortdurend moeten worden overgezet, niet alleen naar nieuwe dragers, maar ook naar een nieuwe softwareomgeving. Anders worden ze onleesbaar. Een andere mogelijkheid is alle opeenvolgende configuraties bewaren. Maar dat is op langere termijn niet meteen een elegante oplossing, aangezien de door informatisering gewonnen ruimte weer wordt ingenomen door vele generaties computers en randapparatuur. Bovendien heeft het geen zin om machines te bewaren waarvoor geen wisselstukken meer te verkrijgen zijn, of software die niemand meer weet te gebruiken.

ONGRIJPBARE INHOUD

Het bewaren van digitale data vraagt dus een actief en regelmatig onderhoud. Dat is een fundamenteel andere benadering dan bij de bewaring van papier, waar de informatie in optimale klimatologische omstandigheden wordt gestockeerd en liefst nooit meer wordt aangeraakt. Maar ook het omzetten van een elektronisch document naar een nieuwe softwareomgeving (migratie) of naar een nieuwe versie van hetzelfde softwarepakket (conversie) brengt problemen mee. Dat proces gaat meestal gepaard met het geheel of gedeeltelijk foutief omzetten van de inhoud. In het geval van een tekstdocument gaat het zowel om paginastructuur, karakters als stijlkenmerken. Ook dat is een gevolg van de scheiding tussen drager en informatie. In een papieren document zijn inhoud, structuur en vorm zichtbaar aanwezig. In een digitaal document zijn ze afhankelijk van de software waarmee ze zijn aangemaakt en daarom ongrijpbaar. Dat betekent dat je niet zeker kan weten of inhoud, structuur en vorm van een digitaal document wel hetzelfde zijn als bij de creatie ervan.

Ook los van conversie of migratie is de authenticiteit of integriteit van een elektronisch bestand niet gewaarborgd. Elektronische informatie kan makkelijk gewijzigd worden zonder een spoor achter te laten. Per ongeluk, maar ook opzettelijk. Natuurlijk is het ook mogelijk een papieren document zodanig te vervalsen dat niemand het merkt, maar dat is niet eenvoudig.

Op dit moment is er dus geen kant-en-klare oplossing. Op termijn moet er natuurlijk een algemene standaard voor het aanmaken van digitale informatie komen. Een van de kanshebbers is XML, een platform- en softwareonafhankelijke taal die door verschillende fabrikanten ondersteund wordt. Maar of XML ook algemeen gebruikt zal worden, valt nog te bezien. De belangen in de software-industrie zijn groot en vanzelfsprekend wil iedereen wel de fabrikant van een algemeen aanvaard standaardformaat zijn. Ondertussen is het behelpen, door het bewaren van configuraties of het nauwgezet overzetten naar een nieuwe omgeving. In beide gevallen is het toekennen van metadata, gegevens over gegevens, essentieel.

De oorspronkelijke omgeving waarin het digitale archiefstuk is ontstaan en beheerd, moet explicieter beschreven worden dan bij papieren archiefbestanden het geval is. Het gaat enerzijds om inhoudelijke of intellectuele gegevens, die ook aan papieren documenten worden toegekend, zoals een korte beschrijving van de inhoud en de vermelding van datum en auteur. Die zijn nodig om het document te interpreteren of te begrijpen, ook als de oorspronkelijke omgeving waarin ze zijn ontstaan en een rol hebben vervuld niet langer bestaat. Een verzameling cijfers kan bijvoorbeeld van alles betekenen. Anderzijds moeten aan het document gegevens worden vastgemaakt over de wijze waarop digitale archiefstukken leesbaar kunnen worden gemaakt. Dat zijn de technische gegevens die nodig zijn om het document te openen: de configuratie waarmee het is aangemaakt, de eventuele migraties die het heeft ondergaan en door wie die zijn uitgevoerd. Die gegevens zijn ook van belang voor de integriteit van de informatie.

VOORZORGEN NEMEN

Metadata zijn ook nodig als je rekent op emulatie (het nabootsen van software op een computer die daar niet voor ontworpen is) om digitale documenten zonder verder ingrijpen langdurig te bewaren. De computer laat immers alleen maar weten dat hij het document niet kan openen. Hij zegt niet wat voor document het is en evenmin met welke software het is aangemaakt. Als we niet weten wat de inhoud van een bestand is, gaan we nooit de complexe en tijdrovende taak ondernemen om een emulatieprogramma te schrijven.

Het zal duidelijk zijn dat de toekenning van die gegevens niet achteraf kan gebeuren. Het moet gebeuren bij de creatie van het document en dat komt op een totale omkering van de archieffunctie neer. Om raadpleegbaarheid en authenticiteit in de toekomst te garanderen, moet een archivaris nu al de nodige voorzorgen nemen. In een papieren informatiesysteem loopt hij achter de gebeurtenissen aan. De metadata worden dan achteraf toegekend, namelijk wanneer iemand binnen de instelling beslist dat een document niet langer onmiddellijk nut heeft en dus naar het archief kan. Nu moet de archivaris zich gaan bemoeien met de manier waarop de informatie wordt aangemaakt. Anders is langdurige bewaring van elektronische documenten een illusie.

De Nederlanders, die verder staan in de definiëring van de problematiek, formuleren het zo: ‘Het realiseren van digitale duurzaamheid is primair een bestuur-veranderkundig probleem, dat dringend om een oplossing vraagt. Het toenemende gebruik van informatie- en communicatietechnologie binnen de overheid leidt tot ingrijpende wijzigingen in de wijze waarop taken worden uitgevoerd. De overgang naar elektronische communicatie (tussen overheid en burger en tussen overheidsorganisaties onderling) vereist voorzieningen die de zorgvuldigheid, betrouwbaarheid en integriteit van het handelen van de overheid waarborgen. Van de exacte kosten valt thans geen betrouwbare schatting te maken.’

Het waarborgen van de authenticiteit van digitale informatie is gezien de snelle ontwikkelingen niet alleen voor toekomstige historische onderzoekers van belang. De in archieven opgeslagen informatie is tevens een neerslag van het handelen en zodoende fundamenteel belangrijk inzake bewijskracht, verantwoording en rechtszekerheid. Dat wordt allemaal heel concreet als je gaat denken aan bouw- en milieuvergunningen, processen-verbaal van de politie, politieke beslissingen, gegevens van de burgerlijke stand, gerechtelijke vonnissen of pensioendossiers. Want ook de overheid gaat digitaal. Dat staat zo in het regeerakkoord en het wordt ook door Europa opgelegd.

In de loop van vorig jaar deden het stadsarchief van Antwerpen en het Interdisciplinair Centrum voor Recht en Informatica (ICRI) in Leuven een onderzoek naar de stand van zaken omtrent de aanmaak en bewaring van digitale overheidsdocumenten in Vlaanderen. De eerste conclusie was dat de Vlaamse instellingen de afgelopen jaren wel degelijk mee op de digitale trein zijn gesprongen: veel overheidsdocumenten die vroeger op papier werden aangemaakt, verschijnen nu in eerste instantie in digitale vorm. Er worden ook maatregelen genomen voor de beveiliging van de gegevens, met name het maken van een back-up. Maar daarmee houdt het goede nieuws op. De bewaring van digitaal aangemaakte informatie gebeurt in 63 procent van de gevallen op papier. In het andere geval – opslag op externe dragers of op het systeem zelf – zegt drievierde van de ondervraagde instellingen geen vast bestandsformaat te gebruiken voor de langdurige opslag van documenten. Bijna niemand maakt gebruik van metagegevens. Dat betekent dat een deel van onze instellingen de voordelen van digitalisering niet benut, terwijl er bij de andere instellingen een digitale chaos in de maak is. Bestanden worden bewaard op verschillende dragers, in verschillende formaten, en dat zonder enig inzicht in de status van het document. Met alle gevolgen van dien voor integriteit en raadpleegbaarheid van gegevens. Er is geen reden om aan te nemen dat het met de federale instellingen beter is gesteld.

SLECHT PAPIER

Nochtans zijn alle overheidsdocumenten aan de archiefwet uit 1955 onderworpen. Die stelt onder meer dat openbare besturen hun documenten van meer dan honderd jaar oud verplicht moeten neerleggen bij het Algemeen Rijksarchief, een federale wetenschappelijke instelling belast met de zorg voor en het beheer van het Belgisch archivalische erfgoed. Vrijwillig kan dat al na dertig jaar, als de documenten ten minste geen administratief nut meer hebben. Het Rijksarchief bewaart onder meer de archieven van de centrale instellingen van de Bourgondische, Spaanse en Oostenrijkse Nederlanden en ook veel private archieven van kerken, kloosters, politici en belangrijke families. De taak van het Rijksarchief is die continuïteit te verzekeren. Dat is niet vanzelfsprekend: uit de negentiende eeuw is erg weinig bewaard gebleven als gevolg van het gebruik van papier van een heel slechte kwaliteit.

‘Ik wil de geschiedenis niet ingaan als conservator van een periode waaruit niets bewaard bleef’, stelt algemeen rijksarchivaris Ernest Persoons. ‘De archiefwet stelt dat de openbare besturen niets mogen vernietigen zonder mijn toelating. Als het over papier gaat, is men nog zorgvuldig. We hebben dat geleerd. Maar men heeft nooit dezelfde reflex gehad voor geautomatiseerde archieven. Iedereen denkt dat er eerst een nieuwe archiefwet moet komen, maar dat is niet zo. Onze wet is heel soepel: de drager wordt niet bepaald.’

Het Rijksarchief heeft een dubbele taak te vervullen. Enerzijds dient het toezicht uit te oefenen op de bewaring van de archieven van alle hoven, rechtbanken, openbare besturen en instellingen. Anderzijds moet het de overheidsbesturen bijstaan in hun archiefbeheer, door het opstellen van richtlijnen en aanbevelingen voor de bewaring, de selectie en de overdracht van de overheidsarchieven. Persoons wil nu in samenwerking met de Katholieke Universiteit Leuven het nodige onderzoek voeren om die algemene richtlijnen te kunnen opstellen.

Het is niet vanzelfsprekend om de overheid voor de problematiek warm te maken. Het Rijksarchief denkt op lange termijn. ‘Ik moet nu overal voor gebouwen zeuren’, aldus Persoons. ‘Dat zal nog zo’n dertig jaar duren. Daarna zullen de openbare instellingen digitale informatie beginnen overdragen. Ik moet echter nu al gaan pleiten om die technische omgeving te creëren, anders zullen we de informatie op dat moment niet meer kunnen lezen. Dat uitleggen is niet altijd even makkelijk.’

Kris De Decker

Reageren op dit artikel kan u door een e-mail te sturen naar lezersbrieven@knack.be. Uw reactie wordt dan mogelijk meegenomen in het volgende nummer.

Partner Content