Å bevare det digitalt skapte – Mission Impossible?


Arbeiderbevegelsens arkiv og bibliotek (Arbark) begynte for alvor å jobbe med digitalt skapte arkiver gjennom sitt første prosjekt i 2015, og har videreført dette i flere senere prosjekter. Et viktig poeng, som vi gradvis har erfart i disse prosjektene, er at mye digitalt innhold strider mot grunnleggende tankeganger i arkivverden:

  1. Det er lett å endre. I arkiv vil vi helst «fryse» materialet.
  2. Det kan spres lett. I arkiv vil vi i i visse tilfeller ha kontroll (klausuler/innsyns- og bruksbestemmelser).
  3. Hardware eller software/formater kan være utdaterte, noe som gjør dataene vanskeligere å lese av. I verste fall står man kun igjen med bits (0ere og 1ere), data uten noen mening, eller et eldre lagringsmedium som en ikke kan benytte seg av. I papirarkivenes verden er et ark et ganske solid lagringsmedium med en god holdbarhetsdato (og krever kun egne øyne for avlesning).
En tilleggsutfordring er at det kan være virus eller annen malware i materialet. Dette kan til nød sammenlignes med muggsoppens skadevirkninger i papirarkiv, eventuelt skjeggkre som rett og slett kan spise opp informasjon.

Datamaskinproduksjon
Produksjon av datamaskiner hos Tandberg Data, september 1980.
Foto: Arbeiderbladet / Arbark


Digitale arkiver oppfattes som noe helt nytt, men IBM PC så sitt lys allerede i 1981, og på 1990-tallet begynte PCer for alvor å bli utbredt. Arkivsektoren både i Norge og internasjonalt har forholdt seg til det digitale skiftet, og sett på hvordan en må tenke for å håndtere det. For Arbarks arkivskaperes del ble mye kun arkivert på papir (utskrifter) ganske lenge, det var altså ikke et stort behov for å ta imot arkivmateriale i digital form. Men etter hvert gikk flere og flere fagforbund og andre over til kun digital lagring, noe som gjorde at Arbark måtte ta grep.

Grepene her var å utvikle rutiner for mottak og lagring/arkivering av digitalt materiale. Når det gjelder mottak, er det visse ting vi må gjøre:

  1. Viruskarantene. Materialet ligger «på vent» i 3 uker før endelig virustest så vi vet at antivirusprogrammet er tilstrekkelig oppdatert.
  2. Sikring av materialet med sjekksummer. Sjekksummer er kontrollsummer - korte koder som brukes til å sjekke integriteten av data. Det lages en sjekksum før materialet avleveres, og en når det er overført til oss. Hvis sjekksummen avviker fra den opprinnelige, vet vi at det har skjedd endringer i materialet. Da må vi sjekke kopier vi har andre steder (har minst tre til sammen) og finne en versjon uten endringer.
  3. Konvertering til arkivformater. Arbark legger vekt på at de digitale filene skal være i formater som egner seg for langtidsbevaring. Arkivregelverket i Norge (for offentlig sektors arkiver) gir en liste med godkjente formater Arbark ser på som veiledende. Internasjonalt finnes det også diverse informasjon om formater som vurderer egnetheten til ulike formater, også en del som ikke finnes på den norske listen.


Disketter og lagringsenheter
Foto: Arbark


Når det kommer til filformater, en liste i et lovverk kan straks få autoritativ kraft. Men det å bestemme om formatet er egnet eller ikke har et skjær av faglig skjønn. For eksempel, et arkivformat skal helst være populært. Mange bruker det, som igjen kan bety god støtte for formatet. Det skal helst også være en rekke av programmer som kan lese og tolke formatet. Ikke minst, det skal være lett å identifisere og validere formatet, det vil si sjekke om filen faktisk er formatet det påstår å være og følger formatstandarden. Dette er bare noen av hensynene en arkivinstitusjon må se på. Djevelen er i detaljene, hvert format må ses på nøye. Dette gjør ikke Arbark så ofte selv, vi lener oss helt på Nasjonalarkivet i Norges ekspertise her, til nød andre større institusjoners anbefalinger internasjonalt. Vi som privat arkivinstitusjon må ikke slavisk forholde oss til lovverket, men akkurat her har vi enn så lenge ikke funnet behov for å gå utenom det.

Arbark legger også stor vekt på god sikring av materialet; hackere og andre skal ikke få tak i det eller korrumpere det på noen måter.

Vi vil også at materialet skal være selvbeskrivende, dvs. at vedlagt arkivfilene/-dokumentene finner en beskrivelser av det så brukere skjønner hva det er også i fremtiden. Det er veldig lett å tenke at digitale arkivdata er «enkelt» i den forstand at man bare kan benytte fritekstsøk som gjenfinningsmetode. Men vi ser ofte at veien fra en (delvis) ustrukturert datamengde til en mengde strukturert informasjon som våre arkivbrukere kan benytte seg av og forstå, kan være arbeidskrevende, og svært avhengig av kvaliteten og strukturen på materialet vi mottar. Ikke minst, et arkivs brukskvalitet er sterkt avhengig av kvaliteten på de metadataene , data om data, for eksempel dato (metadata) som forklarer verdien 29.01.2025 (data), som følger med arkivet. Det inkluderer de Arbark lager selv, men også de som arkivskaper kommer med.

Skal vi være ærlige, er det innen tilgjengeliggjøring vi har mest som gjenstår. Dette er et område der Arbark har «begynt å trå vannet», det er mulig å benytte seg av digitale arkiver for våre brukere. Likevel, her er det fortsatt en ganske stor jobb som må gjøres. Vi er på vei, men ennå ikke helt i mål.

Arbark har begynt å få inn noen elektroniske arkiver, men vi vil gjerne ha mer. Både vanlige tekstdokumenter (og Excel-filer), bilder, filmer og lydopptak kan være aktuelle. Det samme er e-post og sosiale medier med mer. Vi har mottatt digitale arkiver fra Rødt, Manifest tankesmie, Fagforbundet, LO Media og Palestinakomiteen i Norge.



Tekst: Martin Ellingsrud, med bidrag fra Odd-Rune Hansen



















Publisert 30.10.2025