keskiviikko 24. lokakuuta 2012

Digitaalisen pitkäaikaissäilytyksen haasteet


Hyvälaatuiset paperiasiakirjat voi laittaa hyllyyn - ja jos säilytysolosuhteet ovat edes kohtuulliset - niin asiakirjat säilyvät kyllä satoja vuosia. Digitaalisia aineistoja sen sijaan ei voi vain ’unohtaa’ levylle, ja olettaa niiden säilyvän vuodesta toiseen, koska digitaaliset aineistot vaativat jatkuvaa tarkkailua ja huolenpitoa. Sähköinen pitkäaikaissäilytys on pohjimmiltaan vain ennakkoon suunniteltu tapa toimia eri tilanteissa. Jotain mystisen vaikeaa aiheessa tosin täytyy olla, koska asiaa ei ole vielä Suomessa saatu ratkaistuksi. Niin sanottu ’digitaalisen ajan musta-aukko’ on venynyt 1980-luvun alusta jo 2000-luvulle saakka. Joko 2010-luvun sähköiset aineistot saataisiin pelastettua?

Ohessa on muutamia keskeisiä ongelmia, haasteita ja näkökulmia, joita me sähköisen pitkäaikaissäilytyksen parissa työskentelevät joudumme ottamaan huomioon.

1§ Säilytyspalvelun tarjoajan luotettavuus

Maailma on pullollaan sähköisiä säilytyspalveluita tarjoavia yrityksiä. Mikään ei ole helpompaa kuin ostaa niiltä säilytystilaa ja tyrkätä aineistot pilveen. Mutta jos pitkäaikaissäilytyksen aikaperspektiivi n vaikkapa 20, 30, 50 tai 100 vuotta, niin palveluntarjoajan luotettavuus kannattaa ottaa tarkasteluun. Onko yritys pystyssä vielä kolmen vuoden kuluttua? Ennätätkö siirtää aineistosi turvaan ennen kuin joku vetää viimeisen kerran pistokkeen irti seinästä?

2 § Tiedostoformaattien konvertointi

Edellä mainittu ongelma on varmasti jotenkin ratkaistavissa vaikkapa hajauttamalla aineostot useiden eri palveluntarjoajien servereille ja tekemällä sopimuksiin kunnolliset exit-klausuulit. Toisin sanoen bittien säilyttäminen ei liene suurin ongelma. Useimmat palveluntarjoajat tarjoavat kuitenkin vain säilytystilaa, eli sama asia kuin jos vuokraisit jostakin varastohallista hyllytilaa paperiasiakirjoillesi. Paperisten dokumenttien formaatit eivät tosin vaihdu vuosien kuluessa, mutta sähköisissä aineistoissa ne vaihtuvat. Jo joitain 1990-luvun ohjelmistoilla luotuja dokumentteja on hankala aukaista, 1980-luvusta nyt puhumattakaan. Sähköisessä pitkäaikaissäilytyksessä tulisi käyttää vain yleisesti käytössä olevia, ja mielellään pitkäaikaiseen säilytykseen sopivia, tiedostoformaatteja. Lisäksi ne tulisi aina tietyn väliajoin konvertoida uuteen formaattiin, jotta ne olisivat käytettävissä jatkossakin.

3 § Aineiston löydettävyys ja käytettävyys

Kun aineiston säilytys ja tiedostoformaattien migraatio on saatu ratkaistuksi, niin ei se vielä tarkoita, että pitkäaikaissäilytyksen ongelmat olisi ratkaistu. Useimmilla yksityishenkilöilläkin digitaalisia tiedostoja voi olla kymmeniä tuhansia kappaleita (useimmissa tapauksessa digikuvia sekä tekstitiedostoja). Suurten yritysten tapauksessa kappalemäärät lasketaan tietenkin miljoonissa. Pelkästä säilyttämisestä ei koskaan ole iloa, jos aineisto ei ole käytettävissä. Eivät arkistotkaan säilytä kokoelmiaan säilyttämisen ilosta, vaan kyllä niitä säilytetään käyttöä varten. Säilyttämisen hallintaa varten tarvitaan siis jokin tietojärjestelmä, jonka avulla huolehditaan aineiston käytettävyydestä. Useimmiten asia ratkaistaan jonkinlaisen tietokantasovelluksen avulla. Tietokantaan tallennetaan dokumenttien sisältöön ja niiden käyttöön ja kontekstiin liittyvää metatietoa, jonka avulla voidaan huolehtia tiedon löytymisestä ja myöskin löydetyn tiedon luotettavuudesta.

4§ Kyllähän se jotain maksaa

Gigantista voi käydä ostamassa satasella ulkoisen kiintolevyn. Muutamalla kymppitonnilla saa jo kohtuullisia nauhatallennusjärjestelmiä, joiden kapasiteetti on jopa satoja teratavuja. Kuitenkin jos tallentaa aineistonsa pitkäaikaisesti ja luotettavasti, niin palveluntarjoajan tulisi huolehtia vähintäänkin kolmesta yllä olevasta asiasta. Ja mitä tiukemmat vaatimukset asetetaan säilytysympäristön turvallisuudelle ja luotettavuudelle, niin sitä enemmän se maksaa. Aineistot tulisi hajauttaa vähintään kolmeen eri paikkaan ja ne tulisi myös maantieteellisesti hajauttaa. Laitteistojen ylläpidosta ja ammattimaisesta tietopalvelusta aiheutuu myös kustannuksia. Näiden asioiden ymmärtäminen voi olla vähän hankalaa, jos toisena vaihtoehtona on se Gigantista ostettu kiintolevy, tai firman it-niilon palopuhe uudesta hienosta palvelinjärjestelmästä.
 

Näitä asioita on hyvä pohtia, kun mietitään digitaalisten aineistojen pitkäaikaissäilyttämistä. Ja pitkäaikaisella tarkoitan tässä lähinnä yli kymmenen vuotta kestävää säilyttämistä. Toki keskittämisellä saadaan kustannuksia merkittävällä tavalla pienennettyä, ja mm. juuri siitähän Capture-hankkeessakin on kysymys. Tärkeintä on kuitenkin saada digitaalisen ajan musta aukko vihdoin suljettua, ja että pystymme tallentamaan meidän aikamme yrityshistoriaa tuleville sukupolville. Ilman yritysten sähköisten aineistojen säilyttämisen ratkaisua tulevaisuuden historiankirjoitus tulee olemaan valitettavan viranomaispainotteista.
 
Olli Alm
tietopalvelu- ja kehittämispäällikkö

Ei kommentteja: