keskiviikko 23. tammikuuta 2013

Megatrendit vastakkain


Suomalaisessa – ja myös laajemmin länsimaisessa – yhteiskunnassa on sähköisten palveluiden osalta vallalla nyt kaksi megatrendiä, jotka ovat osittain vieläpä aika pahasti ristiriidassa keskenään. Toisaalta joka tuutissa halutaan korostaa tiedon avoimuutta, open dataa, ja ylipäätänsä julkisin varoin tuotettujen tietojen vapaata saantia ja uudelleenkäyttöä. Kaikki on niin ihanaa, kun voi vain kerätä ilmaista tietoa lähteistä x, y ja z, yhdistää ne palveluksi ö, luoda valmis appsi, ja myydä sitä iTunessa tai Google Playssä hintaan 0,99 €/kpl. Siitä syntyy uutta liiketoimintaa, uutta rahaa, työpaikkoja, verotuloja ja kaikilla on taas niin mukavaa. Uusia rovioita syntyy joka niemennotkoon ja saarelmaan, ja sen seurauksena Suomi ja koko muu Eurooppa nostetaan post-industriaalisen aikakauden talousvaikeuksista ja hyvinvointiyhteiskunta voidaan pelastaa vieläpä luontoa saastuttamattomalla tavalla.

Valtaosa kuluttajista on hyvin tyytyväisiä, kun voivat pelkästään luottokorttinumeronsa ilmoittamalla ostaa palveluita kotisohvalta käsin. TV-sarjat ja elokuvat seurataan Netflixistä, musiikki kuunnellaan Spotifystä ja kirjat ostetaan Amazonilta. Samalla lailla kulttuuripalveluita voi käyttää joko ilmaisten tai maksullisten sovellusten avulla. Mutta tässä vaiheessa on hyvä siirtyä siihen toiseen megatrendiin. Nimittäin osa kuluttajista – tai käytetään hänestä nyt tässä yhteydessä vain nimitystä kansalainen – haluaakin samalla varjella omaa yksityisyyden suojaansa ja pysytellä anonyyminä. Isoveli valvoo jokaista verkkovierailua ja salasanan näpyttelyä, joten valveutunut kansalainen ei halua jättää itsestään tuntomerkkejä verkkoon. Osa kansalaisista haluaa, että heillä on oltava oikeus anonyymiyteen. Ettei viranomaiset tai kaupalliset toimijat saa tallettaa heitä koskevia henkilötietoja rekistereihin. Kuulemani mukaan asiasta on kehitteillä EU-tasolla direktiivikin, johon Euroopan arkistot ovat antamassa lausuntoaan.

Meille arkistoillehan tämä on vähän hankala asia, sillä Elkankin noin 260 miljoonasta dokumentista hyvin suuri osa sisältää jonkinlaisia henkilötietoja, nimiä, osoitteita, henkilötunnuksia, terveystietoja ja niin edelleen. Ongelma konkretisoituu hyvin nopeasti esimerkiksi silloin, kun aineistoa lähdetään digitoimaan. OCR-skannattu, ja tietokantaan indeksoitu, aineisto kun on fulltext –hakujen piirissä. Jo muutaman hyllymetrin digitoiminen tuottaa metatietoa enemmän, kuin mitä arkistotietokantaan on kolmen vuosikymmenen aikana perinteisin menetelmin luetteloitu. Esimerkiksi 2 hyllymetriä sisältää noin 10 miljoonaa sanaa. Jos taas henkilötietoja lähdetään aineistosta väkisin poistamaan (mikä on käytännössä muuten lähes mahdotonta) niin silloin aineisto itsessään muuttuu useimmissa tapauksissa lähes arvottomaksi mössöksi. Miettikääpä vaikka kirkonkirjoja, joista olisi poistettu nimet ja syntymäajat. ”Herra nro 47 meni 6.6.1972 naimisiin neiti nro 65:n kanssa. Myöhemmin heille syntyi lapset 1, 2 ja 3.”.

Näiden kahden megatrendin puristuksessa me täällä arkistossa joudumme työskentelemään.
 
Olli Alm
Tietopalvelu- ja kehittämispäällikkö

Ei kommentteja: