keskiviikko 19. joulukuuta 2012

Haasteita


Mitä tehdään Windowsin komentosarjalle? Mikä on bmt? Entä WP95? Miten järjestetään .aup, .html, .pcx tai Microsoft Access Database vai järjestetäänkö ja mihin järjestykseen? Näitä pohdiskelee arkistonjärjestäjä kun eteen tuodaan sähköinen arkisto, siis verkkolevy tuhansine tiedostoineen, kansioissa ja ilman. Ja näistä pitäisi saada jotain järkevää aikaiseksi.

Tärkeintähän on saada talteen tietoa, samalla tavalla kuin paperiaineistoa käsitellessä.  Ja itse asiassa periaate onkin melkein sama, olipa kansiot hyllyssä tai tietokoneen näytöllä. Lähdetään sortteeraamaan aineistoa pienempiin kokonaisuuksiin erilaisilla perusteilla, tiedostojen nimien, tiedostotyyppien ym. mukaan. Etsitään selkeät isot sarjat esim. pöytäkirjat, tiedotteet, projektiaineistot tai muut vastaavat kokonaisuudet ja siirretään omiin kansioihin. Hyvällä onnella saattaa olla jo jonkinlaista kansiorakennettakin valmiina. Loput sekalaiset käydään vähän tarkemmin läpi ja poistellaan samalla ns. turhat tiedot ja tiedostot. Voisi tietysti kysyä, mikä on turhaa tietoa ja mitkä turhia tiedostoja. Turhan tiedon tunnistamisessa auttaa ”tavallinen arkisto-osaaminen”, ainakin jos saa tiedoston auki, mutta tiedostojen tunnistamista pitää alkaa opetella. On tiedettävä mitkä tiedostot on säilytettäviä tai hävitettäviä. Vai voiko pelkän tiedostotyypin perusteella päätellä, että sen sisältämä tieto on tai ei ole arvokasta? Osittain voikin, mutta sekin pitää tietää.

Ja koko ajan tulee uusia tiedostoja, joiden kohdalla joudutaan miettimään mitä tehdä ja miten saada tiedot tiedostoista. Muitakin temppuja, kuten massakonvertointia Pdf:ksi ja OCR-skannausta tulee varmaan opeteltavaksi. Voi meitä, aikamoisia haasteita.
 
Heljä Strömberg
- digitaalisen järjestämisen pioneeri

Ei kommentteja: