tiistai 28. kesäkuuta 2011

Metatiedot: kaikkiko käy?

Capture-hankkeen yksi suurimmista haasteista liittyy suunniteltavan tietojärjestelmän tietomalliin ja hallinnoitavien aineistojen metatietoihin. Capturessa suunniteltavan tietojärjestelmän tulisi siis kyetä hallitsemaan a) analogisen aineiston viitetietoja, b) digitoitujen aineistojen viitetietoja ja itse digitoituja objekteja sekä c) syntysähköistä tiedostomuotoista aineistoa.

Ensimmäisessä vaiheessa uuteen tietojärjestelmään siirrettäisiin tietenkin Elkan nykyisessä arkistotietokannassa, erityismateriaalirekistereissä sekä ElkaD-sovelluksessa olevat viitetiedot sekä digitaaliset objektit. Syntysähköisen aineiston vastaanoton ensimmäiseksi ”kohderyhmäksi” epäilemme yritysten käytössä olevia ja jo käytöstä poistettuja verkkolevyjä. Niistä ”imaistava” aineisto on hyvin todennäköisesti varustettu erittäin niukoilla metatiedoilla, ehkäpä vain nimekkeellä ja päiväyksellä.

Myöhemmässä vaiheessa odotamme järjestelmään tulevan aineistoja suoraan rajapinnan kautta esimerkiksi Microsoft SharePointista ja erilaisista dokumenttienhallinta- ja asiankäsittelyjärjestelmistä. Viimeksi mainituissa tapauksissa – varsinkin jos/kun niihin on kytketty TOJ – aineiston voidaan olettaa sisältää huomattavan paljon kattavammat metatiedot. Mutta minkä standardin mukaan?

Haastavinta sähköisen aineiston vastaanotto lienee kuitenkin tiettyjen erityisaineistojen ja –toimialojen suhteen. Näitä ovat esimerkiksi videotuottajat, ammattivalokuvaajat, insinööri- ja suunnittelutoimistot. Näiden aineistojen hallintaan tarvitaan useita aineistotyyppikohtaisia standardeja, kuten esimerkiksi valokuvien teknisen metadatan osalta MIX (Metadata for images in XML).

Järjestelmän suunnittelun kannalta näin heterogeenisen aineiston hallinta aiheuttaa päänsärkyä. Toisaalta kun pitäisi hallinnoida perinteistä paperiaineistoa, digitoituja kokonaisuuksia, erittäin karuilla metatiedoilla varustettuja syntysähköisiä aineistoja ja sitten vielä omien standardiensa mukaan toimivia erityisaineistoja. Nyt onkin mietittävä minimitason metatiedot kaikille edellä mainituille ryhmille. Lisäksi minimitason metatiedot on kytkettävä myös säilytysajan pituuteen. Vai uskaltaako joku luvata Word-tiedoston säilyvyyden ja löydettävyyden kolmenkymmenen vuoden päähän pelkän nimekkeen ja päiväyksen turvin? En minä ainakaan. On selvää, että pysyvästi säilytettäviltä aineistoilta edellytetään huomattavasti kattavammat metatiedot. Jonkinlaisena mittatikkuna toiminee varmastikin Kansallisen Digitaalisen Kirjaston asettamat vaatimukset PAS-aineistolle.

Ei kommentteja: