torstai 10. tammikuuta 2013

Luotettavaa tietoa


Lueskelin viikonloppuna isoisäni sotilaskantakortteja, ja niissä molemmissa oli hänen syntymäaika merkitty väärin. Toisen isoisän sotilaskantakorteissa taas taistelupaikat oli merkitty aika erikoisesti. Vuoden 1941 osalta oli todettu vain ylimalkaisesti, että ”hyökkäystaistelut Kannaksella”, kun taas kesän 1944 taisteluista oli Siiranmäen, Äyräpään ja Vuosalmen lisäksi esille nostettu mm. Punnuksen taistelu (joka ei käsittääkseni ollut kauhean iso kahina). Alkoi kalvamaan jälleen epäilys asiakirjallisen tiedon luotettavuudesta…

Historiallisessa aikakauskirjassa taas emeritusprofessori  Viljo Rasila rökitti aika railakkaan henkisesti Sotasurmatiedoston luokitusperiaatteita ja luotettavuutta. Rasilan avautumisen, ja Lars Westerlundin siihen kirjoittaman vastineen luettuani, pidän kyllä varsin ilmeisenä, että Rasila on ymmärtänyt koko Sotasurmaprojektin ja sen keräämän aineiston aivan väärin. Hankkeessa tallennettiin eri tietolähteistä tietoja ylös yhteiseen tietokantaan. Kyse ei siis ole tutkimuksesta, kuten Rasila on asian ymmärtänyt.

Mutta edellä on kuvattu muutamia esimerkkejä siitä, kuinka arkistoaineisto voi käyttäjässä aiheuttaa hämmennystä tai epäuskoa. Asiakirjallisen tiedon luotettavuutta on kyllä tutkittu vaikka kuinka paljon, ja siihen aiheeseen ei minulla aika tai resurssit riitä (varsinkaan blogikirjoituksessa). Kuitenkin arkistoissa tahdotaan aina korostaa arkistoaineiston luotettavuutta. Mitä se sitten tarkoittaa? Onko asiakirjoissa oleva tieto aina luotettavaa? Vai onko luotettavaa se, että aineisto on todella peräisin sieltä, mistä sen väitetäänkin olevan (ns. provenienssiperiaate). Vai onko luotettavaa se, että arkiston tuottamat kuvailu- ja luettelointitiedot ovat aina luotettavia? Johan tässä nyt tällainen pieni ihminen hämmentyy, että mitä sillä tiedon luotettavuudella tarkoitetaan.

Meille kaikille historiaa opiskelleille historiantutkimuksen lähdekritiikki on varmasti tuttu asia. Saatua tietoa ei pidä uskoa suoralta kädeltä, vaan se tulee suhteuttaa muista lähteistä saatuihin tietoihin, ja arvioida myös tietolähteen tarkoitusperiä ja luotettavuutta. Vielä pidemmälle lähdekritiikki on viety kulttuuriantropologian puolella, jossa asiakirjoja voidaan pitää vuorovaikutuksen välineenä ihmisten välillä. Eihän mitään asiakirjaa tai dokumenttia ole luotu tahattomasti. Laatijalla on aina ajatus siitä, että miksi hän dokumentin tekee ja mikä on sen tarkoitus. Ja yleensä kaikessa mihin ihminen sormensa pistää, on niin sanotun inhimillisen virheen mahdollisuus aika suuri. Todennäköisesti armeijan kirjurit lukivat isoisäni syntymäajan väärin kirjatessaan sitä kantakorttiin. Hän oli syntynyt 29.2., joten lipsahdukset 25.2. ja 26.2. on helppo tehdä.

Entäpä sitten Sotasurmatiedosto? Siinä käytetyt lähdeaineistot on aikoinaan kerätty tietyssä tarkoituksessa ja tietyllä tavalla. Hankkeessa tiedot on sitten 2000-luvun taitteessa syötetty tietokantaan. Kun aineistoa katsotaan nykypäivästä käsin, voidaan todeta, että jossakin on virhe. Mutta ei tuo ”virhe” ole syntynyt tietokantaan tallennettaessa, vaan tietoa vuosikymmeniä sitten kerätessä. Tietokannassa oleva tieto on siis luotettavaa, jos sitä verrataan alkuperäisaineistoon. Mutta vaatii tietynlaista arkistonlukutaitoa ymmärtää tämä ero. 
Olli Alm
Tietopalvelu- ja kehittämispäällikkö

3 kommenttia:

Kaisa Kyläkoski kirjoitti...

Verkon tietokannoille on tyypillistä, että niitä rynnätään käyttämään tutkimatta mitä ja miten tietoa on tietokantaan syötetty. Tämä on tullut tutuksi viimeisen vuosikymmenen aikana kun yhä uudestaan sukututkimuksen alku on jumiutunut probleemaan "kun HisKistä ei löytynyt".

Sekä Rasilan että Westerlundin tekstit olivat niin tolkuttoman pitkiä, etten jaksanut niitä ajatuksella lukea. Mutta kun sinä nyt kirjoitat "Hankkeessa tallennettiin eri tietolähteistä tietoja ylös yhteiseen tietokantaan. Kyse ei siis ole tutkimuksesta, kuten Rasila on asian ymmärtänyt." niin kävin kurkkaamassa mitä tietoa tietokannan yhteydessä käyttäjille tarjotaan. Lähdepohja-sivulla on tosiaankin todettu tuo eri lähteistä tiedon tuonti ja mieleen palasi lyhenteiden näkeminen tietueissa. Mutta sivulla lukee myös "Todennäköisimmäksi arvioitu tieto näkyy henkilöraportissa." minkä ymmärrän tarkoittavan, että tietokannan luonnissa on myös tehty päätelmiä (joka lienee väistämätöntä kun ollaan yhdistämässä lähteitä) eikä kyse ole pelkästä kopioinnista. Jätän teille historiaa opiskelleille päätelmien ja tutkimuksen rajanvedon.

Jessica Parland-von Essen kirjoitti...

Niin onko se lähteiden tulkitseminen ja vieminen sähköiseen muotoon toimintaa, joka vaatii asiantuntemusta - ja nimen omaan tulkintaa? Ja missä kohtaa loppuu "kääntäminen" kielestä ja formaatista toiseen, missä kohtaa alkaa tutkimustyö? Mielestäni rajaa ei oikein voi vetää, eikä ehkä pidäkään vetää.
Todella tärkeää on kuitenkin muistaa, ettei tieto ole täsmällisempää tai todempaa, koska se on sähköisessä muodossa tietokannassa tai visualisoituna. Itse olen pohtinut tätä aika paljon Henrik-tietokannan yhteydessä. Olenkin käyttänyt siitä nimitystä lähdeviitetietokanta. Mielestäni sellaisia voi hyvinkin käyttää tietynlaisten kysymysten tutkimiseen. Esimerkisiki tiedonlouhinta tai "distant reding" tyyppinen tutkimus, jolloin nämä nimen omaan ovat tutkimusmetodeja, joita on käytettävä todella tarkalla harkinnalla ... Kiinnostavia kysymyksiä!!

Olli Alm kirjoitti...

Käsittääkseni Sotasurmat ja Menehtyneet -tietokantatojen tapaisia palveluita tulisi käsitellä suuren yleisön palvelemisen ja ns. open data -periaatten näkökulmasta. Niiden avulla yksityishenkilö voi etsiä, että missä ja koska joku hänen sukulaisensa on kuollut.

Jos taas joku haluaa lähteä tekemään tieteellistä tutkimusta vaikkapa HisKiä lähdeaineistona käyttäen, niin olisi syytä kyllä perehtyä aika tarkasti palvelun mahdollisiin ongelmiin.