Dataa, joka liikuttaa

28.12.2015

Tietopalvelu Sotasampo tuo talvi- ja jatkosodan aineistot kaikkien ulottuville ja avaa uudella tavalla Suomen historiaa.

Eero Hyvönen kertoo, että Sotasampo.fi-portaalissa keräsi ensimmäisenä viikonloppuna yli 20 000 kävijää. Kuva Aino Huovio

Itsenäisyyspäivän alla Aalto-yliopiston professori Eero Hyvösen sähköpostilaatikkoon alkoi tipahdella koskettavia tarinoita.

”Kyynelsilmin kiitän hienosta arkistosta. Olin junnuna sukulaisen hautajaisissa ja nyt löydän tietoja hänen vaiheistaan. Kiitos ja kumarrus.”

Palautevirran synnytti Hyvösen johtaman tutkimusryhmän ja laajan yhteistyöverkoston luoma, marraskuun lopulla julkistettu Sotasampo-tietopalvelu, joka kokoaa yhteen talvi- ja jatkosotaan liittyviä keskeisiä kansallisia tietoaineistoja.

– Puolustusvoimien SA-arkistosta saimme 160 000 valokuvaa ja Kansallisarkistosta sotasurmatietokannan tiedot yli 95 000 menehtyneestä sekä 26 500 joukko-osastojen päiväkirjaa. Suomen Sotahistoriallisen Seuran ja Bonnierin kautta tuli yli 3300 Kansa taistelee -lehden artikkelia, ja Maanmittauslaitos toimitti meille yli 800 000 paikannimen rekisterin sekä tiedot 35 000 menetetyn Karjalan paikasta karttoineen, joihin innokkaat alan harrastajat olivat tehneet sisällönkuvailun ja geokoodauksen, Eero Hyvönen listaa esimerkkejä.

Samoihin materiaaleihin on toki päässyt tutustumaan ennenkin kunkin osapuolen omissa arkistoissa. Sotasammon erityisyys ja hyödyllisyys piileekin siinä, että se kokoaa ihmissilmälle tulkittavaksi tarkoitetun tiedon, kuten valokuvien ja tekstipätkien, lisäksi tietoihin liittyvän, koneiden ymmärtämän metadatan ja tuo sen kaikkien ulottuville avoimena linkitettynä datana (Linked Open Data). Tiedonpalasia ja niiden välisiä linkkejä on jo viisi miljoonaa, ja ensimmäinen niiden pohjalta luotu älykäs sovellus on Sotasampo.fi-portaali.

– Siellä voi esimerkiksi nimihaun kautta etsiä omaan, sodassa menehtyneeseen sukulaiseensa tai tiettyyn upseeriin liittyviä sotatapahtumia historiallisilla kartoilla ja aikajanalla, joukko-osastoja, valokuvia, sotapäiväkirjoja, lehtiartikkeleita ja muita aineistoja, Hyvönen selittää.

– Data on julkaistu tutkimusryhmän kehittämässä ja ylläpitämässä avoimessa Linked Data Finland -palvelussa noudattaen semanttisen webin periaatteita. Käytännössä tämä tarkoittaa, että kaikille tiedoille luodaan omat verkko-osoitteet, joiden avulla koneelle kerrotaan, miten eri tiedot liittyvät toisiinsa. Juuri semanttinen verkko luo perustan sovellusten kehittämiselle. Sen avulla kone voidaan myös laittaa päättelemään verkosta lisää dataa, eli luomaan uusia yhteyksiä ja enemmän tietoja olemassa olevan tiedon pohjalta.

sotasampo.png

Kuvassa on Sotasammon Tapahtumat-näkymä, joka esittää talvi-ja jatkosodan poliittisia ja sotilaallisia tapahtumia aikajanalla ja viiden päivän aikaikkunaan (suorakulmio keskellä) sisältyvät tapahtumat kartalla. Taustalla näkyvä lämpökartta lasketaan aikaikkunan aikana menehtyneistä sotilaista Kansallisarkiston sotasurmadatan perusteella. Ikkunaa ajassa siirtämällä muuttuvat tapahtumat ja sotasurmien määrää ilmaisevan lämpökartan väritys (punainen-keltainen-vihreä) muuttuu, mikä antaa yleiskuvan tapahtumien kehittymisestä ajan ja paikan suhteen. Oikealla näkyy valittuun tapahtumaan liittyviä valokuvia puolustusvoimien kuva-arkistosta sekä tietoa sotasurmien syistä.

Koko Suomen hanke

Eero Hyvönen on tehnyt ryhmänsä kanssa tutkimusta kulttuurisisällöistä ja niiden julkaisemisesta semanttisessa verkossa jo vuodesta 2002. Työ on palkittu useaan otteeseen sekä ulkomailla että Suomessa; viimeksi Valtion tiedonjulkistamispalkinnolla vuonna 2014. Sotasampo on kuitenkin hankkeena erityinen paitsi kokonsa, myös aiheen kansallisen ja henkilökohtaisen merkittävyyden takia.

– Isäni on sotaveteraani ja äitini suku luovutetusta Karjalasta, Hyvönen kertoo.

– Olemme saaneet palvelusta paljon liikuttavaa palautetta, sekä myös korjauksia esimerkiksi paikannimiin ja henkilötietoihin liittyen.

Hyvösen mukaan Sotasammon kehitys onkin jatkossa tarkoitus joukkoistaa kaikkien asianosaisten kesken. Tavoite on, että kuka tahansa voisi lisätä piironginlaatikoihin säilötyt muistot osaksi tietopalvelua.

– Jo nyt sotahistorian harrastajat ja ihan tavalliset kansalaiset ovat olleet isossa roolissa. Timo Hakala esimerkiksi teki valtavan työn tuottamalla käsin metadatan Kansa taistelee -lehden 3360 artikkeliin, ja Jyrki Tiittanen geokoodasi 35 000 paikkaa Karjalan historiallisilla kartoilla. Tulevaisuudessa Sotasampoon voisi ladata vaikka isoisän ottaman kuvan taustatietoineen; missä kuva on otettu ja keitä siinä on. Palvelu linkittäisi sen heti muuhun tietoon kertomalla esimerkiksi, mitä muuta kuvan henkilöistä tiedetään, mitä kaikkea paikkakunnalla sodan aikana tapahtui ja niin edelleen. Näin oma tieto rikastuisi ja rikastaisi samalla kaikkien yhteistä tietoa.

Sotasampo on osa opetus- ja kulttuuriministeriön Avoin tiede ja tutkimus -hankekokonaisuutta ja mukana valtioneuvoston kanslian Suomen itsenäisyyden 100-vuotisjuhlavuoden ohjelmassa.

Lisätiedot:

Professori Eero Hyvönen
Puh. 050 384 1618
eero.hyvonen@aalto.fi

Hankkeen kotisivu http://seco.cs.aalto.fi/projects/sotasampo/
Portaali http://sotasampo.fi
Datajulkaisu: http://www.ldf.fi/dataset/warsa