Palvelut

Tutkimusdatan dokumentointi, organisointi ja metadata

The image is from Aalto University material bank

Metadata kuvailee tutkimusdataa ja sitä tarvitaan datan uudelleenkäyttöä varten. Tutkimuksen näkökulmasta metadataa on kahta päätyyppiä:

  1. Tutkimusdatan kuvaus: miten data on luotu, merkitys, käyttöön tarvittava ohjelmisto jne.
  2. Bibliografiset perustiedot, joita tarvitaan tutkimusdatan hakemiseen ja siihen viittaamiseen. Näitä tietoja ovat esimerkiksi tekijä, lisenssi, oleelliset päivämäärät, nimi, julkaisuvuosi, data-arkisto ja tunniste.

Metadatastandardit

Metadatastandardeja on useita. Samoja metatietostandardeja voidaan käyttää sekä tutkimusaineiston kuvailussa/dokumentoinnissa tutkimushankkeen aikana että data-arkistoissa, joihin tallennetaan datan bibliografiset perustiedot.

Lisätietoa:

Yleisesti ottaen metatietostandardia ei valita itse, vaan se valikoituu käytetyn data-arkiston perusteella. Joskus data-arkistolla on vaatimuksia sen suhteen, missä formaatissa data tai metadata tallennetaan. Rakenteistetussa formaatissa tallennettua dataa sisältävä arkisto mahdollistaa laajan automaattisen tiedonkäsittelyn ja datan louhinnan.

Alla olevasta linkistä saa lisätietoa data-arkistoihin liittyvästä metadatasta.

Computer screen with several windows open, showing cylindrical shapes on topmost windoe and three-dimensional grid structure underneath it. Photo by Mikko Raskinen.

Tietoaineistojen kuvailu data-arkistoissa

Luo hyvä kuvailu tehostaaksesi tietoaineistosi uudelleenkäyttöä, viitattavuutta ja löydettävyyttä.

Palvelut

Tutkimusdatan kuvailussa on suositeltavaa käyttää alakohtaista metadataformaattia, jotta data tulee kuvailtua mahdollisimman yksityiskohtaisesti. Jos alakohtaista metadataformaattia ei ole, kannattaa datasta kirjoittaa README-tyyppinen peruskuvailu.

Datan peruskuvailu

    Yksi tavallisimmista syistä datan käyttökelvottomuuteen on se, että esimerkiksi sisältöön ja keräämiseen liittyvät tiedot unohtuvat. Siksi tällaiset tiedot tulisi tallentaa jollakin tavoin. Yksinkertaisin tapa on luoda rakenteistamaton README-tiedosto eli ns. README-tyyppinen metadatatiedosto.

    Suurimmalle osalle dataa riittää rakenteistamaton kuvailu, mutta laajojen tai arvokkaiden tietoaineistojen ja niihin liittyvän metadatan tulisi olla rakenteista, sillä kyseisiä aineistoja käytetään todennäköisemmin uudellen ja mahdollisesti ohjelmallisesti. Jos data osoittautuu arvokkaaksi, se on myös mahdollista muuntaa rakenteisemmaksi jälkikäteen.

    Datan rakenteisuus on varsin alariippuvaista. Paras tapa on noudattaa oman alan standardeja. Esimerkkejä rakenteisesta datasta löytyy 5-star data -verkkosivulta. On suositeltavaa käyttää avointa, koneluettavaa dataformaattia, joka ei todennäköisesti vanhene.

    Datan organisointi

    Ilman selkeää organisointistrategiaa datasta tulee mahdotonta ylläpitää ja löytää jopa datan tuottajalle itselleen. Jokaisella projektilla on erilaiset vaatimukset, joten yleistyksiä on vaikea tehdä. Dataa sisältävien kansioiden suhteen kannattaa pitää tiukkaa linjaa: lajittele asiat huolellisesti ja ajoissa, ja nimeä eri projektiympäristöt yksilöllisesti. Saman datan kopioiminen eri projektien kansioihin voi johtaa siihen, että datasta muodostuu useita eri versioita. Jos samaa dataa käytetään eri projekteissa, kannattaa mieluummin linkittää sama dataa sisältävä kansio eri projekteihin. Lajittele tiedostot projektiympäristössä tyypin tai käytön mukaan.

    Lisätietoja datan organisointiin liittyvistä hyvistä käytännöistä Aalto Science-IT:n sivuilla

      Tutkimusdatan hallinnan ohjeet

      Näillä linkeillä voit selata tutkimusdatan hallinnan ohjeita.

      Kuva oppimiskeskuksen sisätiloista. Kuvassa etualalla opiskelija istuu lukemassa kirjaa vihreässä tuolissa. Taka-alalla kaksi opiskelijaa keskustelee pyöreän pöydän ääressä., photo Tuomas Uusheimo

      Tutkimusdatan jakaminen ja julkaiseminen

      Yleiskatsaus ja ohjeita tutkimusdatan julkaisemisen ja jakamisen palveluihin.

      Palvelut
      People talking with each other

      Tutkimusdatan hallinta

      Tutkimusdatan hyvä hallinta on osa laadukasta tutkimusprosessia ja luo kilpailuetua.

      Palvelut
      Tätä palvelua tarjoaa:

      Tutkimus- ja innovaatiopalvelut

      Löysitkö tästä tarvitsemasi tiedon? Jos et, ota meihin yhteyttä.
      • Julkaistu:
      • Päivitetty:
      Jaa
      URL kopioitu