Palvelut

Tutkimusdatan dokumentointi, kansioiden organisointi ja data-arkistojen metadata

Jos sinulla ei ole selkeää dokumentointi- ja organisointistrategiaa, tutkimusdatastasi voi muodostua ylläpitämätön sotku. Tutkimusdatan dokumentointi, organisointi sekä aineistojen julkaiseminen ja kuvaaminen data-arkistoissa auttavat varmistamaan tutkimustietojesi saavutettavuuden ja ymmärrettävyyden. Hyvin dokumentoitua tutkimusdata-aineistoa on myös helpompi uudelleen käyttää uusiin tutkimustarkoituksiin ja siteerata.
The image is from Aalto University material bank

Tutkimusdatan dokumentointi

Yksi yleisimmistä teistä tutkimusdatan vaikeaselkoisuuteen on puutteellinen dokumentointi liittyen esimerkiksi käytettyihin menetelmiin, instrumentteihin ja muuttujiin.  Yksinkertaisin tapa dokumentoida näitä tietoja on ns. README-tyylinen metatieto, joka tallennetaan datatiedostojen liitteeksi. Jos alallasi on tieteenalakohtaisia ​​dokumentaatiomuotoja, on tärkeää käyttää niitä tutkimusdatan kuvauksen perustana. README-tiedoston sisältö voi olla seuraava.

 • Ketkä ovat tekijöitä ja mitä affiliaatioita heillä on?
 • Mikä lisenssi on valittu uudelleenkäyttöä varten?
 • Miten ja milloin data on kerätty/luotu ja kuka sen on kerännyt/luonut?
 • Miten dataa on valmisteltu analysointia varten?
 • Miten dataa on käsitelty?
 • Mitä menetelmiä on käytetty datan analysointiin ja miten?
 • Mitä välineitä ja laitteita on käytetty?
 • Tiedostomuodot ja tiedostojen nimeämistapa
 • Mitä ohjelmistoa on käytetty datan käsittelyyn ja analysointiin?

Tiedostojen nimeäminen voi olla myös tietojen dokumentointitekniikka. Seuraava on yksinkertainen kaava tiedostojen nimeämiseen: "AR_21022022_XRD_sample01", jossa

 • AR = Tutkijan nimikirjaimet
 • 21022022 = Datankeräämisen päivämäärä(ddmmyyyy)
 • XRD = Menetelmän lyhenne
 • Sample01 = Näytteen numero

Käytä esimerkiksi README-tyylisiä metatietotiedostoja kuvaamaan tiedostojen nimeämisjärjestelmää, mukaan lukien käytetyt lyhenteet. Sovi tutkimusryhmässäsi tutkimusdatan dokumentoinnin käytännöistä.

Kansioiden organisointi

Aalto Science IT antaa opastusta tutkimusdatan kansiorakenteiden järjestämiseen yksittäisen ja useamman tutkijan projekteissa sekä puitteet tutkimusryhmän pitkäaikaisen master-hakemiston ylläpitämiseen. Aalto Science-IT:n ohjeiden mukaan yksi kansiorakenteiden keskeisistä näkökohdista on koodin tallentaminen datatiedostoista erillään. Katso Aalto Science-IT:n Datan organisaatiosivuilta lisää hyödyllisiä vinkkejä tiedon järjestämiseen.

On tärkeää valita yksi paikka tutkimustiedon säilytykseen. Hyödynnä Aalto IT:n tallennusratkaisuja, jotka mahdollistavat pääsyoikeuksien jakamisen, sillä tämä vähentää todennäköisyyttä, että eri tiedostoversioita muokataan eri paikoissa samanaikaisesti. Mieti, kenelle myönnetään pääsy tietoihin. Ole varovainen käsitellessäsi ja tallentaessasi henkilö- ​​ja arkaluonteisia tietoja ja noudata IT:n tietosuojakäytäntöä ja ohjeita. Käytä tarvittaessa myös Aalto-versionhallintajärjestelmää ja Aalto Notebookia. Päätä tutkimusryhmäsi kanssa hakemistohierarkiasta ja käytetyistä tallennusratkaisuista.

Data-arkistojen metadata

Data-arkistot hyödyntävät erilaisia kuvailevia metadataelementtejä, joilla voi olla erilaisia nimityksiä. Tämä ohje kattaa yleisesti käytössä olevat metadataelementit. Ohjeessa käsitellään myös saatavuus- ja uudelleenkäyttöehtoja, jotka tulee yleensä määritellä tietoaineiston tallennuksen yhteydessä

Nimi

Nimi on tärkein elementti, jonka avulla data löydetään ja joka auttaa tiedonhakijaa ratkaisemaan vastaako tutkimusdata-aineisto hänen tarpeitaan. Hyvä nimi on yksilöllinen ja kuvaa jaettavaa dataa. Vaikka aineisto liittyisi artikkeliin, kannattaa harkita erillisen nimen antamista datalle. Informatiivinen nimi kattaa aiheen, ajallisen kattavuuden sekä paikkaan ja maantieteelliseen sijaintiin liittyvät tiedot.

 • Time series of microbial carbon release from soil as carbon dioxide under different nitrogen and phosphorus treatments with a low glucose concentration added as a carbon source in the Conwy catchment, North Wales, UK (2016) 
 • Eduskuntavaalitutkimus 2011: Suomenkieliset puhelinhaastattelut

Tiivistelmä

Ole tarkka ja kvantifioi mahdollisuuksien mukaan antaaksesi riittävästi tietoa datasta. Alla oleva tarkistuslista käsittää keskeiset kysymykset, joihin tiivistelmän tulee vastata.

 • Mitä data käsittelee?
 • Miten, milloin ja kenen toimesta tietoaineisto kerättiin/tuotettiin?
 • Kuinka dataa käsiteltiin?
 • Mitä menetelmiä käytettiin?
 • Mitä laitteita ja ohjelmistoja käytettiin?
 • Miksi data kerättiin/tuotettiin?
 • Mikä on dataan liittyvä maantieteellinen sijainti? Entä ajallinen kattavuus?

Avainsanat

Avainsanat eivät yleensä ole pakollisia. Niiden käyttö on kuitenkin erittäin suositeltavaa koska ne parantavat data-aineiston löydettävyyttä. Pohdi avainsanoja kohdeyleisöjen näkökulmasta. Etsi alakohtaisia avainsanoja esimerkiksi erikoissanastosta, jos sellainen on saatavilla. Käytä myös vapaasti valittavia avainsanoja ja fraaseja.    

Pysyvä tunniste

Pysyvä tunniste on data-arkiston tietoaineistolle antama yksilöllinen tunniste. Esimerkiksi DOI (Digital Object Identifier) ja URN (Uniform Resource Name) ovat yleisesti käytettyjä tunnisteita. Pysyvä tunniste antaa verkkoresurssille, esimerkiksi data-aineistolle, pysyvän "nimen" ja linkin. On tärkeää valita data-arkisto, joka tarjoaa pysyvän tunnisteen datan tallennuksen yhteydessä. Tunnisteen avulla data-aineisto voidaan yksilöidä, mikä mahdollistaa viittaamisen ja helpottaa datan uudelleenkäyttöä.

Versionhallinta

Yksi tärkeä ainakin yleisiin data-arkistoihin kuten Zenodoon liittyvä asia on versionhallinta. On aina mahdollista, että data-aineistoa päivitetään tulevaisuudessa tai siinä huomataan virhe. Ladattua aineistoa ei voi poistaa, mutta siitä voi ladata uuden version. Data-aineiston DOI pysyy samana, mutta versioilla on myös omat tunnisteensa.   

Datan saatavuus

Datan tallennuksen yhteydessä tulee määritellä tietoaineiston saatavuus. Yleensä data-arkistoissa määritellään ensin datan saatavuus ja sen jälkeen datan uudelleenkäyttöoikeudet lisensoimalla. Jotkut data-arkistot mahdollistavat useampia saatavuusvaihtoehtoja kuin toiset.

Avoin pääsy dataan Tarkoittaa, että kuka tahansa saa käyttää, uudelleenkäyttää ja jakaa dataa vapaasti
Data saatavilla embargon jälkeen Tarkoittaa, että data on saatavilla tietyn päivämäärän jälkeen
Rajoitettu pääsy/Luvanvarainen käyttö Tarkoittaa, että dataa jaetaan tietyin ehdon. Uudelleenkäyttäjän on pyydettävä käyttöoikeuta, ja tietoaineiston tuottaja sallii tai evää pääsyn.
Suljettu pääsy dataan Tarkoittaa, että käyttäjillä ei ole pääsyä dataan.

Tietojen lisensointi uudelleenkäyttöä varten

Käyttäjien oikeudet hyödyntää tallennettua data määritellään yleisesti lisensseillä. Lisenssi suojaa tekijänoikeuksia. Se varmistaa, että käyttäjä mainitsee tekijän dataan viitatessaan. Lisenssi vähentää myös epävarmuutta viestimällä käyttäjille, miten dataa voi uudelleenkäyttää, yhdistellä, louhia tai jakaa uudelleen. Creative Commons -lisenssit ovat vakiolisenssejä, joita käytetään tutkimusaineistojen käyttöehtojen määrittämiseen. CC BY 4.0 -lisenssi on pakollinen julkisesti rahoitetuille ja julkisesti datarepositoriossa saatavilla oleville dataseteille. Lisenssi täyttää ne vaatimukset, joita asettavat avoimen datan direktiivi ja kansallisesti sovellettava Laki julkisin varoin tuotettujen tutkimusaineistojen uudelleenkäytöstä.

Tutkimusdatan hallinnan ohjeet

Näillä linkeillä voit selata tutkimusdatan hallinnan ohjeita.

Kuva oppimiskeskuksen sisätiloista. Kuvassa etualalla opiskelija istuu lukemassa kirjaa vihreässä tuolissa. Taka-alalla kaksi opiskelijaa keskustelee pyöreän pöydän ääressä., photo Tuomas Uusheimo

Tutkimusdatan jakaminen ja julkaiseminen

Yleiskatsaus ja ohjeita tutkimusdatan julkaisemisen ja jakamisen palveluihin.

Palvelut
People talking with each other

Tutkimusdatan hallinta ja avoin tiede

Tutkimusdatan hyvä hallinta on osa laadukasta tutkimusprosessia ja luo kilpailuetua. Sivu kokoaa Aalto-yliopiston tuen, palvelut ja ohjeet tutkimusdatan hallintaan.

Palvelut
Tätä palvelua tarjoaa:

Tutkimus- ja innovaatiopalvelut

Löysitkö tästä tarvitsemasi tiedon? Jos et, ota meihin yhteyttä.
 • Julkaistu:
 • Päivitetty: