Palvelut

Tietoaineistojen kuvailu data-arkistoissa

Tässä oppaassa kerrotaan millainen data-arkistoon (repository) tallennettavan datan kuvailun tulisi olla. Informatiivinen kuvailu auttaa löytämään tietoaineiston ja ymmärtämään mistä tietoaineistossa on kyse. Se mahdollistaa myös datan uudelleenkäytön ja asianmukaisen viittaamisen. Hyvän kuvailun edellytyksenä on se, että tietoja kerätään koko projektin ajan.
Computer screen with several windows open, showing cylindrical shapes on topmost windoe and three-dimensional grid structure underneath it. Photo by Mikko Raskinen.

Tyypilliset metadataelementit

Data-arkistot hyödyntävät erilaisia kuvailevia metadataelementtejä, joilla voi olla erilaisia nimityksiä. Tämä ohje kattaa yleisesti käytössä olevat metadataelementit, joita ovat tietoaineiston nimi, tietoaineiston tuottajan nimi/nimet, tiivistelmä, avainsanat, tietoaineiston tuottamisajankohta, julkaisija ja pysyvä tunniste. Ohjeessa käsitellään myös saatavuus- ja uudelleenkäyttöehtoja, jotka tulee yleensä määritellä tietoaineiston tallennuksen yhteydessä.

Nimi Tietoaineiston/aineistojen nimi
Datan tuottaja Henkilö(t) tai organisaatio(t), joihin datan omistajuus liitetään
Tiivistelmä Lyhyt tiivistelmä siitä, mistä tietoaineistossa on kyse
Avainsanat Tietoaineiston sisältöä kuvailevat sanat
Tietoaineiston tuottamisajankohta Ajankohta, jolloin tietoaineisto on luotu, tai muu soveltuva ajankohta
Julkaisija Tietoaineiston julkaisija (esim. data-arkisto, jossa aineisto on avattu)
Pysyvä tunniste Data-arkiston antama tunniste, esim. DOI, Handle tai URN.
Saatavuus- ja käyttöehdot Määrittää ehdot tietoaineiston saatavuudelle ja uudelleenkäytölle (esim. lisensiointi tai lupaan perustuva uudelleenkäyttö

 

Data-arkistoihin ja arkistointiin liittyvä metadata

Data-arkistot vaativat tietoaineistoilta tiettyjä kenttiä, aivan kuten lehdet vaativat esimerkiksi tekijä-, affiliaatio- ja julkaisupäivämäärätietoja. Näitä tietoja kutsutaan metadataksi. Tutkijan tulisi kiinnittää erityistä huomiota sopivan arkiston löytämiseen ja seurata arkiston datan tallennukseen liittyviä ohjeistuksia, joihin kuuluu asiaankuuluvien metatietojen tallennus.

Data-arkistojen ja niiden metadatan laatuun liittyviä arviointeja löytyy osiosta Avoimet data-arkistot ja Registry of Research Data Repositories -sivustolta. Kannattaa suosia arkistoja, jotka tarjoavat pysyviä tunnisteita ja datatyyppiin soveltuvia standardeja.

Nimi

Nimi on tärkein elementti, jonka avulla data löydetään ja joka auttaa käyttäjää ratkaisemaan vastaako tietoaineisto hänen tarpeitaan. Hyvä nimi on yksilöllinen ja kuvaa jaettavaa dataa. Vaikka tietoaineisto liittyisi artikkeliin, kannattaa harkita erillisen nimen antamista datalle. Nimen on hyvä olla tiivis ja sisältää vastaukset kysymyksiin mitä, missä, milloin, kuka ja skaala. Informatiivinen nimi kattaa aiheen, ajallisen kattavuuden sekä paikkaan ja maantieteelliseen sijaintiin liittyvät tiedot.

Tiivistelmä

Ole tarkka ja kvantifioi mahdollisuuksien mukaan antaaksesi riittävästi tietoa datasta. Alla oleva tarkistuslista käsittää keskeiset kysymykset, joihin tiivistelmän tulee vastata.

Avainsanat

Avainsanat eivät yleensä ole pakollisia. Niiden käyttö on kuitenkin erittäin suositeltavaa. Pohdi avainsanoja kohdeyleisöjen näkökulmasta. Etsi alakohtaisia avainsanoja esimerkiksi erikoissanastosta, jos sellainen on saatavilla. Käytä myös vapaasti valittavia avainsanoja ja fraaseja.    

Pysyvä tunniste

Pysyvä tunniste on data-arkiston tietoaineistolle antama yksilöllinen tunniste. Esimerkiksi DOI (Digital Object Identifier) ja URN (Uniform Resource Name) ovat yleisesti käytettyjä tunnisteita. Pysyvä tunniste antaa verkkoresurssille, esimerkiksi tietoaineistolle, pysyvän "nimen" ja linkin. Vaikka tietoaineiston sijainti verkossa muuttuisi, tunnus pysyy samana ja linkki tietoihin säilyy uudesta verkkosijainnista huolimatta.

On tärkeää valita data-arkisto, joka tarjoaa pysyvän tunnisteen datan tallennuksen yhteydessä. Tunnisteen avulla data/tietoaineistot voidaan erotella toisistaan, mikä mahdollistaa tietoaineistoihin kohdistuvan asianmukaisen viittaamisen ja helpottaa datan uudelleenkäyttöä.

Versionhallinta

Yksi tärkeä ainakin yleisiin data-arkistoihin kuten Zenodoon liittyvä asia on versionhallinta, joka on avoimen tieteen keskeinen piirre.

On aina mahdollista, että tietoaineistoa päivitetään tulevaisuudessa tai siinä huomataan virhe. Tietoaineistoa ei voi poistaa, mutta siitä voi ladata uuden version. Tietoaineiston DOI pysyy samana, mutta versioilla on myös omat tunnisteensa.   

Esimerkki tietoaineistosta, jolla on eri versioita.

Datan saatavuus

Datan tallennuksen yhteydessä tulee määritellä tietoaineiston saatavuus. Yleensä data-arkistoissa määritellään ensin datan saatavuus ja sen jälkeen datan uudelleenkäyttöoikeudet lisensoimalla. Jotkut data-arkistot mahdollistavat useampia saatavuusvaihtoehtoja kuin toiset.

Tietojen lisensointi uudelleenkäyttöä varten

Käyttäjien oikeudet hyödyntää tallennettua data määritellään yleisesti lisensseillä. Lisenssi suojaa tekijänoikeuksia. Se varmistaa, että käyttäjä mainitsee tekijän dataan viitatessaan. Lisenssi vähentää myös epävarmuutta viestimällä käyttäjille, miten dataa voi uudelleenkäyttää, yhdistellä, louhia tai jakaa uudelleen.

Aalto-yliopisto suosittelee Creative Commons -lisenssiä CC BY 4.0 tietoaineistoille yleensä ja CC BY NC 4.0 -lisenssiä oikeuksien varaamiseen kaupalliseen uudelleenkäyttöön.

Tutkimusdatan hallinnan ohjeet

Näillä linkeillä voit selata tutkimusdatan hallinnan ohjeita.

Avoimet data-arkistot (repositoryt)

Aalto-yliopistossa käytettävät datan avoimet repositoryt

Monitulkintaiset ongelmat vaativat uudenlaista johtamista

Tutkimusdatan julkaiseminen

Käytetyn tutkimusdatan julkaiseminen lisää viittauksia lehtiartikkeleihisi ja muihin julkaisuihin. Myös dataviittaukset ovat viittauksia.

The image is from Aalto University Material bank.

Tutkimusdatan jakaminen ja julkaiseminen

Yleiskatsaus ja ohjeita tutkimusdatan julkaisemisen ja jakamisen palveluihin.

Kuva oppimiskeskuksen sisätiloista. Kuvassa etualalla opiskelija istuu lukemassa kirjaa vihreässä tuolissa. Taka-alalla kaksi opiskelijaa keskustelee pyöreän pöydän ääressä., photo Tuomas Uusheimo

Tutkimusdatan hallinta

Tutkimusdatan hyvä hallinta on osa laadukasta tutkimusprosessia ja luo kilpailuetua.

People talking with each other
Tätä palvelua tarjoaa:

Tutkimus- ja innovaatiopalvelut

Löysitkö tästä tarvitsemasi tiedon? Jos et, ota meihin yhteyttä.
  • Julkaistu:
  • Päivitetty:
Jaa
URL kopioitu