Suomalaisilla hyvinvointi- ja terveysalan viranomaisilla ja tutkimuslaitoksilla on hallussaan kansainvälisesti verrattuna mittavat ja arvokkaat tietovarannot väestön palveluiden käytöstä ja terveydentilasta. Lainsäädäntö antaa mahdollisuuden käyttää tietoja tilastointiin, tutkimukseen ja biopankkitoimintaan.

Arvokkaiden tietoaineistojen käyttöä tulisi kuitenkin edelleen helpottaa ja tehostaa. Tästä alan toimijat ovat yhtä mieltä. Väestön terveyden ja hyvinvoinnin edistäminen ja sote-palveluiden tietoon perustuva johtaminen edellyttävät, että kerätyt tietovarannot ovat optimaalisessa käytössä.

Mutta mistä aloittaa käytön esteiden purkaminen?

Ensiksi tietoa tiedosta

Viime aikoina on ymmärretty, että jos aineistot halutaan saada laajasti käyttöön, aineistojen kuvailutietojen parantaminen ja julkaisu ovat tärkeimpiä käytettävyyttä helpottavia tekijöitä. Onhan aivan ensimmäiseksi välttämätöntä tietää, mitä dataa on edes olemassa, ja minkä laatuista se on!

Tarvitaan siis metadataa eli tietoa olemassa olevista tietovarannoista.

Metadata on ensiksikin yleistä aineiston sisältöä, kokoa, keruuajankohtaa ja yhteyshenkilöitä kuvaavaa tietoa. Toiseksi sen tulisi olla myös yksityiskohtaista aineiston pienimpien osatekijöiden eli muuttujien sisältöä ja laatua kuvaavaa tietoa.

Metadatan julkaisu tekee aineiston tunnetuksi, helpottaa sen käytön suunnittelua ja aineiston analyysiä. Ideaalitilanteessa ajan tasalla olevat kuvailutiedot ovat apuväline aineistojen kerääjille, ensisijaisille käyttäjille, toisiokäyttäjille, luovuttajille ja mahdollisille käyttölupaviranomaisille.

Metadatan julkaisu avoimena datana voisi tuottaa käyttömahdollisuuksia, joita emme edes kykene ennakoimaan.

Yhteiskuntatieteellinen tietoarkisto on näyttänyt muille tietoaineistojen haltijoille esimerkkiä perustamalla AILA-aineistokatalogin. Katalogista löytyy Tietoarkiston aineistojen kuvauksia helpossa ja informatiivisessa muodossa.

Myös THL Biopankkiin siirrettyjä aineistoja on mahdollista tarkastella muuttujatasolla KITE-saatavuuskatalogissa.

Monista muista, toistaiseksi kuvaamattomista hyvinvointi- ja terveysalan aineistoista ulkopuolisen on kuitenkin edelleen vaikea saada kokonaiskäsitystä. Vaikka aineiston olemassaolon voisikin googlaamalla ja muutamalla puhelinsoitolla selvittää, systemaattista muuttujatasoista laatu- ja historiatietoa on niukasti saatavilla. Myös yhtenäiset käytännöt tietojen kuvaamisesta puuttuvat.

Kuka tekee kuvailutyön?

Standardoidut aineistokuvaukset eivät kuitenkaan synny itsestään, vaan ne vaativat aineistot tuntevien asiantuntijoiden työtä. Jos aineistojen kuvailutyötä toisiokäytön tarkoituksiin tehdään vain aineiston kerääjien ja tutkijoiden toimesta, jää heille liian vähän aikaa varsinaiseen työhön eli aineiston analyysiin.

Kuka siis aloittaisi hyvinvointi- ja terveysalan keskeisten tietoaineistojen kuvailutyön ja millä resursseilla? Vastaus on niukkojen resurssien aikana kaikkea muuta kuin itsestäänselvyys ja siksi (data)poliittinen kysymys.

Mitä on datapolitiikka?

Terveyden ja hyvinvoinnin laitos (THL) on keskittänyt tämän vuoden alusta tietoaineistoja koskevaa asiantuntemusta Tietovarantopalvelut -yksikköön. Yksikön vetäjänä toimii kehittämispäällikkö, tutkija Risto Kaikkonen.

Yksikön tehtävänä on auttaa talon johtoa THL:n datapolitiikan laadinnassa yhdessä laitoksen laajan asiantuntijajoukon kanssa. Monet muutkin tietointensiiviset tutkimuslaitokset ja yliopistot ovat parhaillaan laatimassa itselleen datapolitiikkaa.

Datapolitiikan laatiminen antaa mahdollisuuden pohtia, miten aineistojen saatavuutta ja käytettävyyttä voidaan käytännössä edistää niin, että tietovarannot tukevat väestön terveyden ja hyvinvoinnin sekä sote-palveluiden seurannan tarpeita.

Datapolitiikka sisältää varmasti vetäviä iskulauseita. Sen lisäksi se tuottaa aitoa tekemistä – tekoja, jotka edistävät aineistojen käyttöä ja saatavuutta esimerkiksi seuraavien viiden vuoden aikana.

Eräs THL:n datapolitiikassa käsiteltävä teema onkin, miten aineistojen kuvailutyötä voitaisiin edistää.

Datapolitiikka suuntaa toimintaa

Datapolitiikka koskee kaikkia THL:n aineistojen parissa työskenteleviä. Siksi THL järjestää kaikille THL:n työntekijöille, sidosryhmille ja asiakkaille avoimen datapolitiikan valmistelutyöpajan 14.9.2015. Työpajan anti vaikuttaa THL:n datapolitiikan sisältöön ja toimeenpanoon.

Talon johtoryhmä hyväksyy datapolitiikan loppuvuodesta ja se julkaistaan alkuvuonna 2016. Sen jälkeen datapolitiikkaa lähdetään jalkauttamaan THL:n toimintaan konkreettisten projektien kautta. Tervetuloa mukaan vaikuttamaan!

Lue lisää:

THL:n Datapolitiikka Workshop II 14.9.2015. Ohjelma

Tiedonhallinta sosiaali- ja terveysalalla

Antti Tuomi-Nikula, Avoin data on nykypäivää ja tulevaisuutta Suomessakin. THL blogi 17.2.2015

Mika Gissler, EU:n yhdenmukaistuva tietosuoja voi haitata terveystutkimusta. THL:n blogi 28.8.2015

Palveluportaali Aila. Yhteiskuntatieteelliseen tietoarkisto. Tampereen yliopisto ym.

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *