Yhteentoimivuusmalli ja semanttista yhteentoimivuutta tukeva välineistö osana yhteistä tietoarkkitehtuuria Suvi Remes Korkeakoulujen valtakunnallisen tietovarannon ja OKM:n tiedonkeruiden ohjausryhmä 21.08.2015 Johdanto • Tietomallinnuksen perimmäisenä tarkoituksena on mahdollistaa palveluiden.

Download Report

Transcript Yhteentoimivuusmalli ja semanttista yhteentoimivuutta tukeva välineistö osana yhteistä tietoarkkitehtuuria Suvi Remes Korkeakoulujen valtakunnallisen tietovarannon ja OKM:n tiedonkeruiden ohjausryhmä 21.08.2015 Johdanto • Tietomallinnuksen perimmäisenä tarkoituksena on mahdollistaa palveluiden.

Yhteentoimivuusmalli ja semanttista yhteentoimivuutta tukeva välineistö osana yhteistä tietoarkkitehtuuria

Suvi Remes Korkeakoulujen valtakunnallisen tietovarannon ja OKM:n tiedonkeruiden ohjausryhmä 21.08.2015

Johdanto

• Tietomallinnuksen perimmäisenä tarkoituksena on mahdollistaa palveluiden ja palveluita tukevien tietojärjestelmien toteutus.

o tukee sekä sisällönasiantuntijoiden että tietomallintajien ja sovelluskehittäjien työtä • Korkeakoulujen tietomallityöllä pyritään varmistamaan tietojärjestelmien ja tietojen semanttinen ja tekninen yhteentoimivuus.

o o Semanttinen yhteentoimivuus mahdollistaa tiedon vastaanottamisen ja käsittelyn tavalla, jossa tietojen merkitys säilyy. Sen keskeisenä tavoitteena on mahdollistaa sekä ihmis- että koneluettava tietojenvaihto.

Teknisellä yhteentoimivuudella tarkoitetaan sopimista avoimista rajapinnoista sekä standardeista tietoformaateista ja protokollista.

• Tavoitteena lähestymistapa, mallinnusmenetelmä, joka mahdollistaa eri toimijoiden tietomääritysten kuvaamisen yhtenäisellä tavalla (=yhteinen tietoarkkitehtuuri).

• Tavoitteena on tätä lähestymistapaa ja tiedon merkityksen säilymistä tukeva työkaluratkaisu.

2

Nykytila

esim. kirjastotoimi korkeakoulujen tietojärjestelmät tietovarasto rajapinnat rajapinnat rajapinnat ?

rajapinnat Korkeakoulujen tietomalli (tietomalli.csc.fi) Opintopolku VIRTA

Tavoitetila

esim. kirjastotoimi korkeakoulujen tietojärjestelmät tietovarasto rajapinnat rajapinnat Sanastoihin perustuvat rajapinnat rajapinnat rajapinnat Opintopolku VIRTA

Mikä Yhteentoimivuusmalli?

= tietokomponenttikirjasto, kokoelma luokkia ja ominaisuuksia

luokat ja ominaisuudet ilmentävät tietoja, joita korkeakoulut toiminnassaan käsittelevät

• • • • • • • Hyödyt toteutusriippumaton, harmonisoiva tietomallikerros, jonka avulla voidaan kehittää yhteentoimivia tietomalleja eri käyttötarkoituksiin (viestinvälitys – rajapinnat; tietokantarakenteet – tietovarastot; sovelluskehitys – tietojärjestelmät) liittyy implementaatiokohtainen dokumentaatio (sovellusprofiili) eri käyttötarpeisiin muodostetut tietomallit perustuvat yhteisiin käsitteisiin, ts. sanastoihin kenttiä ja assosiaatiosuhteita voidaan lisätä ”sotkematta” tietovarastomallia tai rajapintakuvauksia versionhallinta/tiedon jäljitettävyys on hallittavissa linkitys kansainvälisiin standardeihin (formaalisti ja semanttisesti) tukee tietomallinnusta eri mallinnustasoilla (käsitteellinen, looginen, fyysinen) 5

Sanasto Standardit Yhteentoimivuusmalli • Yhteiset määritykset eri käyttökohteisiin • Tietoelementit määritellään sanastossa ja linkitetään standardeihin • Luokkia ja ominaisuuksia tarkennetaan käyttötarpeen mukaan

Opintojakso Opintojakso

… Koodi Nimi Laajuus

Määr ..

Pakolli ...

X X X X X X Tietomallit Rajapintakuvaukset

Tuloksena linkitetty tietomalli, jossa tiedot yksilöidään pysyvillä (URI)-tunnisteilla.

Tietomallinnus – tietokomponentit

• tietokomponentit osana kansallista viitearkkitehtuurityötä o o KOOTuki-ryhmä 10.11.2014 kokouksessaan valtuuttanut Synergiaryhmän opiskelun ja opetuksen tukipalveluiden ja hallinnon viitearkkitehtuurin toteuttajaksi Synergiaryhmä 4.12.2014 linjannut, että käsitteistö (sanasto) ja päätiedoista tarvitaan yhteinen sopimus >> työ alkaa/jatkuu keväällä 2015 • luonnos: https://docs.google.com/spreadsheets/d/1co7hl1LPsFX6R3hfXoZVKKIDpnRcSNH1 uGnIKHJ2wIE/edit?pli=1#gid=2102204937 o TUHA-viitearkkitehtuuriryhmä >> työ jatkuu 8

Mikä tietomallityössä on muuttunut?

YHTEENTOIMIVUUSMALLI (tietomallina)

• fokus: sanastojen, tietomallien ja tiedonsiirtomääritysten välissä suhteissa • • rooli: jatkossa ohjaa mallinnustyötä, toimii eri käyttötarkoituksiin tarvittavien sovellusprofiilien muodostamisen pohjana >> tietokomponentteja voidaan hyödyntää yhä uudelleen työkalut: RDF-pohjainen malli mallinnusvälineet ontologiaeditori (sanastot) tietokomponenttien ylläpito- ja julkaisualusta (demo toteutettu, jatkokehityksessä) skeemojen tekninen tuottaminen versionhallinnan ja seurattavuuden parantuminen >> käsitteiden ja tietokomponenttien pysyväisluonne

XDW-MALLI

• fokus: tietokannoissa tietovarastototeutuksessa; raportoinnissa • rooli: jatkossa yksi Yhteentoimivuusmallin sovellusprofiili, käyttötarkoituksella tietovaraston tietokantamalli (EDW-malli) • työkalut: mallipohjainen toteutus, UML mallinnusvälineet (Visual Paradigm) Makea-ohjelmisto (tietokannan luontilauseet) julkaisualusta >> koettu vaikeaselkoiseksi versionhallinta työlästä, joustamattomuus; muutokset vaikuttavat suoraan tietokannan luontilauseisiin >> vain yhdenlainen toteutus mahdollinen >> Tietomallinnuksen sitominen laajempaan arkkitehtuuriseen kehykseen.

9

Yhteentoimivuusmalli – Mallintamisen menetelmä

• • • • • Yhteiskäyttöisissä palveluissa ja prosesseissa käytettävät käsitteet on määriteltävä asianmukaisesti ja koneluettavassa muodossa Yhteisten tietomäärityksien tulee perustua sanastossa määriteltäviin käsitteisiin Tietomääritykset ovat uudelleenkäytettäviä tietokomponentteja (luokka, ominaisuus ja assosiaatio) Tietojärjestelmien väliset rajapinnat kuvataan sovellusprofiilissa uudelleenkäyttämällä tietomäärityksiä Sovellusprofiili muodostuu toimialueella kuvatuista tietomäärityksistä, eli luokista, ominaisuuksista ja niille asetetuista rajoituksista Palvelut Prosessit Sanasto Henkilö Pätevyys Organisaatio Vaatimus Yhteentoimivuus malli Henkilö luokka Pätevyys ominaisuus Organisaatio luokka Vaatimus luokka Lupa Lupa luokka Loogiset tietomallit Fyysiset tietomallit Todennetun osaamisen tietomalli Sovellus profiili rajapinta Virasto tietomalli

Sanaston hallinta Eri toimialojen erikoissanastot määritellään ja julkaistaan SKOS muodossa kansallisessa finto - ontologiapalvelussa. m Sanasto 1 määrittelee Käsite hallinnoi 1 perustuu Yhteentoimivuusmallin hallinta Toimialakohtaiset käsitteet määritellään uudelleenkäytettäviksi komponenteiksi linkitetyssä yhteentoimivuusmallissa.

Toimija m Yhteentoimivuusmalli 1 määrittelee m 1 Komponentti 1 m Luokitus vastaavuus Käsitteet Ontologioiden uudelleenkäyttö arvoalue hallinnoi käyttää Sovellusprofiilien hallinta Yhteentoimivuusmallin käyttö dokumentoidaan sovellusprofiileissa, joissa tarkennetaan luokkien ja ominaisuuksien käyttötarkoitus. 1 m Sovellus profiili 1 määritelee m Käyttökohde Luokka Ominaisuus Ominaisuus 1 rajoittaa m Luokka linkitys Luokka Ominaisuus Kansainväliset standardit Tietomallien uudelleenkäyttö

Sanastot – sanastotyö

standardoidut menetelmät – systemaattinen lopputulos

Lähde: Sanastokeskus TSK 12

Mikä on sanasto?

• sanasto • • aineisto, jonka tarkoituksena on antaa tietoa käsitteistä o tietoa sanoista/termeistä, joilla käsitteisiin viitataan o tietoa käsitteiden välisistä suhteista käsitejärjestelmä, joka kantaa merkitystä • terminologinen sanasto • • tietoa termeistä ja käsitteiden sisällöstä ja käsitteiden välisistä suhteista käsiteanalyysi menetelmänä • ontologia • • tietoa käsitteiden välisistä suhteista koneymmärretävässä muodossa olemisen käsitteet; mitä tyyppiä olevia asioita on olemassa ja minkälaisia suhteita niiden välillä on • tesaurus • tietoa käsitteiden välisistä suhteista asiasanastona Lähde: Sanastokeskus TSK; Madsen & Thomsen 2014

Mihin sanastoja tarvitaan?

Ihmisten väliseen viestintään

• viestinnän ja viestien selkeyttäminen >> sisältö säilyttää merkityksen • kommunikaation helpottaminen >> tulkinta vähenee • kielenkäytön yhtenäistäminen >> sovitut ”sanat” eli termit >> sovitut käännösvastineet

Koneiden väliseen viestintään

• tiedonsiirtojen tukeminen >> teknisten skeemojen sisällön kuvaus • tietokantojen kuvaus >> mitä tietoja tietokannassa on

>> yhteentoimivuuden toteuttamiseen >> sama sanasto, eri muodoissaan, molemmissa tehtävissä

Opetus- ja koulutussanasto – OKSA

• muodoltaan ns. terminologinen sanasto, kaikki koulutusasteet edustettuina • linkki sanastoluonnokseen, https://confluence.csc.fi/pages/viewpage.action?pageId=8688189 • • • uutta pysyvät tunnisteet • helpottavat viittaamista sanastoon jo luonnosvaiheessa • oppija = mpOKSAID221 OKM koordinoi korkeakoulujen sanasto- ja kielityöryhmä • Glossary Group, https://confluence.csc.fi/display/OPI/Glossary+Group

Tutkimuksen sanastotyö

Tutkimuksen tuen ja hallinnon verkosto

• • • TUHA-tietomallityöryhmä, https://confluence.csc.fi/pages/viewpage.action?pageId=42796075 tutkimushallinnon alueen käsitteiden määrittely ja mallinnus sanastoluonnos: https://docs.google.com/spreadsheets/d/1BTujoGcj7PbOquwRaDGBb _HK6IMSfPUalnqGS9QWAo/edit?pli=1#gid=998589396 •

Avoin tiede ja tutkimus -hanke

Tieteen termipankki,

www.tieteentermipankki.fi

• • • tieteen näkökulma, tavoitteena eri tutkimusalojen pysyvä termipankki semanttinen MediaWiki -alusta, joukkoistaminen työmuotona koordinoi Suomen Akatemian ja Helsingin yliopiston rahoittama infrastruktuurihanke Tieteen kansallinen termipankki, jonka keskeinen yhteistyökumppani on Tieteellisten Seurain Valtuuskunta, TSV 16

Sanastotyön merkitys

• • • • sanastot semanttisen yhteentoimivuuden peruspilari • tavoite: merkitykset haetaan yhteisistä sanastoista, jotka julkaistu (koneluettavasti) kaikkien saataville • käsiteanalyysi-menetelmän laajamittainen hyödyntäminen • käsitepiirteiden kuvaamisen kautta käsitteen tunnistaminen • • käsitteen nimeäminen ”käsite-olion” tunnistamisen jälkeen termien yhdenmukaistaminen niissä kohdissa missä mahdollista ja järkevää, synonyymit mahdollisia resurssien kohdentaminen - koordinointi • TSK: ”keskimääräinen työrytmi noin 100 käsitettä /vuosi” • Tieteen termipankki: ”noin viiden käsitteen tietojen perusteellinen täydentäminen vastaa yhden opintopisteen työtä” vaatii yhteistyötä – toimialakohtaisten käsitteiden ja vaatimusten ymmärrys ei ”asu” missään yksittäisessä organisaatiossa tarvitaan työkaluja • • sanastojen tuottaminen, sanastoeditorit keskitetyt sanastopalvelut julkaisuun (FINTO/Kansalliskirjasto, TEPA/Sanastokeskus)             

JHS-sanastotyö/YSR/KMR JHS-suositusten käsitteistön harmonisointi Kelan käsitteistö Paikkatiedon sanasto- ja ontologiatyö PRH:n sanastotyö Opetustoimen sanastotyö THL:n sanastotyö Palkkahallinnon sanastotyö Viestintäviraston mobiilisanasto Kiinteistöliiketoiminnan sanasto, kiinteistö- ja rakennusalan käsitteistön harmonisointi Luonnonvarakeskuksen ontologiatyö Julkisen hallinnon ontologiatyö (JUHO) Tiedon hallinnan sanasto/terminologia (hankinta valmistelussa)

17

Yhteentoimivuuden välineistö -projekti

• tavoitteena tietojärjestelmäratkaisu avointen tietomääritysten tuottamiseen, hallinnointiin ja julkaisuun o tietokomponenttien ylläpito- ja julkaisuympäristö o sanastoihin perustuvien tietokomponenttien määrittelymenetelmä o o o tietokomponentteja hyödyntävä sovellusprofiilien määrittelymenetelmä sovellusprofiilien ylläpito- ja julkaisuympäristö ja työkalu teknisten skeemojen tuottamiseen avoimen lähdekoodin toteutus • • • potentiaaliset käyttäjät: o tietomallintajat ja sovelluskehittäjät o sisällönasiantuntijat o tietoaineistojen kuvailijat välillisesti kuvailueditorien kautta onnistunut käyttöönotto: o tavoitepilotin toimialueen tietomääritykset mallinnettu tietojärjestelmällä o tavoitepilotti käyttää tietojärjestelmällä tuotettua tietomallia tiedonsiirrossa aikataulu: o suunnitteluvaihe 01/2015 – 03/2015 o toteutusvaihe JulkICTLabissa 04/2015 – 12/2015 18

”Sanasto editori” tuottaa sanastoja Finto – Sanasto- ja ontologiapalvelu (Kansalliskirjasto) JHS julkisen hallinnon yhteinen sanasto, OKSA – Opetus- ja koulusanasto TEPA-termipankki (TSK Sanastokeskus) käyttää sanastoja

Toteutuksen esittely

”Koodisto -palvelu” käyttää koodistoja

JulkICTLab pilotti

(tietojärjestelmäkehitys) Tietokomponentit tuottaa visualisointeja Sovellusprofiilit tuottaa skeemoja XSD JSON Schema RDF tiedot määritellään ja ilmoitetaan standardimuodossa

Projektikumppanit

• • • • CSC – Tieteen tietotekniikan keskus Oy o projektikoordinaatio o määrittely ja tekninen toteutus Aalto-yliopisto o käyttötapaukset; määrittely Verohallinto / Katre-hanke o käyttötapaukset; määrittely VM / JulkICTLab -kehitysympäristö kehitys avoimesti Githubissa: • https://github.com/CSC-IT-Center-for-Science/iow-ui • https://github.com/CSC-IT-Center-for-Science/iow-api • laaja sidosryhmäverkosto (korkeakoulut, ATT-hanke, julkisen hallinnon toimijat) • • ”PoC-lähestyminen ja testaus”, jalkautus osissa Metatietopalvelun ekosysteemi – kansalliset tavoitteet Projektisivusto: https://confluence.csc.fi/pages/vie wpage.action?pageId=51893708

Ohjaus

• • • • OKM CSC-sopimuksen kautta Korkeakoulujen tietohallinto- ja ICT-ohjausryhmä o ministeriön korkeakouluille ostama arkkitehtuurityö o kokoavan arkkitehtuurikuvauksen (Yhteentoimivuusmalli) omistajuus sisällöllistä määrittelytyötä ohjaavat o KOOTuki (opiskelu ja opetus) o TUHA-verkosto (tutkimus) o o ATT-hanketoimijat (tutkimus) OKM, sanastotyö CSC:llä koordinointi Metatietopalveluissa • kansallisella tasolla laajemmin o VM, Tietoarkkitehtuuriryhmä o VM, Metatietopalvelut

Kysymyksiä & keskustelu

Kiitos!

projektipäällikkö [email protected]

tekninen asiantuntija [email protected]

PS. 3.9.2015 Semanttisen yhteentoimivuuden kehitystyön esittely- ja keskustelutilaisuus Tieteiden talolla !

Yhteentoimivuusmallin viitekehys

Sanastot • käsitteet • määritelmät • luokitukset Tietokomponentit • luokat • ominaisuudet • assosiaatiot Sovellusprofiilit • käyttötarkoitus • rajoitukset • laajennokset

Yhteinen tietoarkkitehtuuri

käsitteiden ja tietorakenteiden mallintamiseen • • • Yhteentoimivat sanastot Yhteentoimivat tietorakenteet Yhdenmukainen dokumentaatio