Opinnäytteiden metadata Metadata-päivä, Helsingin yliopisto, 10.11.2005 Jyrki Ilva, Helsingin yliopiston kirjasto [email protected] Taustaa: opinnäytteet verkossa Yliopistojen opinnäytteiden julkaiseminen verkossa alkoi Suomessa jo 90-luvun puolella – esim.

Download Report

Transcript Opinnäytteiden metadata Metadata-päivä, Helsingin yliopisto, 10.11.2005 Jyrki Ilva, Helsingin yliopiston kirjasto [email protected] Taustaa: opinnäytteet verkossa Yliopistojen opinnäytteiden julkaiseminen verkossa alkoi Suomessa jo 90-luvun puolella – esim.

Opinnäytteiden metadata
Metadata-päivä, Helsingin yliopisto, 10.11.2005
Jyrki Ilva, Helsingin yliopiston kirjasto
[email protected]
Taustaa: opinnäytteet verkossa
Yliopistojen opinnäytteiden julkaiseminen verkossa
alkoi Suomessa jo 90-luvun puolella
– esim. Helsingin yliopiston E-thesis-palvelu avattiin syksyllä 1999 (muita
pioneereja Jyväskylä, Oulu, Tampere ja TKK)
– viime aikoina myös AMK:t tulleet mukaan
– julkaisut avoimesti verkossa, yleensä pdf-tiedostoina
– yliopistot julkaisevat etenkin väitöskirjoja, monet myös muita
opinnäytteitä ja sarjajulkaisuja
– viime aikoina suunnitelmia myös yliopistojen omista avoimista
julkaisuarkistoista (institutional repository), jotka sisältäisivät
henkilökunnan kaikki julkaisut (vrt. tähänastiset julkaisurekisterit, joissa
vain julkaisujen viitetiedot)
Nykytilanteen ongelmia
Hajanainen joukko julkaisupalveluita, kullakin
yliopistolla omansa
- ongelma tiedonhakijalle ja myös julkaisujen näkyvyydelle
- erilaisia käyttöliittymiä ja erilaisia teknisiä ratkaisuja
- julkaisut usein luetteloitu tietokantoihin, joiden tarjoama näkyvyys
ulospäin on rajallinen
Miten opinnäytteiden kansallista ja kansainvälistä
löydettävyyttä voisi parantaa?
- oma kansallinen hakupalvelu opinnäytteille?
- metatietojen haravoiminen laajempiin järjestelmiin?
Yksi mahdollisuus: OAI-PMH
OAI-protokolla (OAI-PMH = Open Archives Initiative – Protocol for
Metadata Harvesting)
- mahdollistaa sekä yhteisen kansallisen hakupalvelun rakentamisen että
metatietojen toimittamisen kansainvälisiin järjestelmiin
- OAI-protokollaa hyödyntäviä järjestelmiä rakenteilla muissakin maissa,
eli yhteistyömahdollisuuksia riittää
- järkevien hakupalveluiden tuottaminen edellyttää haravoitavien
palveluiden metadatalta riittävää semanttista yhteismitallisuutta
Monet suomalaiset julkaisupalvelut jo OAI-yhteensopivia
- VTT, TKK sekä Oulun, Joensuun ja Tampereen yliopistot
- vain kansallinen hakupalvelu puuttuu...
Metadataprojektin lähtökohdat (2004)
HYK tarvitsi metadataformaattia E-thesis-palvelussa
julkaistaville Helsingin yliopiston opinnäytteille
- Doria-järjestelmän käyttöönotto – E-thesiksen julkaisujen metatiedot
tallennetaan uuteen järjestelmään
- Helsingin yliopiston väitöstietohanke – tavoitteena saada
väitöskirjojen tiedot ja tiivistelmät kattavasti verkkoon; kaikki tiedot
kerätään samalla kertaa yhdellä lomakkeella
Tarvetta myös kansalliselle formaatille
- useat korkeakoulut samojen kysymysten äärellä: yksi yhteinen
ratkaisu säästäisi kaikkien työtä
- dSpace-ryhmässä (FinnOA:n julkaisuarkistotyöryhmän edeltäjä)
sovittiin, että HYK tekee esityksen opinnäytteiden kansalliseksi
metadataformaatiksi
Metadataformaatin kehitystyö (2005)
Formaatin kehittäminen edennyt nopeasti
- ensimmäinen versio lähetettiin kommentoitavaksi yliopistojen
julkaisuvastaaville tammikuussa 2005
- kehitetty edelleen kommenttien pohjalta
- pyritty pitämään suhteellisen kevyenä ja yksinkertaisena, eli ihan kaikkia
toiveita ei ole voitu toteuttaa
Metadataformaatin tuorein versio saatavilla osoitteessa
http://ethesis.helsinki.fi/metadata/
- muutamat yliopistot ja ammattikorkeakoulut soveltavat jo nyt
- Helsingin yliopistossa käyttöön uuden väitöstietojärjestelmän myötä
vuodenvaihteessa 2005/2006
- osa muista yliopistoista käyttää edelleen omia formaattejaan: tärkeintä
riittävä yhteismitallisuus
Opinnäytteiden metadataformaatin kuvaus
”Tämä on Dublin Core –standardiin perustuva ehdotus
kansalliseksi metadataformaatiksi Suomen korkeakoulujen
ja ammattikorkeakoulujen elektronisille opinnäytteille.
Dublin Core on kansainvälinen elektronisten resurssien
kuvailuun kehitetty formaatti. Ehdotuksen tarkoituksena
on yhtenäistää elektronisten opinnäytteiden kuvailua ja
tällä tavoin tehostaa niiden hakua sekä kuvailutietojen
kotimaista ja kansainvälistä vaihtoa esimerkiksi osana
OAI-pohjaisia palveluja”
Opinnäytteiden metadataformaatti
Metadataformaatti on Dublin Core -pohjainen
- yhteensä 23 eri kenttää, joista kuusi on pakollisia ja 17 vapaaehtoisia
- formaatissa määriteltyä kenttävalikoimaa voi tarvittaessa laajentaa
paikallisten tarpeiden mukaan
- metadataformaatti ei ole sidoksissa mihinkään tiettyyn tekniseen
järjestelmään (esim. Doria/ENCompass)
Miksi oma formaatti?
- jo olemassa olevat kansainväliset formaatit eivät valitettavasti vastaa
suoraan suomalaisia käytäntöjä
- tavoitteena kuitenkin mahdollisimman suuri yhteensopivuus
Opinnäytteiden metadataformaatti
Opinnäytteiden tiedot sopivat Dublin Coren kenttiin
varsin hyvin
- suurimmat ongelmat liittyivät tiedekunta- ja laitostietojen ilmoittamiseen
ja opinnäytteisiin liittyviin henkilöihin (vastaväittäjät jne.)
- mahdollista käyttää erilaisia asiasanastoja ja tieteenalaluokituksia
Tarkoitettu ensisijaisesti elektronisille opinnäytteille
- sopii kuitenkin tarvittaessa myös pelkästään paperimuodossa
ilmestyneiden opinnäytteiden kuvailuun
Soveltuu kaikille opinnäytetyypeille
-
väitöskirjat, lisensiaatintyöt, gradut, diplomityöt, amk-opinnäytetyöt jne.
Metadataformaatin pakolliset kentät
- Tekijän nimi
- Opinnäytteen nimeke
- Opinnäytteen taso
- Opinnäytteen kieli
- Opinnäytteen hyväksymisaika
- Opinnäytteen tekopaikka
Metadataformaatin vapaaehtoiset kentät
- Opinnäytteen vaihtoehtoinen
nimeke
- Opinnäytteen laji
- Opinnäytteen julkistamisaika
- Opinnäytteen
identifiointitunnus
- Opinnäytteen rinnakkaisen
ilmiasun tiedot
- Opinnäytteen rinnakkaisen
ilmiasun identifiointitunnus
- Sarjan nimi
- Sarjan ISSN-tunnus
- Opinnäytteen tiivistelmä
- Opinnäytteen asiasanat
- Opinnäytteen tieteenala
- Opinnäytteeseen liittyvät osat
- Opinnäytteeseen liittyvät
oikeudet
- Opinnäytteeseen liittyvät
henkilöt
- Opinnäytteen koko
- Elektronisen opinnäytteen
tiedostomuoto
- Elektronisen opinnäytteen
URL-osoite
Metadataformaatin soveltaminen
Helsingin yliopistossa
Metadata osa laajempaa järjestelmää
– kuka tallentaa tiedot ja miten?
– perinteinen malli: luetteloija tallentaa julkaisun metatiedot
– tekijöiden suorittama tallennus myös varteenotettava vaihtoehto,
jos se vain suunnitellaan ja ohjeistetaan hyvin
– aikataulu- ja resurssikysymys
– E-thesis-palvelussa jo ennestään positiivisia kokemuksia
tekijöiden tallentamista tiedoista
– väitöstietohankkeessa väittelijöiden tekemää tallennusta varten
kehitetty uusi verkkolomake (lomakkeen testiversio löytyy
osoitteesta http://ethesis.helsinki.fi/forms/diss.html)
Tietojen keruu lomakkeella
Samalla lomakkeella kerätään sekä E-thesis-palvelun
että yliopiston väitöstiedotuksen tarvitsemat tiedot
- väitöstietolomake pyrkii helpottamaan tietojen täyttämistä
- mm. laitostiedot voi valita valikosta. mikä vähentää virheitä
- asiasanat edelleen ongelma: eri aloilla erilaisia ja erikielisiä
asiasanastoja
- väittelijän syöttämät tiedot tarkistetaan ja korjataan ennen kuin ne
tulostetaan lopullisiin formaatteihin
- tulostaa mm. metadataformaatin mukaisen tiedoston, joka voidaan
siirtää suoraan Doriaan
Yhteenvetoa kokemuksista
Väitöstietohankkeen edetessä tullut paljon uusia ideoita
erilaisista tavoista hyödyntää kerättyä metadataa
- ”kunhan saamme tämän ensin valmiiksi niin sitten teemme myös tätä ja
tätä...”
- tietysti myös resurssikysymys: mitä kaikkea sidosorganisaatiomme
oikeasti haluavat meidän tekevän?
Haastavimmat ongelmat eivät ole niinkään teknisiä,
vaan liittyvät pikemminkin yliopiston käytäntöihin ja
niiden monimutkaisuutteen
– tekniset ongelmat ratkaistavissa, mutta toimintamallien muuttaminen ja käyttäjien
tuloksellinen ohjeistaminen haastavampaa
Lisätietoja
- Jyrki Ilva: ”Väitöstiedot ja tiivistelmät E-thesikseen”
(Verkkari 6/2005) - saatavilla osoitteessa
http://www.helsinki.fi/kirjastot/verkkari/2005/06/ilva.html
- Jani Saijos: “Kansallinen metadataformaatti
elektronisille opinnäytteille” (Tietolinja 2/2005,
ilmestyy marraskuun kuluessa)