Hva+er+mapping+og+hva+er+poenget

Download Report

Transcript Hva+er+mapping+og+hva+er+poenget

Hva er mapping? Og hva er poenget?
Seminar om mapping til Dewey
11.06.2012
Hva er mapping?
kildevokabular
målvokabular
begrep
begrep(er)
arbeidarklasse
305.562
voldtektsdop
362.88
3
615.31
Hva er poenget med mapping?
• Flere innganger til et emne for den som indekserer
• Flere innganger til et emne for sluttbruker
Hvorfor mapping til Dewey?
•
•
•
•
Internasjonalt
Språkuavhengig
Termer på flere språk kan mappes til Dewey
Mapping kan gjøres mellom Dewey og andre
klassifikasjonssystemer
• Mapping kan gjøres mellom Dewey og emneord
• Mapping kan gjøres mellom Dewey og
autoritetsregistre for navn
Mapping til Dewey
-for klassifikator
• Hjelp til klassifikasjon
-flere termer å søke på
• Hjelp til å sette emneord
- flere termer å søke på
• Letter gjenbruk og utveksling av data
• Mapping mellom Dewey og emneord på flere språk
Mapping til Dewey
-for sluttbruker
• Utvidelse av et søk:
• Muliggjør søk med eget vokabular i samlinger med
ulike vokabularer
• Ved en underliggende mapping, kan man søke med
emneord også i samlinger som bare har Dewey.
• Ved en underliggende mapping mellom vokabularer på
flere språk, kan man søke med eget språk i poster på
andre språk
Noen valg som bør tas før man
begynner å mappe…
1. Hvorfor mapper jeg*?
For å konvertere eller supplere et målvokabular med termer fra
mitt eget vokabular
«Særnorske» begrep i utenlandske vokabularer
Feks: særbo, kransekaker, dugnad
Nynorske / samiske termer i «bokmålske» vokabularer
--> Begrep og termer som ikke finnes i målvokabularet!
Når vil jeg konvertere/supplere?
Til hjelp i indekseringsprosessen?
Til hjelp i søkeprosessen?
Begge?
*jeg, som eier eller drifter et vokabular
Hjelp i indekseringsprosessen
Hvordan skal
jeg klassifisere
denne
artikkelen om
voldtektsdop?
Hjelp i søkeprosessen
•
Underliggende mapping mellom
voldektsdop og Dewey klasse
362.883 og Dewey klasse 615.31
•
Søk på «voldtektsdop» i
bibliotekkatalogen gir treff på
«voldtektsdop» + dokumenter
klassifisert med 362.883 eller 615.31
•
Men: både 362.883 (voldtekt) og
615.31 (syntetiske legemidler) er mye
videre begreper enn voldtektsdop!
•
Dersom koblingen er automatisk, vil
det føre til mye støy i trefflisten!
•
Hvordan utnytte mappingen på mest
effektiv måte??
Hvordan finner
jeg alt
biblioteket har
om
voldektsdop?
Legg inn
relasjonstyper!
Dermed kan vi lage
systemer der
brukeren selv velge
om han/hun vil utvide
søket når mappingen
ikke er ekvivalent
eller snevrere!
2. Hvilke relasjonstyper skal jeg bruke?
Kun til hjelp i indeksering?
A. “Tilknyttet-klasse”
• Ett begrep er knyttet til et eller flere begrep fra
målvokabularet
Feks)
voldektsdop «tilknyttet-klasse» 362.883
voldektsdop «tilknyttet-klasse» 615.31
• Ingen semantiske relasjoner definert!
• Enkleste måte å mappe
• Innebygd i MARC 21 Authorities
(når målvokabularet er et klassifikasjonssystem)
2. Hvilke relasjonstyper skal jeg bruke?
(forts.)
Til indeksering og/eller søking?
B. “Tilknyttet-klasse” med overensstemmelsesgrad
• Ett begrep er knyttet til et eller flere begrep fra
målvokabularet, og det er gitt en
overensstemmelsesgrad som definerer likheten
mellom begrepene
Feks) Overensstemmelsesgrad 1-4 (4 = helt ekvivalent)
voldektsdop «tilknyttet-klasse» 362.883 B1
voldektsdop «tilknyttet-klasse» 615.31 B1
• Krever at man selv definerer gradene – vanskelig!
• Kan bruke lokale løsninger i MARC 21 Authority
• Men ingen standard format for å registrere gradene
2. Hvilke relasjonstyper skal jeg bruke?
(forts.)
Til indeksering og/eller søking?
Og kanskje til og med for å publisere som Linked data? 
C. ISO-standarden for mapping (ISO/DIS 25964-2)
• Ett begrep er knyttet til et eller flere begrep fra
målvokabularet, og den semantiske relasjonen mellom
begrepene er definert
•
•
•
Ekvivalens relasjoner (=EQ, ~EQ)
Hierarkiske relasjoner (BM, NM)
Assosiative relasjoner (RM)
Feks)
voldektsdop «RM» 362.883
voldektsdop «BM» 615.31
•
•
Kan bruke lokale løsninger i MARC 21 Authority
Og lett konvertere til SKOS
3. Hvordan skal jeg gå frem?
Automatisk?
Intellektuelt
Automatisk + intellektuelt
Hva innebærer det intellektuelle arbeidet?
• God kjennskap til kildevokabularet og
målvokabularet
• Analysere, analysere, analysere
(parse, parse, parse)
Eksempel: HUMORD + Dewey
Kunst
BM eller ~EQ
Arkitektur
Bildekunst
Dans
Film
Folkekunst
Improvisasjon
Kalligrafi
Kunstforståelse
Kunsthistorie
Kunsthåndverk
Kunstnerisk virksomhet
Kunstpsykologi
Kunstsosiologi
Levende bilder
Musikk
Stil (Uttrykksmåte)
Teater (Scenekunst)
700 (Kunst og underholdning)
Her: Konseptkunst, arkitektur, billedkunst,
kunsthåndverk, offentlig kunstpolitikk
710 Arealplanlegging og
landskapsarkitektur
720 Arkitektur
730 Skulptur og lignende kunstformer
740 Grafiske kunstarter og kunsthåndverk
750 Malerkunst og malerier
760 Trykkekunst og grafiske blad
770 Fotografering, datakunst,
kinematografi, videografi
780 Musikk
790 Fritidsaktiviteter, sport, utøvende
kunst
Eksempel: HUMORD + Dewey, forts.
MARC 21 Authority
040
$aUiO
$bnor
$fHUMORD
08300
$a700
$223/nor
$9~EQ
eller $9BM
150
$aKunst
SKOS
<skos:Concept
rdf:about="http://humord.uio.no/#kunst">
<skos:prefLabel>kunst</skos:prefLabel>
<skos:closeMatch
rdf:resource="http://dewey.info/class/700/20
13/about.no"/>
eller:
<skos:broadMatch
rdf:resource="http://dewey.info/class/700/20
13/about.no"/>
</skos:Concept>
BISAC
?
?
MeSH
Norsk
webDewey
LCSH
RAMEAU
WebDewey
Amerikansk
webDewey
Tysk
webDewey
SWD
SAO
Svensk
webDewey
Geo
Names
http://www.nb.no/webdewey
Klassifikasjonssystemer som er mappet
til Dewey
• Mellom UDC og Dewey på øverste nivåer (Tsjekkia)
• RVK-Deweykonkordanse (Tyskland).
• SAB –Dewey-konkordanse (Sverige)
• Hensikt: Gjøre nytte av eksisterende Deweyklassifikasjon og/eller skritt på veien til å gå over til
Dewey
• Problem: Ulike nivåer, ulikt innhold i klassene
Noen verbale vokabularer som er
mappet til Dewey
•
•
•
•
•
LCSH (Library of Congress Subject Headings)
Bisac Subject Heading List
Mesh (Medical Subject Headings)
GND (Gemeinsame Normdatei) (tidl. SWD)
Svenska ämnesord
Mapping til Melvil (tysk webDewey)
CrissCross-prosjektet
• Mapping fra GND til Dewey
• Mål: Flere verbale innganger til Dewey både i
indekserings- og søkeprosessen
• Metode: 4 grader av overensstemmelse mellom
emneord og Deweynummer
Prosjekter som er i gang
•
•
•
•
•
Fast og Dewey
VIAF og Dewey
MSC og Dewey
Geonames og Dewey
AGROVOC geografiske områder til 9xx-numre
Hvordan kan vi dra nytte av andre lands
mappingarbeid?
• Planer om mulighet for abonnement på andre lands
vokabularer i WebDewey (ikke mulig i dag)
• Dewey gir allikevel mulighet til å nyttiggjøre oss
mappingene mellom de andre vokabularene (LCSH
/GWD/Rameau/Svenska ämnesord), men ikke
automatisk
• Mangler samordnet nasjonalt emneordssystem
• Språkforskjeller
Hva har vi i Norge?
• Utstrakt bruk av Dewey
• Vokabularer på bestemte fagområder:
• Humord, Realfagstermene, Tekord, Mesh,
Riksantikvarens nøkkel, Musikktesaurus, Juridisk
klassifikasjon, UDK, Medisinsk klassifikasjon osv.
• Vokabularer knyttet til Dewey:
• Lokale emneregistre
• Biblioteksentralens emneord
Veien videre
•
•
•
•
•
NB jobber med å mappe DDK 5 til DDC 23
Undersøke potensialet i de enkelte vokabularene?
Hvordan bruke Bibbi og emneregistrene?
Hvordan kan en evt. mapping organiseres?
Samarbeidsprosjekter mellom de som «eier»
vokabularene og Nasjonalbiblioteket?