Terminologie und Thesauri

Download Report

Transcript Terminologie und Thesauri

Terminologie und Thesauri
Karen Koos WS 2009/2010 in Anlehnung an Ulrike Spree,
teilweise übernommen aus Spree: Terminologische Kontrolle
durch Thesauri, HAW Hamburg WS2008/2009
... was ist eigentlich ein Pferd?
Sender
Begriff
[Konzept]
... erzählt mal wieder
was vom Pferd...
Mähre
Stute
Ich glaub', mich
tritt ein Pferd
Rappe
Pferd
Gaul
Klepper
Zossen
Kaltblut
Roß
Araber
Equus przewalskii
Fohlen
Pony
Schimmel
Hengst
Bezeichnung [Benennung, Term]
Ross
Empfänger
Semiotisches Dreieck
Semiotisches Dreieck -> Beispiel
Terminologie -> Probleme bei
Benennungen
Synonymie: ein Begriff - mehr als eine Benennung/Bezeichnung
Zwei Wörter sind synonym, wenn sie die gleiche (ähnliche) Bedeutung haben.
Orange – Apfelsine, Samstag – Sonnabend, Abtreibung – Schwangerschaftsabbruch
Homonymie (Teekesselchen): eine Benennung - mehr als ein
(etymologisch nicht verwandter) Begriff
Bank (Geldinstitut, Sitzgelegenheit), Tau (Seil, morgendlicher Niederschlag), Schicht
(Gestein, Arbeit, Sozialstruktur)
Polysemie (Teekesselchen): eine Bezeichnung - mehr als ein
(etymologisch verwandter) Begriff
Pferd = Tier, Pferd = Turngerät
Terminologische Kontrolle
Formale Ansetzung
Polysemkontrolle,
Homonymkontrolle
Synonymkontrolle
Formale Ansetzung
 Numerus: Bevorzugt Singular
Ausnahmen: Wörter, die nur im Plural vorkommen wie Eltern; Kosten
Wortfolge: Bevorzugt natürliche Wortfolge in Adjektiv-Substantiv-Verbindungen
Internationale Beziehungen statt Beziehungen, Internationale
 Wortart: Bevorzugt Substantive statt Verben
Therapie statt Therapieren
 Wortart: Keine isolierten Adjektive
Internationale Beziehungen statt International
 Abkürzungen: Bevorzugt Langform statt Kurzform
Nacht-und-Nebel-Häftling statt NN-Häftling
 Möglichst wenig kombinierte Bezeichnungen
Polysemkontrolle / Homonymkontrolle

Bezeichnungen mit identischer Schreibweise aber
unterschiedlichen Bedeutungen werden
disambiguiert durch qualifizierenden Zusatz in
runden Klammern (Homonymenzusatz, Qualifikator)
Kiefer (Knochen)
Kiefer (Nadelholz)
Morphologie (Biologie)
Morphologie (Sprachwissenschaft)
Synonymkontrolle


In Terminologiedatenbanken wird ein
Deskriptor festgelegt und die Verwendung
aller Synonyme verboten bzw. eingeschränkt
In Wissensdatenbanken Verweis von
Synonym auf Deskriptor (z.B. Buchregister,
Thesaurus)
Relationen
Äquivalenzrelationen
Hierarchierelationen
Assoziationsrelation
Relationsformen
Weihnachten=Christfest
Äquivalenzrelation
B wird für den Zweck des
Thesaurus in der Bedeutung A
gleichgesetzt
A=B
A
Weihnachten is A
Kirchenfest
Weihnachten /
Familienfeier
B
A
nach: ANSI/NISO Z39.19-1993
B
B
Hierarchierelation
B ist ein A oder ist ein Teil von A
Assoziationsrelation
B und A überschneiden sich
in einem Bedeutungselement
Äquivalenzrelation (für Synonyme)
= Beziehung zwischen Bezeichnung(en) und Begriff
Zusammenfassung von bedeutungsgleichen oder ähnlichen
Bezeichnungen [Benennungen,Terme] zu
einem Begriff [Konzept] in der Äquivalenzklasse
Verweisungsrelation, analog "siehe-Verweisung" in
Buchregistern



Pferd
UF Gaul
 Relationenkürzel:
deu BS – BF
[Benutze Synonym - Benutzt für]

eng USE – UF
[Use - Use(d) for]
UF Ross
Ross
USE Pferd
Äquivalenzrelation -> Typen
äquivalenter Terme
Zur Äquivalenzklasse werden Bezeichnungen
zusammengefasst, die bedeutungsgleich oder
bedeutungsähnlich sind. Das können sein:
 Lexikalische Varianten [Schreibweisen]
 Synonyme
 Quasisynonyme
Von diesen Bezeichnungen wird eine Variante zur
Vorzugsbenennung (Deskriptor) gewählt, die den
Begriff repräsentiert.

Äquivalenzrelation -> Lexikalische und
syntaktische Varianten

Kurzformen (Abkürzungen, Akronyme)
WEK - Windenergieanlage

Schreibweisen (graphische Varianten)
Roß – Ross, Windenergie-Anlage - Windenergieanlage

Normierte Bezeichungen
EG – Ägypten

Invertierte Formen
Beziehungen, Internationale
Äquivalenzrelation -> Synonyme








Regionale und dialektale Varianten
Brötchen - Schrippe - Semmel
Chronologische Varianten (veraltete Ausdrücke)
Antlitz - Gesicht
Gruppensprachliche Varianten
Geld - Kies - Zaster
Fachsprachliche Bezeichnungen
Keuchhusten - Pertussis
Stilistische Varianten, Sprachebene
Visage - Fresse - Gesicht - Antlitz
Generische Bezeichnung und Handelsnamen
Papier-Taschentuch - Tempo
Varianten unterschiedlicher linguistischer Herkunft
Konspiration - Verschwörung
Fremdsprachige Bezeichnungen
Crystal night - Kristallnacht
Äquivalenzrelation -> Quasisynonyme
Da es reine Synonyme bei genauer Betrachtung in
Fachsprachen und auch in der natürlichen Sprache
kaum gibt, müssen die meisten sog. Synonyme als
Quasisynonyme angesehen werden.
Begriffe, die in einem Thesaurus zu spezifisch sind,
können als Quasisynonyme auf den allgemeineren
Begriff verweisen (upward posting oder generic
posting).
Gestein
UF Basalt
Granit
Schiefer
Hierarchierelation


= Beziehung zwischen Begriffen (Deskriptoren)
Beziehung zwischen Begriffen höherer und niedrigerer
Abstraktionsebene (Ober- und Unterklassen)
Relationenkürzel:
deu OB - UB
[Oberbegriff - Unterbegriff]
eng BT - NT
[Broader term - Narrower term]
Tier
NT Katze
NT Pferd
Hierarchierelation -> Formen der
Hierarchierelation

Abstraktionsrelation (generische Relation,
Subsumtionsrelation, Subordinationsrelation,
Generalisierungs-Spezialisierung-Relation)


Instanzrelation
Bestandsrelation (partitive Relation, Pertinenz,
Meronymie)
Hierarchierelation ->
Abstraktionsrelation

= Logische Relation zwischen Oberbegriffen und Unterbegriffen

Der Unterbegriff hat alle Merkmale des Oberbegriffs und hat mindestens
ein spezifizierendes Merkmal darüber hinaus
Der Oberbegriff besitzt weniger Begriffsmerkmale als der Unterbegriff
(geringere Intension)
Der Oberbegriff hat einen größeren Begriffsumfang als der Unterbegriff
(gößere Extension)
Is-A-Hierarchie (logische Hierarchie)



Pferd Is-A Säugetier -> Pferd NTG Säugetier
Relationenkürzel:
deu OA – UA
[Oberbegriff - Unterbegriff (Abstraktionsrelation)]
eng BTG – NTG
[Broader term - Narrower term (generic)]
Hierarchierelation ->
Abstraktionsrelation -> Achtung!
•Jagen
•Jäger
Keine korrekte
Abstraktionsrelation, denn:
•Jagdmesser
Unterbegriff und Oberbegriff gehören stets der gleichen
Begriffskategorie an. Vorgänge können mithin nur mit
Vorgängen, Eigenschaften nur mit Eigenschaften,
Gegenstände nur mit Gegenständen in einer
Abstraktionsrelation stehen.
[DIN 1463 Teil 1, Nov 1987, 5.3.1]
Hierarchierelation -> Bestandrelation

Bestandsrelation [partitive Relation, TeilGanzes-Relation, Part-Whole-Relationship]

Beziehung zwischen Begriffen eines
größeren Ganzen und eines Teils davon
Relationenkürzel:
deu SP - TP
Körperorgansysteme und
Organe
Geographische
Systeme
eng BTP - NTP
[Broader term Narrower term
(partitive)]
Nervensystem
Zentralnervensystem
Gehirn
Rückenmark
Deutschland
Schleswig-Holstein
Lübeck
Hierarchierelation -> Polyhierarchie
= Beziehung zwischen Begriffen (Deskritporen)
 Ein Unterbegriff hat mehr als einen Oberbegriff
Prinzipiell gibt es in einem Thesaurus keine
Beschränkung für die Anzahl der für einen Begriff
angebbaren über- oder untergeordneten Begriffe.
Man spricht von [...] Polyhierarchie, wenn für einen
Begriff mehr als ein direkt übergeordneter Begriff
angegeben wird.
[DIN 1463 Teil 1, Nov 1987, 5.3.3]
Assoziationsrelation
Eine Assoziationsrelation ist eine zwischen Begriffen bzw. ihren
Bezeichnungen als wichtig erscheinende Relation, die weder eindeutig
hierarchischer Natur ist, noch als äquivalent angesehen werden kann.
[DIN 1463 Teil 1, Nov 1987, 5.4]
 Disziplin und Objekte bzw. Personen der Disziplin
Zoologie - Zoologe; Neurologie - Nervensystem
 Ereignisse und Akteure
Jagd - Jäger
 Objekte, Ereignisse und Gegenmittel
Pflanzen - Herbizide
 Aktionen und ihre Produkte
Weben - Kleidung; Buch - Buchdruck
Ereignisse und ihre Ursachen
Infektion - Krankheitserreger
 Weibliche und männliche Form
Lehrerin - Lehrer
Relationen -> Abkürzungen
nach: DIN
Deutsch
1463, Teil 2, 3.1
und ANSI/NISO SB = Spitzenbegriff
OB = Oberbegriff
Z39.18-1993,
p. xii
UB = Unterbegriff
Englisch
TT = Top Term
BT = Broader term
NT = Narrower term
VB = Verwandter Begriff
RT = Related term
OA = Oberbegriff (Abstraktionsrelation)
BTG = Broader term (generic)
UA = Unterbegriff (Abstraktionsrelation)
NTG = Narrower term (generic)
---
BTI = Broader term (instance)
---
NTI = Narrower term (instance)
SP = Verbandsbegriff (Bestandsrelation)
BTP = Broader term (partitive)
TP = Teilbegriff (Bestandsrelation)
NTP = Narrower term (partitive)
BS = Benutze Synonym
USE = Use
BF = Benutzt für Synonym
UF = Use(d) for
BK = Benutze Kombination
USE = Use
KB = Benutzt in Kombination
UFC = Used for combination
H = Erläuterung (Hinweis)
SN = Scope note
D = Definition
D = Definition
Beispiel für Relationen im Thesaurus
Begriffszerlegung,
Präkombination, Postkoordination

Als Präkombination bezeichnet man in der Indexierung eine
Methode, bei der die Deskriptoren schon bei ihrer Vergabe durch
Qualifikatoren oder Links verknüpft werden. Die Auswahl der
Thesaurusbegriffe erfolgt also während der inhaltlichen
Erschließungsphase durch eine koordinierte Vergabe der
Deskriptoren.

Als Postkoordination bezeichnet man in der Indexierung eine
Methode, bei der die Deskriptoren möglichst so vergeben werden,
dass der Rechercheur die richtigen Dokumente mit Hilfe der
Booleschen Operatoren NICHT, ODER, UND möglichst gezielt
wieder finden kann. Die Auswahl der Thesaurusbegriffe erfolgt also
erst beim Information Retrieval, d.h. nach der Erschließungsphase.

Quelle: Wikipedia, http://de.wikipedia.org/, Stand: 16.10.2009
Präkombination oder
Postkoordination?
1.
Sind alle begrifflichen Komponenten nötig? (Blumengießkanne)
2.
Bleibt nach Zerlegung die Spezifität erhalten?
(Medienwissenschaft)
3.
Lässt sich die Ausgangsbenennung rekonstruieren?
(Schlangengift)
4.
Gebräuchlichkeit der Begriffskombination? (DVD-Player)
5.
Handelt es sich um eine feststehende Wendung /
Fachausdruck? (Baumschule; Autobahn)
Achtung: Es werden immer nur Begriffe und nicht Wörter
zerlegt
Also: Handschuh  Hand + Bekleidung (nicht: Hand + Schuh)
Begriffszerlegung
Autobahn
–Auto
+ Bahn?
Blumengießkanne
–Blume
+ Gießkanne?
Schlangengift
–Schlange
+ Gift?
Plattenspieler
–Platte
+ Spieler?
–Schallplatte + Abspielgerät?
Kindergarten
–Kind
+ Garten?
Thesaurus: Zusammenfassung




ist eine Dokumentationssprache
Kontrolliertes Vokabular, dessen Begriffe durch
Relationen miteinander verbunden sind und ein
semantisches Netz bilden
Unterstützt Indexierung und Retrieval
Wird angewandt zur inhaltlichen Erschließung und in
Terminologiedatenbanken für eine einheitliche
Unternehmenssprache
Fachtermini, die Sie verstehen müssen







Deskriptor
Begriffsrelation
übergeordneter Begriff - untergeordneter
Begriff / hierarchische Relation
Verwandter Begriff / Assoziationsrelation
Synonymkontrolle / Äquivalenzrelation
Polysemkontrolle / Homonym
Zerlegungskontrolle / Begriffskombination
Ziele eines Thesaurus:



Sämtliche Informationen innerhalb eines
Unternehmens sollen für jeden schnell
zugänglich und leicht auffindbar sein
unnötige Doppelarbeit soll vermieden
werden, denn oft arbeiten zwei Mitarbeiter an
der gleichen Problemlösung und wissen es
nicht
Kommunikation soll verbessert werden