WordNet : la mère (le père) de tous les réseaux de mots ? Séminaire LIR 29 Mai 2001 Benoît Habert & Laura Monceaux Séminaire LIR -

Download Report

Transcript WordNet : la mère (le père) de tous les réseaux de mots ? Séminaire LIR 29 Mai 2001 Benoît Habert & Laura Monceaux Séminaire LIR -

WordNet :
la mère (le père) de tous les
réseaux de mots ?
Séminaire LIR
29 Mai 2001
Benoît Habert & Laura Monceaux
Séminaire LIR - Mai 2001
1
Plan de l’exposé

Organisation de WordNet
– Réseaux de mots, lexiques …
– Relations sémantiques …
– Distribution de WordNet

Exemples d’applications de WordNet
– Acquisition de relations sémantiques
– Désambiguïsation sémantique
– Expansion de requêtes …

Liens entre WordNet et EuroWordNet
Séminaire LIR - Mai 2001
2
Organisation de WordNet

Qu’est ce que WordNet ?

Organisation des noms

Organisation des verbes

Distribution de WordNet
Séminaire LIR - Mai 2001
3
WordNet ? 1/4
Inspirée par des théories psycholinguistiques
et informatiques sur la mémoire lexicale
humaine (Miller 85)
 Fournir une recherche conceptuelle dans un
dictionnaire
 Donc organiser l’information lexicale en terme
de signification de mots
 Approximativement 95600 formes de mots et
70100 synsets

Séminaire LIR - Mai 2001
4
WordNet ? 2/4

Formes des mots : désignation de
l’expression physique

Sens des mots : désignation du concept
lexical que la forme peut exprimer
Représentation sous
forme de matrice lexicale
Séminaire LIR - Mai 2001
5
WordNet ? 3/4
Word
Meaning
F1
Word Forms
F2
F3
…
M1
E1,1
E1,2
M2
Fn
E2,2
M3
E3,3
…
…
Mn
En,n
Séminaire LIR - Mai 2001
6
WordNet ? 4/4
Organisée par des relations sémantiques
(pointeurs vers des synsets) ou relations
lexicales :
Relations entre les significations des mots
- Hyperonymie / Hyponymie (tree /
plant)
- Méronymie
Relations entre les formes des mots
- Synonymie
- Antonymie (rich/poor)
Séminaire LIR - Mai 2001
7
Organisation des noms 1/5
Une hiérarchie sémantique ( ~ 12
niveaux)
 57000 formes de mots pour 48800
significations de mots
 Pas un seul réseau : distinction des
noms par 25 composants sémantiques

Séminaire LIR - Mai 2001
8
Organisation des noms 2/5
Act, action, activity
Food
Quantity, amount
Animal, fauna …
Group, collection
Relation
Artifact…
Location, place
Shape
Attribute, property
Motive
State, Condition
Body, corpus …
Natural object
Substance
Cognition, knowledge
…
Natural
phenomenon
Person, human
being
Communication
Plant, flora
Time
Event, happening
Possession
Feeling, emotion
Process
Séminaire LIR - Mai 2001
9
Organisation des noms 3/5

Trois sortes de caractéristiques :
– Les attributs
Adjectifs qui modifient le nom
– Les parties
Relation de méronymie
– Les fonctions
Information fonctionnelle

Relation d’opposition : antonymie
Séminaire LIR - Mai 2001
10
Organisation des noms 4/5
Hypernym (inv. Hyponym):
X is a hypernym of Y
if Y is a (kind of) X
plant / tree
walk / march
Meronym (inv. Holonym):
X is a meronym of Y if
X is a part of Y
or X is a substance of Y
or X is a member of Y
Antonym :
an opposition lexical relation
Séminaire LIR - Mai 2001
mouth / face
tree / forest
rich / poor
happy / unhappy
11
Organisation des noms 5/5
Group
Person
Family
Brother
Hyponyme
Natural Object
Relative
Sister
Body
Leg
Substance
Organic Substance
Arm
Méronyme
Séminaire LIR - Mai 2001
Flesh
Bone
Antonyme
12
Organisation des verbes 1/5

La plus importante catégorie lexicale et
syntaxique du langage et la plus difficile à
étudier

21000 verbes et approximativement 8400
synsets

Répartition des verbes dans 15 fichiers
distincts qui correspondent chacun à un
domaine sémantique
Séminaire LIR - Mai 2001
13
Organisation des verbes 2/5
Stative verbs
Emotion or psych verbs
Verbs of change
Motion verbs
Cognition verbs
Perception verbs
Verbs of communication Verbs of possession
Competition verbs
Verbs of social interaction
Consumption verbs
Weather verbs
Contact verbs
Creation verbs
Verbs if bodily functions and care
Séminaire LIR - Mai 2001
14
Organisation des verbes 3/5
Relations sémantiques : interaction avec
implication stricte (entailment)
"Someone V1" implique "Someone V2"
A verb X entails Y if X cannot be done
unless Y is, or has been, done
Exemple :
"He is snoring" implique "He is sleeping"
Séminaire LIR - Mai 2001
15
Organisation des verbes 4/5
Entailment
Temporal inclusion
+ Troponymy
- Troponymy
(co-extensiveness)
(proper inclusion)
( limp – walk )
( snore – sleep )
No temporal inclusion
Troponym :
X is a troponym of Y
if to X is to Y in some
manner
Séminaire LIR - Mai 2001
16
Organisation des verbes 5/5
Entailment
Temporal inclusion
Cause :
A verb X causes Y
If X denotes the
causation of the state or
activity referred to by Y
No temporal inclusion
Cause
( feed – eat )
Séminaire LIR - Mai 2001
Backward
presupposition
( fail – try )
17
Organisation des adjectifs

Adjectifs descriptifs : big, possible, …

Adjectifs relationnels : variantes
stylistiques des modifieurs de noms

19500 adjectifs organisés dans 1000
synsets
Séminaire LIR - Mai 2001
18
Bibliographie

Livres :
– WordNet An Electronic Lexical Database –
Christiane Fellbaum 1998
– EuroWordNet : a multilingual database with lexical
semantic networks – Piek Vossen 1998
Résumés : Page Benoît
 Adresses http :

– http://www.ac-toulouse.fr/wordnet/
– http://www.cis.upenn.edu/~jospehr/wn-biblio.html
Séminaire LIR - Mai 2001
19