WordNet : la mère (le père) de tous les réseaux de mots ? Séminaire LIR 29 Mai 2001 Benoît Habert & Laura Monceaux Séminaire LIR -
Download ReportTranscript WordNet : la mère (le père) de tous les réseaux de mots ? Séminaire LIR 29 Mai 2001 Benoît Habert & Laura Monceaux Séminaire LIR -
WordNet : la mère (le père) de tous les réseaux de mots ? Séminaire LIR 29 Mai 2001 Benoît Habert & Laura Monceaux Séminaire LIR - Mai 2001 1 Plan de l’exposé Organisation de WordNet – Réseaux de mots, lexiques … – Relations sémantiques … – Distribution de WordNet Exemples d’applications de WordNet – Acquisition de relations sémantiques – Désambiguïsation sémantique – Expansion de requêtes … Liens entre WordNet et EuroWordNet Séminaire LIR - Mai 2001 2 Organisation de WordNet Qu’est ce que WordNet ? Organisation des noms Organisation des verbes Distribution de WordNet Séminaire LIR - Mai 2001 3 WordNet ? 1/4 Inspirée par des théories psycholinguistiques et informatiques sur la mémoire lexicale humaine (Miller 85) Fournir une recherche conceptuelle dans un dictionnaire Donc organiser l’information lexicale en terme de signification de mots Approximativement 95600 formes de mots et 70100 synsets Séminaire LIR - Mai 2001 4 WordNet ? 2/4 Formes des mots : désignation de l’expression physique Sens des mots : désignation du concept lexical que la forme peut exprimer Représentation sous forme de matrice lexicale Séminaire LIR - Mai 2001 5 WordNet ? 3/4 Word Meaning F1 Word Forms F2 F3 … M1 E1,1 E1,2 M2 Fn E2,2 M3 E3,3 … … Mn En,n Séminaire LIR - Mai 2001 6 WordNet ? 4/4 Organisée par des relations sémantiques (pointeurs vers des synsets) ou relations lexicales : Relations entre les significations des mots - Hyperonymie / Hyponymie (tree / plant) - Méronymie Relations entre les formes des mots - Synonymie - Antonymie (rich/poor) Séminaire LIR - Mai 2001 7 Organisation des noms 1/5 Une hiérarchie sémantique ( ~ 12 niveaux) 57000 formes de mots pour 48800 significations de mots Pas un seul réseau : distinction des noms par 25 composants sémantiques Séminaire LIR - Mai 2001 8 Organisation des noms 2/5 Act, action, activity Food Quantity, amount Animal, fauna … Group, collection Relation Artifact… Location, place Shape Attribute, property Motive State, Condition Body, corpus … Natural object Substance Cognition, knowledge … Natural phenomenon Person, human being Communication Plant, flora Time Event, happening Possession Feeling, emotion Process Séminaire LIR - Mai 2001 9 Organisation des noms 3/5 Trois sortes de caractéristiques : – Les attributs Adjectifs qui modifient le nom – Les parties Relation de méronymie – Les fonctions Information fonctionnelle Relation d’opposition : antonymie Séminaire LIR - Mai 2001 10 Organisation des noms 4/5 Hypernym (inv. Hyponym): X is a hypernym of Y if Y is a (kind of) X plant / tree walk / march Meronym (inv. Holonym): X is a meronym of Y if X is a part of Y or X is a substance of Y or X is a member of Y Antonym : an opposition lexical relation Séminaire LIR - Mai 2001 mouth / face tree / forest rich / poor happy / unhappy 11 Organisation des noms 5/5 Group Person Family Brother Hyponyme Natural Object Relative Sister Body Leg Substance Organic Substance Arm Méronyme Séminaire LIR - Mai 2001 Flesh Bone Antonyme 12 Organisation des verbes 1/5 La plus importante catégorie lexicale et syntaxique du langage et la plus difficile à étudier 21000 verbes et approximativement 8400 synsets Répartition des verbes dans 15 fichiers distincts qui correspondent chacun à un domaine sémantique Séminaire LIR - Mai 2001 13 Organisation des verbes 2/5 Stative verbs Emotion or psych verbs Verbs of change Motion verbs Cognition verbs Perception verbs Verbs of communication Verbs of possession Competition verbs Verbs of social interaction Consumption verbs Weather verbs Contact verbs Creation verbs Verbs if bodily functions and care Séminaire LIR - Mai 2001 14 Organisation des verbes 3/5 Relations sémantiques : interaction avec implication stricte (entailment) "Someone V1" implique "Someone V2" A verb X entails Y if X cannot be done unless Y is, or has been, done Exemple : "He is snoring" implique "He is sleeping" Séminaire LIR - Mai 2001 15 Organisation des verbes 4/5 Entailment Temporal inclusion + Troponymy - Troponymy (co-extensiveness) (proper inclusion) ( limp – walk ) ( snore – sleep ) No temporal inclusion Troponym : X is a troponym of Y if to X is to Y in some manner Séminaire LIR - Mai 2001 16 Organisation des verbes 5/5 Entailment Temporal inclusion Cause : A verb X causes Y If X denotes the causation of the state or activity referred to by Y No temporal inclusion Cause ( feed – eat ) Séminaire LIR - Mai 2001 Backward presupposition ( fail – try ) 17 Organisation des adjectifs Adjectifs descriptifs : big, possible, … Adjectifs relationnels : variantes stylistiques des modifieurs de noms 19500 adjectifs organisés dans 1000 synsets Séminaire LIR - Mai 2001 18 Bibliographie Livres : – WordNet An Electronic Lexical Database – Christiane Fellbaum 1998 – EuroWordNet : a multilingual database with lexical semantic networks – Piek Vossen 1998 Résumés : Page Benoît Adresses http : – http://www.ac-toulouse.fr/wordnet/ – http://www.cis.upenn.edu/~jospehr/wn-biblio.html Séminaire LIR - Mai 2001 19