Procesamiento de Lenguaje Natural

Download Report

Transcript Procesamiento de Lenguaje Natural

Morphology and FSTs


Morphology is the study of the way words
are built up from smaller meaning-bearing
units, called morphemes.
A morpheme is defined as the minimal
meaning-bearing unit in a language.
E.g.
– The word “gatos” has two morphemes: “gato”
and “-s”.
Morphology and FSTs

Two important kinds of morphemes are: Stems
and affixes.
– Stem: is the main morpheme of the word, supplying the
main meaning.
– Affixes: add “additional” meanings of various kinds.

Affixes are further divided in: prefixes, suffixes,
infixes and circumfixes.
–
–
–
–
Prefixes: precede the stem.
Suffixes: follow the stem.
Circumfixes: do both precede and follow the stem.
Infixes: are inserted inside the stem.
Morphology and FSTs
Examples:
English
“unable” is formed by the prefix “un-” and the
stem “able”.
Spanish
“niños” --> stem “niño”, suffix “-s”
“damelos” --> stem “da”, suffix “-los”, infix “me-”
Finite State Morphological Parser

Features: morphological features specify
additional information about the stem
(e.g. plural, singular, masculine, feminine,
1ra persona, 2da persona, 3ra persona)
Derivational Morphology
Derivation is the combination of a word stem with a
grammatical morpheme, usually resulting in a word of a
different class.
Common derivations in English
Nominalization is the formation of new nouns from
adjectives and verbs.
Suffix
Base Verb/Adjective Derived Noun
-ation
Computerize (V)
computerization
-ee
Appoint (V)
appointee
-er
kill (V)
killer
-ness
fuzzy (A)
fuzziness
Derivational Morphology
Adjectives can also be derived from nouns and verbs:
Suffix
Base Noun/Verb
Derived Adjective
-al
computation (N)
computational
-able
embrace (V)
embraceable
-less
clue (N)
clueless
Finite State Morphological Parser
In order to build a morphological parser we need at
least the following:
1.
Lexicon: the list of stems and affixes, together
with the basic information about them.
2.
Morphotactis: the model of morpheme ordering
that explains which classes of morphemes can
follow other classes of morphemes inside a word.
3.
Orthographic rules: these spelling rules are used
to model the changes that occur in a word,
usually when two morphemes combine.
Finite State Morphological Parser
Finite State Morphological Parser
Exercises:
1.
Identify the tokens that occur in the following
expression (tipical of almost any programming
language) and create REs that generate each of them:
f(x)=3.1416*X08+sin(X08/2.5)-X08@231
Spanish General Knowledge (Quiz 1)
1.
Distingue los diferentes monemas:
a.
b.
c.
d.
e.
f.
Rehabilitáramos:
Expatriación:
Pañuelitos:
Reforestábais:
Antiglobalicacion:
Vivificación:
Spanish General Knowledge (Quiz 1)
2.
Indica el tipo de lexema que son las palabras de las
siguientes frases:
a. El estanque del parque está siempre lleno de pájaros
exóticos.
b. A mi amigo Félix le gusta coleccionar cosas raras.
Andrés se levantó ayer
c. un poco tarde y Lucía hizo lo mismo.
Spanish General Knowledge (Quiz 1)
3.
Indica a qué clase de palabra pertenece cada una de
las palabras marcadas en las oraciones:
a. Mi coche es rojo.
b. La rubia era mi prima.
c. Los coches corrían mucho.
d. Juan y Luis siempre han sido amigos.
Spanish General Knowledge (Quiz 1)
4.
Busca el femenino de las siguientes frases:
a. El presidente ecologista
b. El psicólogo dormilón
c. Mi cariñoso jefe
d. El panadero alegre
Spanish General Knowledge (Quiz 1)
5.
Este texto periodístico tiene errores: hay adjetivos
que deben ir después del sustantivo. Corrígelo.
El presidente de G. ha emprendido un largo viaje diplomático por lejanos
países, acompañado de su ministro de exteriores asuntos y de su joven
esposa. Durante los últimos días se han producido ya numerosas
anécdotas. En la inauguración de un industrial edificio, por ejemplo,
alguien entregó a la esposa del presidente un redondo objeto que resultó
ser un japonés reloj de pared. Pero también ha habido malos momentos.
Cuando iban en el oficial coche a la inauguración de un nuevo edificio por
una estrecha carretera de montaña, el coche del presidente sufrió un
pequeño accidente y chocó contra una vacía casa.
Spanish Morphology
For a detailed account of Spanish morphology
consult the following page:
1.
Universidad de Valéncia, España
http://mural.uv.es/morfesp/
2.
http://www.profesorenlinea.cl/castellano/Analisis
_morfologico.htm
3.
http://www.vicentellop.com/apuntes_gramatica/a
puntes.htm