ΜΟΡΦΟΛΟΓΙΑ

Download Report

Transcript ΜΟΡΦΟΛΟΓΙΑ

ΜΟΡΦΟΛΟΓΙΑ
Γιατί μορφολογική ανάλυση???
Πιθανές εφαρμογές
1. Εφαρμογές Φυσικής Γλώσσας (NLP)
-parsing
-παραγωγή κειμένων
-μηχανική μετάφραση
- λεξικογραφικά εργαλεία & λημματοποίηση
Γιατί μορφολογική ανάλυση???
2. Εφαρμογές Φωνής (Speech applications)
-συστήματα σύνθεσης φωνής
text-to-speech systems
-συστήματα αναγνώρισης φωνής
speech-to-text systems
Γιατί μορφολογική ανάλυση???
3. Εφαρμογές Επεξεργασίας Κειμένου
(Word Processing Applications)
-έλεγχος ορθογραφίας
Spelling checkers
-εισαγωγή κειμένου
Text input
4. Ανάκτηση Εγγράφων (Document Retrieval)
5. Εκπαιδευτικά εργαλεία διδασκαλίας
μορφολογίας (Ahmad & Rogers 1979; Holman
1988; Klavans & Chodorow 1988)
Γιατί μορφολογική ανάλυση???
Το είδος της μορφολογικής ανάλυσης που
πραγματοποιεί ένας αναλυτής εξαρτάται από
την εκάστοτε εφαρμογή που τον χρησιμοποιεί
-σειρά μορφημάτων που εντοπίζονται σε μια
μορφολογικά σύνθετη λέξη
-μια δεδομένη λέξη είναι τύπος μιας συγκεκριμένης
ρίζας
1. Εφαρμογές NLP
Η πλέον προφανής περιοχή χρήσης ενός
μορφολογικού επεξεργαστή είναι στο
πλαίσιο ενός γενικότερου συστήματος
φυσικής γλώσσας, όπως είναι ένας parser ή
ένας generator, ή και τα δύο: σύστημα
Μηχανικής Μετάφρασης
Συστήματα Ανάλυσης
•
•
•
•
•
Ποιες είναι οι ιδιότητες των λέξεων ενός
κειμένου? π.χ.
POS της λέξης
θεματικός ρόλος του υποκειμένου
δομή της λέξης
μορφοσυντακτικό (γραμματικό) περιεχόμενο
σημασία μιας μορφολογικά σύνθετης λέξης
*Δεν είναι πρακτικό να περιλαμβάνουμε όλους
τους τύπους ενός λεξήματος (list all words)
Συστήματα Σύνθεσης
Παραγωγή/Σύνθεση (generation)
συγκεκριμένων τύπων ενός λεξήματος σε
συγκεκριμένο συντακτικό ή σημασιολογικό
περιβάλλον με βάση ένα σύνολο
συντακτικών ή σημασιολογικών
χαρακτηριστικών
Εύρεση ορίων λέξης 1
• Ορθογραφικά συστήματα π.χ. Ινδο-ευρωπαϊκές
γλώσσες: όρια λέξεων συμβατικά διακρίνονται με
κενό (whitespace)
• Κινεζική γλώσσα: δεν υπάρχει
συμβατική/εμφανής διάκριση ορίων λέξεων:
χαρακτήρες αντιστοιχούν σε μονοσύλλαβα
μορφήματα
• Μονομορφηματικές – πολυμορφηματικές λέξεις
• Ομαδοποίηση χαρακτήρων επηρεάζει τόνο,
επιτονισμό ή και προφορά ορισμένων χαρακτήρων
Εύρεση ορίων λέξης 2
• Toy parsing systems: dictionary look-up
(Yang 1985, Lin 1985)
• Unrestricted Chinese text: δεν έχει
αναφερθεί σύστημα ικανοποιητικής
αντιμετώπισης της παραγωγικής
μορφολογίας (Ούτε λεξικό, ούτε στατιστικά
υποκατάστατα δίνουν ικανοποιητικά
αποτελέσματα)
Χρήση Ηλεκτρονικών Λεξικών
Ανάγκη ύπαρξης εργαλείων τα οποία, με αφετηρία
ένα συγκεκριμένο τύπο ενός λεξήματος,
παρουσιάζουν όλους τους παραδειγματικούς
τύπους του λεξήματος που βρίσκονται στο λεξικό
puo: posso, puoi, possiamo.. vient: viens, venons..
Αποφασίστηκε: αποφασίζουμε, αποφασίσει..
Το σύστημα πρέπει να διαθέτει μηχανισμό
μορφολογικής ανάλυσης
Κατασκευή Ηλεκτρονικών
Λεξικών
Επέκταση υπάρχοντων λεξικών π.χ (Wolff
1984) λεξικό ιατρικής ορολογίας
Αυτόματη λεξική κωδικοποίηση
-Χρήση υπάρχοντων δεδομένων
-Εντοπισμός ενός συνόλου μορφημάτων &
σημασιολογικού τους περιεχομένου π.χ.
electro- πρόθημα prefix
-itis
επίθημα suffix
Λημματοποίηση
Lemmatization
Μηχανισμός εντοπισμού του λήμματος με
αφετηρία ένα συγκεκριμένο τύπο του
λεξήματος
dogs -> dog
puede -> poder
θεωρήθηκαν -> θεωρώ
Απαραίτητος σε μεγαλύτερα συστήματα
indexing, document retrieval, MT
2. Εφαρμογές Φωνής
Σύνθεση Φωνής (text-to-speech)???
Στόχος: εισαγωγή κειμένου & παραγωγή ομιλίας
από μηχανή, τέτοια που δεν διαφέρει από την
ανθρώπινη
Τα περισσότερα συστήματα ΤtS κάνουν κάποιο
ποσό συντακτικής ανάλυσης π.χ.
MITalk system: DECOMP module μορφολογικής
ανάλυσης: POS πληροφορίες για το συντακτικό
αναλυτή (major benefits, Klatt 1987)
Σύνθεση Φωνής
(text-to-speech)
Ορθή προφορά π.χ. <boathouse>: */θ/ ή /δ/
Σύνορα μορφημάτων μεταξύ <t> & <h>
Γερμανικά (Russi 1990; Scnabel & Roth
1990)
Ιταλικά (Martin 1990)
Αναγνώριση Φωνής (speech-to-text) 1
Αν και μορφολογική ανάλυση απαραίτητη για την
αναγνώριση άγνωστων λέξεων, όπως και η
συντακτική ανάλυση, πολύ λίγη προσοχή
Τα περισσότερα συστήματα StT: λεξιλόγιο 1000
λέξεων και καταχώρηση όλων των μορφολογικά
διαφορετικών τύπων π.χ.
Λεξιλόγιο του συστήματος SPHINX στα πλαίσια
του Resource Management (RM) task (ερωτήσεις
σχετικά με πολεμικά πλοία στον Ειρηνικό):
length/lengths downgrade/downgraded
Αναγνώριση Φωνής (speech-to-text) 2
Από 1982: Κυρίαρχο μοντέλο αναγνώρισης:
Κρυφό Μοντέλο Markov (HMM)
doubly stochastic:
Both underlying phoneme string and frame-by-frame
surface acoustic representations: represented
probabilistically as Markov processes
Από 1992: Στροφή προς μεγαλύτερα λεξιλόγια
(20.000 λέξεις+) με εφαρμογές στην υπαγόρευση
κειμένων
Αναγνώριση Φωνής (speech-to-text) 3
Roe et al. 1991: morph-based recognition:
Πλήρεις τύποι λέξεων αναπαρίστανται ως
αλυσίδες μορφηματικών μοντέλων
(Sproat 1992:8)
Μείωση του μεγέθους του συνόλου των
τύπων που απαιτούνται για την εκπαίδευση
του συστήματος αναγνώρισης
soup, cup, meat, -s
3. Εφαρμογές Επεξεργασίας
Κειμένου
Έλεγχος ορθογραφίας
• UNIX spell-checker (McIlroy 1982):
κλασσικό λεξικό: παράλειψη κλιτών τύπων,
κύριων ονομάτων, συντομογραφιών, νέων
τεχνικών όρων
Σημερινή έκδοση του SPELL:
30 κλιτικά επιθήματα + 40 προθήματα
-s, -er, -ism, -ing, -able anti-, intra-, bio
Εφαρμογές Επεξεργασίας
Κειμένου
Είσοδος κειμένου στην Ιαπωνική γλώσσα
Γραπτός λόγος Ιαπωνικής:
συνδυασμός συλλαβικών χαρακτήρων (kana)
& Κινεζικών μορφηματικών χαρακτήρων (kanji)
Kana: προσφύματα & κλιτικά (closed-class: 50)
Kanji: ουσιαστικά επίθετα ρήματα(open-class:3.000)
Πρόβλημα: όρια λέξεων – επίλυση ομογραφιών
Στατιστική αυτόματη μετατροπή σύνθετων λέξεων
kana-kanji
Γράφος πιθανών μορφημάτων
(Abe et al. 1986)
4. Ανάκτηση Εγγράφων 1
Document Retrieval
(Dolby et al. 1965; Buttel et al. 1986;
Thurmair 1984; Jappinen et al. 1985;
Koskenniemi 1984b; Meya-Lloport 1987)
etc.
Είσοδος: λέξεις-κλειδιά
Έξοδος: όλα τα κείμενα σε μια Βάση
Δεδομένων (ΒΔ) που περιέχουν αυτές τις
λέξεις
4. Ανάκτηση Εγγράφων 2
Αγγλικά: φτωχή κλιτική μορφολογία
<church> <churches>
<spy> <spies>
word/lexeme-based morphology
Πολλές γλώσσες: πλούσιο κλιτικό σύστημα
Ελληνικά: stem-based morphology
<τσαγκάρ-ης> <τσαγκάρ-ηδες>
<αναπαριστ-ώ> <αναπαραστήσ-ω>
Ανάκτηση Εγγράφων 3
•
Θησαυρός Ελληνικής Γλώσσας (Thesaurus
Linguae Grequae): ΒΔ Αρχαίας Ελληνικής
Γραμματείας (CD-ROM)->online
Επέκταση αυτού σε
Βυζαντινή & Νέα Ελληνική γραμματεία
?????
Η μορφολογική ανάλυση ‘επιστρέφει’ το σύνολο
των πιθανών μορφολογικά συνδεόμενων λέξεων
ενός κειμένου
Ανάκτηση Εγγράφων 4
Εβραϊκά: Attar et al. 1978
Το σύστημα ‘επιστρέφει’ το σύνολο των
παράγωγων και κλιτών τύπων που
επιτρέπεται να παραχθούν από μια
δεδομένη ρίζα
bat
benot
benotenu
<bt>
<bnwt> <bnwtynw>
‘κορίτσι’
‘κορίτσια’ ‘κορίτσια μας’
ΒΑΣΙΚΕΣ ΑΡΧΕΣ
ΜΟΡΦΟΛΟΓΙΑΣ
1. Μορφολογικές Διαδικασίες
2. Μορφήματα, Δομή των Λέξεων &
Κανόνες Σχηματισμού Λέξεων
3. Τι συνδέεται και Πώς?
4. Morphotactics: Η Σειρά των
Μορφημάτων
5. Ψυχογλωσσολογικές Αποδείξεις
Αλληλεπίδραση ΘεωρητικήςΥπολογιστικής Μορφολογίας
• Θεωρητική Μορφολογία: γιατί η γλώσσα x έχει
το χαρακτηριστικό y ή γιατί όλες οι γλώσσες
έχουν το χαρακτηριστικό y: αναλύσεις τείνουν
προς πιο αφηρημένες αναπαραστάσεις, μακριά
από την επιφανειακή δομή των γλωσσών
• Υπολογιστική Μορφολογία: άμεσοι στόχοι:
σύστημα που καλύπτει ικανοποιητικά 99%
των λέξεων κειμένων π.χ. εφημερίδων σε
συγκεκριμένη γλώσσα
Αλληλεπίδραση ΘεωρητικήςΥπολογιστικής Μορφολογίας
• Υπολογιστική: ποια θέματα πρέπει να εξεταστούν
για να επεκταθεί ένα σύστημα και σε άλλες
γλώσσες ή ένα toy system σε ένα πραγματικό
σύστημα μιας γλώσσας
• Θεωρητική: δυσκολίες κατασκευής ενός
συστήματος που καλύπτει μεγάλα τμήματα μιας
γλώσσας (όχι συχνός στόχος) - έλεγχος
καταλληλότητας & πληρότητας (adequacy)
θεωρητικών μοντέλων
Μορφολογική ταξινόμηση
γλωσσών
• Η μορφολογία μεταφέρει/εκφράζει πληροφορία
• Τρόποι κωδικοποίησης πληροφορίας-ποσότητα &
είδη πληροφορίας
Isolating
Agglutinative
Polysynthetic
Inflectional
Bloomfield 1933
Απομονωτικές Γλώσσες
(isolating)
Δεν έχουν εξαρτημένες μορφές (bound
forms)=
δεν απαντούν στο λόγο παρά μόνο ως
τμήματα λέξεων: α-, δυσ-, -ω
Κινεζική:
oι μορφοσυντακτικές πληροφορίες του
αριθμού & του χρόνου δεν
μαρκάρονται/δηλώνονται εμφανώς
Συγκολλητικές Γλώσσες
(agglutinative)
Έχουν εξαρτημένες μορφές που ταξινομούνται
στις λέξεις σαν χάντρες σε κομπολόι
Τουρκική, Oυγγρική, Σουαχίλι
Cop+luk+ler+imiz+de+ki+ler+den+mi+y+di
(σκουπίδια+AFF+PL+1P/PL+LOC+REL+PL+ABL
+INT+AUX+PAST)
‘ήταν από εκείνα που ήταν στους
sκουπιδοντενεκέδες μας;’ (Hankamer 1986)
Πολυσυνθετικές Γλώσσες
(polysynthetic)
Ολόκληρες προτάσεις που αποτελούνται από μια
λέξη
Γλώσσες Εσκιμώων π.χ. Yupik Κεντρικής Αλάσκας
qaya:liyu:lu:ni
‘ήταν τέλειος (-yu-) στο να φτιάχνει (-li-) καγιάκ
(qaya:-)’ (Woodbury 1987)
Ενσωμάτωση του αντικειμένου μέσα στη λέξη
Κλιτές Γλώσσες (inflectional)
Χαρακτηρίζονται από μεγάλη χρήση
μορφημάτων portmanteau= εκφράζουν
ταυτοχρόνως πολλές μορφοσυντακτικές
κατηγορίες
Ελληνική, Λατινογενείς (Ισπανική, Ιταλική,
Γαλλική κλπ.)
παίζ-ουν: 3o+PL+ACT+PRES/PAST
vogli-o: 1ο+SNG+ACT+PRES/PAST
Ιnflectional Μorphology #
Inflectional Language
Kλιτική μορφολογία # Κλιτή γλώσσα
Κλιτική μορφολογία: αναφέρεται στο είδος
της γραμματικής/μορφοσυντακτικής
διάκρισης που κωδικοποιείται, ανεξάρτητα
από το πώς δηλώνεται εμφανώς αυτή η
διάκριση
-Τουρκική έχει κλιτική μορφολογία, αν και
δεν βρίθει από μορφήματα portmanteau
Μορφολογική πολυπλοκότητα
& συνέχεια
Isolating-Agglutinative-Inflectional-Polysynthetic
Τα κριτήρια διάκρισης είναι γενικά και ποικίλα
Τhree last classes ‘were never clearly defined’
(Bloomfield 1933:208)
Κεντρική αλήθεια: μερικές γλώσσες κωδικοποιούν
περισσότερες πληροφορίες μορφολογικά από άλλες:
Central Alaskan Yupik # Mandarin Chinese
Όλη η γραμματική εκφράζεται στο μορφολογικό επίπεδο #
σχέσεις μεταξύ γραμματικών στοιχείων εκφράζονται στο
συντακτικό επίπεδο
1. Mορφολογικές Διαδικασίες
•
•
Κλίση
(inflection)
Σχηματισμός λέξεων (word-formation):
Παραγωγή
Σύνθεση
(derivation)
(compounding/
/composition)
Inflectional
Morphology
Lexical
Morphology
Κλίση (inflection)
Paradigm του λεξήματος ΠΑΙΖΩ
παραδειγματικό επίπεδο
παίζ-ω
παίζ-ουμε
παίζ-εις
παίζ-ετε
παίζ-ει
παίζ-ουν
Ίδια γραμματική κατηγορία (POS) =
Διαφορετικοί τύποι ίδιου λεξήματος:
Διαφορετικές λειτουργίες (προσώπου & αριθμού)
Παραγωγή (derivation)
Διαφορετική γραμματική κατηγορία (POS)
antidisestablishmentarianism
establish (V)
establish+ment (N)
establish+ment+ary (Adj)
establish+ment+ari+an (N)
establish+ment+ari+an+ism (N)
dis+establish+ment+ari+an+ism (N)
anti+dis+establish+ment+ari+an+ism (N)
Μορφοσυντακτικές κατηγορίες
Κλιτικής Μορφολογίας
(context-sensitive)
Ρήμα
-Πρόσωπο (person)
-Αριθμός (number)
-Χρόνος (tense)
-Ποιόν Ενέργειας (ΠΕ) (aspect)
-Φωνή (voice)
-Έγκλιση (mood)
Όνομα + Επίθετο
(Άρθρο+Μτχ+Αντ/μία)
-Γένος (gender)
-Aριθμός (number)
-Πτώση (case)
Κινεζική: -Number,-Tense,-Specificity,+Aspect
gou bu ai chi qingcai
(the) dog/s do/does/did not like eat vegetables
Ρηματικές Μορφοσυντακτικές
Κατηγορίες Ν. Ελληνικής
•
•
•
•
Πρόσωπο1/2/3
Αριθμός SG/PL
Χρόνος: PAST/NON-PAST
ΠΕ
PERFECTIVE/NON-PERFECTIVE
(τέλειο
/
ατελές)
• Φωνή
ACTIVE/(MEDIO)PASSIVE
• Έγκλιση IMPERATIVE/NON-IMPERATIVE
Ονοματικές Μορφοσυντακτικές
Κατηγορίες
• Γένος (Φυσικό/Γραμματικό)
MAS/FEM/(NEUT)
• Aριθμός SG/PL
• Πτώση NOM/GEN/ACC/VOC (syncretism)
-Λατινική: 5 πτώσεις
-Φινλανδική: 14 πτώσεις (nominative, genitive,
accusative, partitive, inessive, abessive, adessive,
ablative, elative, illative, allative, prolative,
translative & instrumental) - Όχι δήλωση γένους
Παραγωγική Μορφολογία
-Περισσότερο ανοιχτό σύνολο επιλογών από κλιτική
μορφολογία
-Αρκετά παραγωγικοί μηχανισμοί
Παραγωγικά προσφύματα
(derivational affixes)
• Suffixing Derivational Morphology
• Prefixal Derivational Morphology
pseudo-pacifist/intellectual semiformal
Suffixing Derivational Morphology
Deverbal nominal morphology
xeroxer, destruction
Deverbal adjectival morphology
parsable, likeable
Deadjectival morphology
rarity, weirdness
Denominal morphology
catless (pet-owner), speechless
Κλίση & Παραγωγή
Και οι 2 λειτουργίες στηρίζονται κυρίως στην
προσφυματοποίηση (affixation)
Κλιτικά-Παραγωγικά Προσφύματα
Affixes:
prefix: prefixation
πρόθημα
ξε-πλένω
suffix: suffixation
επίθημα
πατερ-ούλης
infix: infixation
ένθημα
αναλα-μ-βάνω
Σύγκριση Κλίσης &
Παραγωγής στην Ελληνική 1
ΔΙΑΦΟΡΕΣ (Ράλλη 1993)
1. Ενδεχόμενη αλλαγή γραμματικής κατηγορίας
της λεξικής βάσης που δέχεται το παραγωγικό
πρόσφυμα
2. Η παραγωγική διαδικασία προηγείται πάντα
κάθε κλιτικής διαδικασίας & αντίθετα με την
κλίση επιτρέπει περιορισμένο ποσοστό
επαναδρομής (recursivity)
Σύγκριση Κλίσης &
Παραγωγής στην Ελληνική 2
3. Κλίση εξαρτάται από συντακτικό περιβάλλον:
Ονομ/Αιτ=Υποκ/Αντικ
4. Η κλίση είναι πιο παραγωγική διαδικασία από την
παραγωγή & δεν αλλάζει την εννοιολογική
σημασία (conceptual meaning) της λεξικής
βάσης, πράγμα που συμβαίνει συχνά με την
παραγωγή
5. Για τις παράγωγες λέξεις πρέπει να γίνει διάκριση
ανάμεσα σε υπαρκτές & πιθανές να παραχθούν
λέξεις, ενώ οι κλιτές μορφές των λέξεων
ανήκουν στον κατάλογο των υπαρκτών (???)
Σύνθεση (compounding)
• κλιμακωτή σύνδεση (concatenation) θέματος 2 ή
περισσοτέρων λεξημάτων για το σχηματισμό ενός
νέου λεξήματος
Γερμανική - Ολλανδική
Leben-s-versicherung-s-gesellschaft-s-angestellter
‘life
insurance company
employee’
ice-cream newspaper handwriting
διαστημ-ό-πλοιο εικοσι-ένα κακο-καιρία
Διευρυμένος τομέας
μορφολογίας
• one-word compounds # multi-word
compounds/syntactic words: fin de semaine
(Ράλλη 1990)
Λεξικές Φράσεις = πολυλεκτικοί
μορφολογικοί σχηματισμοί
πρακτορείο ειδήσεων ομάδα εργασίας
νόμος πλαίσιο
τύχη βουνό
μέση ηλικία
δημόσιος υπάλληλος
2. Μορφήματα, Δομή των Λέξεων
& Κανόνες Σχηματισμού Λέξεων
ΚΕΙΜΕΝΟ ................................................................
ΠΡΟΤΑΣΕΙΣ
efar΄mozun ΄nea ΄meθoδo…
ΣΥΝΤΑΓΜΑΤΑ΄nea ΄meθoδos, ΄ena pe΄δi….
ΛΕΞΗΜΑΤΑ ΄nea, ΄ena, na΄e, e΄an, ΄logos…
ΜΟΡΦΗΜΑΤΑ ΄ne-a, ΄en-a, na-΄e, e΄an, ΄logo-s….
ΦΩΝΗΜΑΤΑ/ a e o i u p t k b d g v δ γ….
ΓΡΑΦΗΜΑΤΑ
ΦΘΟΓΓΟΙ/
a e o i u p t k k b d g g v δ γ γ….
ΑΛΛΟΦΩΝΑ
Ιεραρχική Δομή Γλώσσας
•
•
•
•
Από απλούστερες μονάδες σε συνθετότερες:
από φθόγγους στα φωνήματα (φθόγγοι με
διαφοροποιητική αξία για τη σημασία των
λέξεων)
από φωνήματα/γραφήματα στα μορφήματα
(ελάχιστες σημασιολογικές μονάδες)
από μορφήματα στις λέξεις/λεξήματα
από λέξεις στις φράσεις/συντάγματα (μικρότεροι
δυνατοί συντακτικοί συνδυασμοί)
Τι είναι το Μόρφημα;1
(morpheme/formative)
Όπως όλα τα (γλωσσικά) σημεία
(επικοινωνίας), αποτελεί μοναδικό
συμβατικό συνδυασμό ορισμένης
σημασίας και ορισμένης μορφής
Ετερωνυμία/Ετεροσημία
Ετεροηχία/Ετερομορφία
(Μπαμπινιώτης 1980)
Τι είναι το Μόρφημα; 2
Ζεύγος: γραμματικής ή λεξικής σημασίας
& φωνολογικής/γραφηματικής έκφρασής
της
•
Γραμματικό
Λεξικό
PL {s}
home, chair
{ες}
πατέρας
Φορέας: Γραμματικής
Λεξικής
Σημασίας
Τι είναι το Μόρφημα; 3
•
Εξαρτημένο
(bound)
Ανεξάρτητο
(free)
ανάλογα με το εάν απαντά ή όχι
αυτοτελώς ως λέξη
ά-(άφοβος) δύσ-(δύσπεπτος)
απο-φέρω
-ω (γράφ-ω) –ου (λόγ-ου)
πανω-φόρι
(Μπαμπινιώτης 1980: 164)
Μόρφημα: μορφές
(Morpheme: morphs)
Μόρφημα=σημασία
Μορφή=ελάχιστη σημασιολογική μονάδα που
πραγματώνει το μόρφημα: αλλόμορφα
συγκεκριμένου μορφήματος π.χ.
Μόρφημα: {ΠΛΗΘΥΝΤΙΚΟΣ}
Μορφές: {-ες}/{-οι}/{-α}/{-ων}/{-ους}....
{s}/{z}/{iz}/{0}
Συχνά συμπίπτουν: που, και, όταν, αφού
big, out, chair, with
Morphemic/morphological analysis
Αλλόμορφα (allomorphs/
morpheme alternants)
Κατ’αναλογία του φωνήματος και των αλλοφώνων
του
• Σε σχέση συμπληρωματικής κατανομής
(complementary distribution)
{-ς}
/ {-u}
/ {-us} / {-0}.....
χώρα-ς
λόγ-ου
λάθ-ους
πατέρα-0
(αλλόμορφο μηδενισμένης μορφής)
• Σε σχέση ελεύθερης εναλλαγής: ελευθέρως
εναλλασσόμενοι τύποι (free variants)
γράφ
{-ονταν}/{-όντανε}/{-όντουσαν}
Δομή των Λέξεων 1
(πρόθημα)-ρίζα/θέμα-(ένθημα)-(θέμα)-επίθημα
(prefix)-root/stem-(infix)-(stem)-suffix
• Τα προσφύματα προσαρτώνται σε κάποιο θέμα &
συνήθως απαιτούν συγκεκριμένες ιδιότητες
(φωνολογικές,συντακτικές ή και σημασιολογικές)
που πρέπει να πληροί το θέμα: πάντα εξαρτημένα
μορφήματα
• Οι ρίζες/θέματα σε πολλές γλώσσες ενδέχεται να
είναι ανεξάρτητα μορφήματα
Δομή των Λέξεων 2
Συχνή η προσάρτηση προσφύματος σε άλλο
πρόσφυμα ως αδελφή
Αναπαράσταση δομής λέξης ως Δέντρο, όπως και
στη Σύνταξη
Un-happi-ness
2 δομές: -μορφολογική δομή
(κωδικοποίηση συντακτικής &
σημασιολογικής πληροφορίας)
-φωνολογική δομή
Δομή των Λέξεων 3
-Προθήματα/επιθήματα: γραμική ταξινόμηση:
Έννοια Φωνολογικής αναπαράστασης
ω
ω
F
F
σ
σ σ
σ
Λn
hae
pi
-n e s
Δομή των Λέξεων 4
• Μορφολογική αναπαράσταση: mobile-like
structure χωρίς εγγενή γραμμικότητα
κωδικοποιεί πληροφορίες κατηγορίας
happy: Adjective
-ness attaches to A to
make Nouns
N
A
A
A\A
A\N
HAPPY
UN
NESS
Δομή των Λέξεων 5
Αυτή η προσέγγιση καλύπτει και πιο σύνθετες
μορφολογικές δομές όπως της Αραβικής:
Πρόσφυμα προσαρτάται σε ρηματική ρίζα για να
παραχθεί ρηματικό θέμα
kVtVb
ktb μόρφημα +
binyan Ι μόρφημα:
CVCVC
Κανόνες Σχηματισμού Λέξεων
1
• Μοντέλο Item and Arrangement (ΙΑ)
(Hockett 1954, Matthews 1974)
Μια λέξη είναι σαν μια πρόταση: όπως η
πρόταση είναι μια δενδρικά ταξινομημένη
σειρά λέξεων, έτσι και η λέξη είναι μια
δενδρικά ταξινομημένη σειρά μορφημάτων
Κανόνες Σχηματισμού Λέξεων
2
• Μοντέλο Item and Process (IP) (Aronoff 1976)
Μια λέξη χτίζεται μέσω της διαδοχικής
εφαρμοφής Κανόνων Σχηματισμού Λέξεων
(Word-Formation Rules WFRs)
WFR: μια σχέση R η οποία παίρνει σαν είσοδο
ένα θέμα (stem) S και της οποίας η έξοδος R(S)
περιλαμβάνει την αλλαγή της φωνολογικής
μορφής του S & την προσθήκη κάποιων
μορφοσυντακτικών χαρακτηριστικών στα
χαρακτηριστικά του S ή την αλλαγή κάποιων από
αυτά.
Κανόνες Σχηματισμού Λέξεων
3
Προσφυματοποίηση του –ity στην Αγγλική:
Προσθήκη του φωνολογικού string /iti/ στο
θέμα & αλλαγή της γραμματικής
κατηγορίας από επίθετο σε ουσιαστικό
[X]A  [X + iti]N
3. Τι συνδέεται & πώς?
Τρόποι Μορφολογικής Σύνδεσης
• Purely concatenative morphology
απλούστερη & πλέον κοινή
• Infixation
• Circumfixation
• Templatic (Root & Pattern) morphology
• Reduplication
• Subsegmental morphology
• Zero morphology
• Subtractive morphology