Семантично моделиране на българските части на речта

Download Report

Transcript Семантично моделиране на българските части на речта

Петя Осенова Катедра по български език СУ „Св. Кл. Охридски”

 Общи положения в Опорната фразова граматика (ОФГ)  Идеите за кодиране на информация в лексикона (Полард и Саг 1994; Пустейовски 1998)  Моделиране на частите на речта   Пълнозначни (

глагол

)

съществително име, прилагателно име, числително име, наречие, местоимения,

Функционални (

предлог, съюз, частица

)

 съвременна лингвистична теория  информацията за езиковите обекти се кодира в йерархия на типовете със съответните ограничения, граматични правила и лексикон  oсобено важна е ролята на лексикона, където се представят подробности за граматическото и семантичното поведение на лексемите

 Лингвистичната информация се наследява от по-общ тип към по-специфичен тип  Кодирането показва взаимодействието между морфосинтаксис, семантика и прагматика  Например: интранзитивният глагол ще наследи информация от общата спецификация за глагола, като добави допълнителни ограничения за това, че няма комплементи във валентната си рамка (повече за ОФГ вж.

Формална граматика на българския език

– Осенова и Симов 2007)

 Mорфосинтактичната информация се кодира в характеристиката

Категория

(CAT(egory)). Тя включва: подхарактеристиките за

част на речта

и

валентност

 Семантичната информация се кодира в характеристиката

Индекс Съдържание

(CONT(ent)). Тя включва: семантичната подхарактеристика (INDEX), която има за стойност

събитие

(event) или

референт

(referent).

individual := semarg & [ SORT semsort ].

event-or-ref-index := individual.

ref-ind := index & event-or-ref-index & [ PNG png ].

8

 Частите на речта се категоризират като:

събития

(глаголи, предлози, прилагателни, наречия) и

референти

(съществителни)  Опорите се разделят на

местоименни

и

неместоименни

 Някои части на речта въвеждат специфични семантични релации

 Известно е, че българският език е флективен език с богата морфология.

Затова и семантичното моделиране е тясно свързано с граматическите процеси.

 Представени са някои особености при моделиране на частите на речта от гледна точка на семантиката.

 Аргументната структура (ARG-ST) кодира потенциалните задължителни участници в ситуацията в подреден списък. Следва йерархията за ‘косвеност’ (obliqueness hierarchy).  Валентните списъци кодират проекциите на аргументната структура, които са реализирани синтактично  Така връзката между двете равнища е:   Съществува в ARG-ST

и

валентния списък се Съществува в ARG-ST,

но

валентния списък

реализира

не се във

реализира

във

 Типове аргументи:     Истински (реализира се синтактично) По подразбиране В сянка Адюнкт  Типове качества:     AGENTIVE (произход), CONSTITUTIVE (съдържание), TELIC (цел), FORMAL (специфика)

брат

ARGST = [ARG0 = x:човек] [D-ARG = y:човек] Qualia = [CONST = мъж (x)]

[FORMAL = брат_на(x,y)]

ръка

ARGST = [ARG0 = x:крайник] [D-ARG = y:човек] Qualia = [FORMAL = x]

[CONST = част_от(x,y:тяло)]

хонда

ARGST = [ARG0 = x:кола] Qualia = [FORMAL = x]

[TELIC = карам(е,y,x)] [AGENTIVE = създавам(е,хонда,x)]

 Нарицателни и собствени  Разделяне на категориите

лице/число/род

от категорията

определеност/неопределеност

 По принцип НЕ са модификатори  Релационните съществителни имат семантичен аргумент (майка на X)  Собствените имена въвеждат релация за именуване

SYNSEM [ LOCAL [ CAT [ HEAD noun [MOD <>], VAL [ SPR ], SUBJ < >, SPEC < > ]], AGR.PNG #png & [ PERSON 3rd ],

CONT [ INDEX [ PNG #png ]

n_-_cm-hum_le := basic-common-noun-masc-intr & [

SYNSEM.LOCAL.CONT.HOOK.INDEX.SORT

human

].

basic-proper-noun := basic-common-noun-intr & [

SYNSEM.LKEYS.KEYREL named-relation

].

Кучето лаеше всеки ден.

(модифициране на събитие) 

Браун пристигна във вторник сутринта.

(модифициране на референт)

 Типичното прилагателно е:    „Пресичащ“ модификатор (intersective) Събитие Не взима комплементи  Компаративното прилагателно въвежда релация за сравнителна степен

 „Пресичащ“ модификатор означава, че семантично се стеснява обемът на модифицираното понятие.

Например:

хубава жена, висок човек.

 „Пресичащите“ модификатори действат директно върху семантиката на модифицираното понятие.

 Освен „пресичащи“ модификатори, има и т.нар. модификатори с обхват.  Те не стесняват понятиeто, а се отнасят към цялостно събитие.  Това означава, че се въвеждат ограничения, в рамките на които прилагателните имена с обхват влизат в отношения и с други квантификатори. Например в израза

бивш военен

, прилагателното

бивш

не се отнася до множество на бивши обекти, а до времеви момент, който предхожда настоящия момент.

 Тъй като събитията не могат да бъдат определени или не, прилагателното може да бъде

морфологично определен

о, но семантично то избира

определено съществително

:  Напр.

старата котка

Стара

та

[MOD < котка >] котка [

SYNSEM.LOCAL

[CONT.HOOK.INDEX.DEF+

] .

AGR.DEF-

]]

 Числителните имена (бройни и редни) се разглеждат като „пресичащи“ модификатори.  Разликата е единствено в типа на съгласуването с опорната дума.

 Разделят се на:   ‘пресичащи се’ (

тихо, весело, сега

) и ‘имащи обхват’ (

вероятно

)

Притежателните

– въвеждат релация за посесивност с два аргумента 

Относителните

– нямат характеристиката за модификатор (MOD) и нямат своя семантика. Семантиката е на нивото на конструкцията.

Местоименията-детерминатори

квантифицираща релация. въвеждат 

Въпросителните

– и въпросителна релация.

 Клитиките се разглеждат като лексикални проекции на опората  Пълните форми се разглеждат като аргументи  Т.е. клитиките нямат своя семантика. Те я инкорпорират в опората.

31

 [VP Иван [V го видяха]]  [V Взеха я]  [VP Видяха Иван]

 Глаголите имат редица типологически значими характеристики, които могат да поделят своя граматически и семантичен принос.  Такива са например категориите:    вид, време, наклонение.

perfective-or-imperfective-lexeme := main-verb lex & [ SYNSEM.LOCAL

[

CAT.HEAD.TAM.ASPECT

#aspect,

CONT.HOOK.INDEX.E.ASPECT

#aspect ]].

 Семантиката на глагола зависи от три основни фактора:    разделението на спомагателни и пълнозначни глаголи; синтактичният тип на глагола: интранзитивен (

вървя

), транзитивен (

гледам

), дитранзитивен (

давам

) и дали глаголът изразява определен тип контрол от типа

подлог-подлог

((

АЗ)обещавам (АЗ) да направя нещо

),

пряк обект-подлог

((

АЗ) убеждавам (НЯКОГО) (ТОЙ) да направи нещо

) и др.

 спомагателните глаголи, които образуват глаголни форми, нямат своя семантика.

 затова те приемат семантиката на своя аргумент. Например:

Той беше пренесъл багажа в къщата

.

 Семантични разлики според комплемента: Взема референта като комплемент и се държи като транзитивен глагол  Аз

съм човек.

Взема събитието, като то дава семантичния си индекс  Аз съм

добра.

  Аз съм

добре.

Аз съм

от Плевен.

Моделиране на функционалните думи

 Два типа:   Модифициращи (имат семантика) Немодифициращи (нямат семантика)  Примери  

В градината имаше котки.

Дадох книгата на Иван.

Субординатори

(модифицират главното изречение, но избират подчиненото) 

Комплементизатори

подчиненото) (субкатегоризирани са от главното изречение и също избират

 доста разнородна група – с различен състав и различна функция:    въпросителната частица

ли

се разглежда като „пресичащ“ модификатор, докато отрицателната частица детерминатор, т.е. като част на речта, която има обхват

нито

се разглежда като частицата

се

, която е част от глаголната лексема (

смея се, боя се, дивя се

) се разглежда логично като частица без собствена семантика

 Селективните способности на частите на речта предполагат по-детайлна семантична класификация и довеждат до появата на повече типове  Наличието или липсата на семантично съдържание зависи от самата част на речта, но и от субкатегоризиращия елемент  Много от граматичните характеристики поделят приноса си в морфосинтактичната и семантичната област

 Copestake, A. et. al (2005): A. Copestake, D. Flickinger, C. Pollard and I. Sag. Minimal Recursion Semantics: An Introduction. In

Research on Language and Computation

(2005) 3:281–332.

 Kathol, A. (1997): Agreement and the Syntax-Morphology Interface in HPSG. In

Robert Levine and Georgia Green (eds.) Studies in Current Phrase Structure Grammar.

Cambridge University Press. pp. 223-274.   Manning and Sag 1995: Ch. Manning and I. Sag. Dissociation between Argument Structure and Grammatical Relations. In: G. Webelhuth, J.-P. Koening and A. Kathol (eds.)

Lexical and Constructional Aspects of Linguistic Explanation

, CSLI publications, pp. 63–78.

Osenova 2004: Petya Osenova. On Subject-Verb Agreement in Bulgarian (An HPSG-based account). In:

Proc. of the fourth Formal Description of Slavic Languages Conference,

Potsdam, Germany, 2004. pages 661-672.

 Osenova 2010:

Bulgarian Resource Grammar. Modeling Bulgarian in HPSG.

VDM, Saarbrucken.

 Pustejovsky 1998: James Pustejovsky.

The Generative Lexicon

. The MIT Press. Cambridge, Massachusetts, London, England.