Prof. dr hab. Marek Świdziński ROJN * 8.01.2003

Download Report

Transcript Prof. dr hab. Marek Świdziński ROJN * 8.01.2003

NOWA DEFINICJA FORMALNA
POLSKIEJ FRAZY NOMINALNEJ
IPIPAN * 21.01.2008
Prof. dr hab. Marek Świdziński
Zakład Językoznawstwa Komputerowego
Instytut Języka Polskiego UW
e-mail: [email protected]
Konsultacje: śr 14.00-15.00, pok. 1
Adres internetowy:
www.mswidz.republika.pl
Program
•
•
•
•
•
•
•
•
•
•
•
Cel
Motywacja
(Pre)historia
Dziury i błędy w opisie fno
fno: co to jest?
Format i parametry
Przykładowe reguły
Rozwiązanie I: jałowa rekursja
Rozwiązanie II: realizacje atrybutywne
Rozwiązanie III: opis przecinka
Luźne końce…
–2
Cel
•
•
•
Prezentacja projektu przebudowy GFJP.
„Łóżko testowe”: opis jednej jednostki składniowej.
Pokaz gotowych rozwiązań kilku problemów
teoretycznych i praktycznych.
–3
Motywacja
• GFJP była / jest testowana ( Świgra).
• GFJP musi być poprawiona / rozbudowana (?).
• Dlaczego nie napisać GFJP lepiej?
• Zacząć od jakiejś jednostki składnikowej.
• fno:
 fraza (jednostka prostsza niż zdaniowa);
 nominalna (jednostka ważna, częsta w tekstach,
strukturalnie bogata);
 jednostka „oddolna”.
–4
(Pre)historia (1)
• Szpakowicz, S., Świdziński, M.: Formalna definicja
równorzędnej grupy nominalnej we współczesnej
polszczyźnie pisanej. Warszawa 1981. 74. Maszynopis
powielony. Również w: Studia gramatyczne t. IX,
Wrocław 1990. 9-54.
• Świdziński, M.: Gramatyka formalna języka polskiego,
Warszawa 1992.
• Świdziński, M., Derwojedowa , M., Rudolf, M.:
„A computational account of multi-word numeral phrases
in Polish”. Linguistik International Band 10.
Investigations into Formal Slavic Linguistics.
Contributions of the FDSL IV. Frankfurt am Main i in.
2003. 405-415.
–5
(Pre)historia (2)
• Świdziński, M., Derwojedowa , M., Rudolf, M.:
„Two formal approaches to Polish numeral phrases
implemented”. Studia z gramatyki i leksykologii języka
polskiego. Red. M. Gębka-Wolak, I. Kaproń-Charzyńska,
M. Urban. Toruń 2003. 93-108.
• Woliński, M.: Komputerowa weryfikacja gramatyki
Świdzińskiego. Rozprawa doktorska. IPI PAN: Warszawa
2005.
• Świdziński, M.: „A DCG account of Polish relative
constructions”. [W:] Human Language Technologies as a
Challenge for Computer Science and Linguistics.
Proceedings of the 3rd L&T Conference, October 5-7,
2007, Poznań, Poland. Poznań 2007. 478-482.
–6
(Pre)historia (3)
• Świdziński, M., Woliński, M.: „Towards a new version of
the formal grammar of Polish: the NP redefined”. [W:]
Formal Description of Slavic Languages FDSL-7.
University of Leipzig, 30 November – 2 December, 2007.
Book of Abstracts, Leipzig 2007. 101-103.
–7
Dziury i błędy w opisie fno (1)
•
•
•
•
Brak definicji fraz z koordynacją.
Brak definicji fraz z liczebnikiem.
Brak definicji fraz liczebnikowych.
………….
–8
Dziury i błędy w opisie fno (2)
Są to także błędy ogólne!!!
1. Mechanizm jałowej rekursji.
2. Realizacja przymiotnikowa fno.
3. Opis przecinka.
–9
Dziury i błędy w opisie fno (3)
1. Jałowa rekursja
• Hierarchia kanoniczna:
–
–
–
–
–
–
Fraza nominalna (FNO)
Konstrukcja nominalna z dopełniaczem (KNODOP)
Konstrukcja nominalna z frazą przyimkową (KNOPM)
Konstrukcja nominalna z atrybutem (KNOATR)
Konstrukcja nominalna z inkorporacją (KNOINK)
Konstrukcja nominalna (KNOM)
–10
Dziury i błędy w opisie fno (4)
-
FNO = KNODOP FZD
KNODOP = KNOPM FNO
……………..
KNOM = FNO
• KNOM (p, rl, o, neg, z, kl)
= FNO (p, rl, o, neg, NI, z, kl).
(NO48)
–11
Dziury i błędy w opisie fno (5)
2. Realizacja przymiotnikowa fno
-
FNO = KNODOP FZD
KNODOP = KNOPM FNO
……………..
KNOATR = FPT
……………..
KNOATR (p, rl, 3, neg, i, z, kl)
= FPT (p, rl, st, neg, i, z, kl).
(NO38)
–12
Dziury i błędy w opisie fno (6)
3. Opis przecinka
• Przecinek jako jednostka składniowa – duży problem
ogólny:
- wielofunkcyjność słowa ,
- wielomotywacyjność wystąpień przecinka
ortograficznego
- opcjonalność w pewnych kontekstach
• W GFJP – przecinek pusty międzyspójnikowy:
% Wiem, że jeśli przyjdą, umrę.
% * Wiem, że, jeśli przyjdą, umrę.
–13
fno: co to jest? (1)
• Występuje jako realizacja lub składnik:
– frazy wymaganej,
– frazy luźnej,
– frazy przyimkowo-nominalnej,
– frazy nominalnej (w szczególności skoordynowanej),
– frazy przymiotnikowej.
–14
fno: co to jest? (2)
• Ma różne struktury:
– współrzędną
– podrzędną
– egzocentryczną
• Ma różne centra:
– rzeczownikowe
– liczebnikowe
– zaimkowe różnych typów
– przymiotnikowe (?)
– gerundialne (?)
–15
fno: co to jest? (3)
• Ma bogaty zestaw cech gramatycznych:
– przypadek
– rodzaj
– liczba
– osoba
– klasa (centrum)
……..
• Gęsta sieć uzgodnień wewnętrznych i zewnętrznych
–16
Format i parametry (1)
fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk [, Poz])
fnokoor(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk [, Poz,
Sp])
–17
Format i parametry (2)
•
•
•
•
•
P
R/L
O
Neg
I
•
•
•
•
•
•
•
Pnw
Kl
Tak
Sub
Pk
Poz
Sp
przypadek
rodzaj i liczba
osoba
negacja
inkorporacja: bowiem, natomiast, więc, zaś,
ni, bp; R/L
pytajno-niepytajność: npyt, pyt, pz, wz
klasa: rzecz, os, co, kto, który, jaki, nuzg, uzg
taktylowatość: tk, tyle
nad-podrzędność: na, po
przecinkowość końcowa: bp, stan
pozycja: pre, post, egz
oznaczenie spójnika
–18
Format i parametry (3)
• Porządek zapisu reguł:
 Pnw dowolne
 Pnw = pyt
 Pnw = npyt
 Pnw = wz
 Pnw = pz
–19
Przykładowe reguły (1)
fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk)
--> s(no#),
fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, na, bpk),
{ rozne(Kl, co) },
fzd(który, nk, A, C, T, Neg2, R/L, po, Pk).
% Chłopiec, którego znam, [umarł.]
% Chłopiec, którego znam [, który umarł, nie przyjdzie.]
–20
Przykładowe reguły (2)
fno(mian, nij/poj, 3, Neg, I, pyt, licz, Tak, Sub, Pk)
--> s(no#),
fpt(mian, R/L, St, Neg1, I1, Pnw1, Kl1, Tak1, po, Pk1),
{ oblink(I, I1, I2), oblink(I, I2, I3), oblnegf(Neg, Neg1,
Neg2) },
flicz(mian, R/L, O, Neg2, I2, Pnw2, nuzg, Tak2, na, Pk2),
fno(dop, R/L, O, Neg3, I3, Pnw3, Kl3, Tak3, po, Pk),
{ rozne(R, mos), rowne(pyt, Pnw1.Pnw2), rowne(Pnw1,
npyt.pyt),
rowne(Pnw2, npyt.pyt), rowne(Pnw3, npyt.pyt),
obltak(Tak, Tak1, Tak2),
rozne(Kl3, licz), obltak(Tak, Tak2, Tak3) }.
% Które pięć facetek [było zaproszonych?]
% Te pięć z której klasy facetek [przyszło?]
–21
Rozwiązanie I: jałowa rekursja
fno
fno
spoj
przec
spoj
fno
spoj
fno
przec
fno
spoj
fno
fnokoor
fno
fzd
<flicz fno>
<fno
fno(dop,...)>
<fno
fpm>
<fno
fpt>
fno(...,I,...) spoj(Tsp, I, ni)
fno bez podrzędnika [różne realizacje]:
formarzecz, zaimpyt, zaimwzg, zaimos,...
–22
Rozwiązanie II: realizacje atrybutywne (1)
• Nie ma takiej realizacji ogólnej!!!
• Zamiast niej – wyliczanka realizacyj szczegółowych:
Pnw dowolne:
Przymiotnik
fno(P, R/L, 3, Neg, I, Pnw, Kl, Tak, Sub, Pk)
--> s(no#),
fpt(P, R/L, St, Neg, I, Pnw, Kl, Tak, na, Pk),
{ rowne(St, wyz.naj) }.
% Nowszą od czego [czytano?]
% Najnowszej [nie czytano.]
–23
Rozwiązanie II: realizacje atrybutywne (2)
Liczebnik porządkowy
fno(P, R/L, 3, Neg, I, Pnw, Kl, Tak, Sub, Pk)
--> s(no#),
flicz_porz(P, R/L, Neg, I, Pnw, Kl, Tak, na, Pk).
% Drugiego [widziałem.]
–24
Rozwiązanie II: realizacje atrybutywne (3)
Zaimek przymiotny
fno(P, R/L, 3, Neg, I, Pnw, Kl, Tak, Sub, Pk)
--> s(no#),
fno_zaim_przym(P, R/L, Neg, I, Pnw, Kl, Tak, Sub, Pk).
% Każdą [lubiłem.]
% [Nie znam] żadnej [.]
Jest osobna definicja fno_zaim_przym
–25
Rozwiązanie II: realizacje atrybutywne (4)
Pnw = wz
fno(P, R/L, 3, Neg, I, wz, Kl, Tak, Sub, Pk)
--> s(no#),
przyimek(Forma, dop),
{ rowne(Forma, z.spośród) },
fno(dop, R/mno, O, Neg1, I1, wz, Kl1, Tak1, po, Pk1),
{ oblnegf(Neg, Neg1, Neg2), oblink(I, I1, I2), obltak(Tak,
Tak1, Tak2) },
fno_zaim_przym(P, R/L, Neg2, I2, Pnw2, Kl2, Tak2, na,
Pk).
% [Książek, ] z których żadnej [nie znam, nie czytano.]
–26
Rozwiązanie III: opis przecinka (1)
• Problem:
% Chłopiec, którego znam, umarł.
% * Chłopiec, którego znam umarł.
% Umarł chłopiec, którego znam.
% * Umarł chłopiec, którego znam,.
% Chłopiec, którego znam, który umarł, nie przyjdzie.
% Chłopiec, którego znam,, który umarł, nie przyjdzie.
–27
Rozwiązanie III: opis przecinka (2)
fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk)
--> s(no#),
fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, na, bpk),
{ rozne(Kl, co) },
fzd(który, nk, A, C, T, Neg2, R/L, po, Pk).
Jednostki zawierające przec lub spoj(przec,…)
•
•
•
•
•
•
zdanie (koordynacja!!!)
fw
fl
fno
fpt
fzd
–28
Rozwiązanie III: opis przecinka (3)
• W regułach definiujących te jednostki składnik
przedprzecinkowy / przedspójnikowo-przecinkowy X
dostaje wartość bpk.
• W regule definiującej wypowiedzenie jednostka zdanie
ma wartość bpk.
• Wewnątrz X wartość ta spada na składnik końcowy.
• Dla X = fzd są dwie realizacje:
- stan – z przec na końcu
- bpk – bez przec na końcu
• Dla X będącego frazą bez przecinka każda realizacja
jest stan.
–29
Rozwiązanie III: opis przecinka (4)
% Chłopiec, którego znam [Pk = stan], umarł.
% * Chłopiec, którego znam umarł.
% Umarł chłopiec, którego znam [Pk = bpk].
% * Umarł chłopiec, którego znam,.
% Chłopiec, którego znam [Pk = bpk], który umarł, nie
przyjdzie.
% Chłopiec, którego znam,, który umarł, nie przyjdzie.
–30
Rozwiązanie III: opis przecinka (5)
• Problem przecinka początkowego: rozwiązany przez
parametr I (?).
% Kto pyta, nie błądzi.
% * , Kto pyta, nie błądzi.
• Pozostaje problem opisu braku przecinka wewnątrz fzd
o pierwszym składniku będącym fzd:
% Wiem, że kto pyta, nie błądzi.
% * Wiem, że, kto pyta, nie błądzi.
–31
Luźne końce… (1)
• Definicja frazy liczebnikowej (banał…).
• Porządna definicja fno z koordynacją.
• Opis fno egzocentrycznej:
% Chłopiec i dziewczyna [przyszli.]
% My i dziewczyna [przyszliśmy.]
% [Przyszli] chłopiec i dziewczyna [.]
% [Przyszliście] chłopiec i wy [.]
egz
egz
egz
egz
% [Przyszedł] chłopiec i dziewczyna [.]
% [Przyszedł] chłopiec i ktoś jeszcze [.]
% [Przyszedł] chłopiec i dwie dziewczyny [.]
% [Przyszedł] chłopiec i pięć dziewczyn [.]
post
post
post
post
–32
Luźne końce… (2)
% Chłopiec i ktoś jeszcze [przyszedł.]
% Chłopiec i dwie dziewczyny [przyszły.]
% Chłopiec i pięć dziewczyn [przyszło.]
pre
pre
pre
Ale także:
% naszych Jasia i Marysi
% kochane Joasiu i dziewczyny
% tymi filozofią i matematyką
–33
Dziękuję za uwagę!!!
–34