PPT 6 - eAMOS

Download Report

Transcript PPT 6 - eAMOS

Korpusová lingvistika (6)
Kolokace
Jan Radimský
FF JU České Budějovice
Pojem kolokace...
 Kolokace = co – locare: to, co je (obvykle) v korpusu
vedle sebe



Korpus umožňuje získat velké množství informací o souvýskytech
Slova se spojují do syntagmat podle syntaktických pravidel
Ale ne všechny kombinace jsou stejně frekventované (bílá tráva,
rozumný strom...)
 John R. Firth (1951, 1957): You shall know a word by
the company it keeps



První, kdo položil teoretické základy pro studium kolokací
Určitá slova se navzájem předpokládají: slovo „Y“ se objevuje
vedle báze „X“ častěji, než by bylo statisticky pravděpodobné
(důkladná analýza, konečné rozhodnutí).
Kolokace v sobě zahrnují idiomy (jako podmnožinu): modrá knížka
Přístupy ke kolokacím
 Existují dvě základní pojetí:
 Kvantitativní (statistické): J.R.Firth, J. Sinclair... E.
Tognini-Bonelli...
 nebere v úvahu syntaktické vztahy
 Fq: to je, to bylo, to v, to se, to na...
 MI-score: to nezakřikli, to nepřipomínej, to
nepoplet, to autínko...
 ? to neva (vysoké MI), cf. levostranné kolokáty
pro neva
 Funkční
 berou v úvahu sx. vztahy
 zajímají se pouze o určité typy kolokací
Kvantitativní přístup
 Cf. prezentace o Tognini-Bonelli
 ... nepoužívat lematizaci
 popsat jazyk „bez syntaxe“, pouze statisticky
 Dva zajímavé principy: John Sinclair (1991):
Corpus, concordance, collocation
 Open choice principle („slot and filler“)
nakreslit + ?
 Idiom principle – nulový výběr (locutions)
nemaluj čerta na + ?
Funkční přístup
 Existuje celá řada typologií

V ČR – František Čermák (rozsáhlá bibliografie, vychází z ČNK)


FJ




Langue française 150 (tématické číslo): Collocations, corpus, dictionnaires, 2006
Anderson, Wendy J. (2006), The Phraseology of Administrative French. A corpusbased study. Amsterdam-New York, Rodopi.
G. Williams...
IJ


např.: Syntagmatika slovníku: typy lexikálních kombinací. In: Čeština –
univerzália a specifika 3, Brno, 2001.
Marco Baroni, Elisabetta Ježek...
ŠJ

Např.: Joaquín Giráldez Ceballos-Escalera, LAS COLOCACIONES LÉXICAS EN EL LENGUAJE
JURÍDICO DEL DERECHO CIVIL FRANCÉS. PhD. dizertace, UNIVERSIDAD COMPLUTENSE DE
MADRID.
Čermák - typologie
a: termínové kolokace (víceslovné
termíny)
1 pravidelné
b: propriální kolokace (víceslovná
propria)
A Systémové
2 nepravidelné :
idiomatické kolokace (idiomy a frazémy)
a: běžné kolokace (gram-sémantické
kombinace)
3 pravidelné
b: analytické kombinace tvarů (analytické
formy)
B Textové
a: individuální metaforické kolokace
(autorské metafory)
4 nepravidelné
b: náhodné kombinace sousední
c: jiné kombinace (blábol)
Otevřené otázky
 ... jaká kritéria jsou použita?
 Frekvenční: ustálenost (typický – běžný
– řídký – potenciální)
 Sémantická
 lze dané jednotky kombinovat?
 je význam celku prediktabilní?
 odkazuje na jasně daný koncept?
 Formální
 existují formální restrice?
Funkční klasifikace kolokací:
Marco Baroni
Volné
kombinace
(Combinazioni
libere)
lavare la macchina
(umýt auto)
quaderno rosso
(červený sešit)
Omezené
kombinace
(Combinazion
i ristrette)
Vázané
kombinace
Kolokace
(Collocazioni)
parcheggiare la macchina
(zaparkovat auto)
capelli biondi
(blond vlasy)
Konstrukce
s kategoriálním
slovesem
(Costruzioni a
verbo supporto)
fare una telefonata
(uskutečnit telefonní hovor)
prendere sonno
(být přemožen spánkem)
Frazeologismy
(Espressioni
idiomatiche)
Giovanni ha cantato
(Giovanni zazpíval, tj. vyzradil
tajemství)
Ostatní kolokace
stendere un documento
(sepsat dokument)
disco fisso
(pevný disk)