LanstyakIstvan_Termini10

Download Report

Transcript LanstyakIstvan_Termini10

Magyar Tudományos
Akadémia
Budapest, 2011. november 24.
Lanstyák István–Benő Attila
HATÁRTALANÍTÁS
ÉS HT-SZÓTÁR
Miről lesz szó?
1. Bevezetés: alapfogalmak
– határtalanítás
– ht-szótár
2. Ez történt (a határtalanítás rövid története,
tanulságokkal)
3. A Termini magyar–magyar szótár és
adatbázis bemutatása
1. Bevezetés
Alapfogalmak
Határtalanítás
– banalitás: magyar ≠ magyarországi, ahogy
sokan hiszik Magyarországon
– határtalanítás általában
– szóhatártalanítás
GYIK: tyepi mint „rendes szó”)
– névhatártalanítás
– Kárpát-medencei magyar nyelvi korpusz
Ht-szótár
– Termini magyar–magyar szótár és
adatbázis
(magyar–magyar–magyar–magyar–
magyar–magyar–magyar–magyar
szótár )
2. Ez történt
Előzmények
–1994
Tájszógyűjtés
– a Magyar Nyelvjárások Atlasza gyűjtési
munkálatai során az Atlasz munkatársai
néhány Fv szót is följegyeztek (tájszóként)
és közre is adtak a szlovákiai kutatópontok
tájszavai közt
– nem tudni, hogy tudatában voltak-e annak,
hogy ezek nem „ártatlan” tájszavak,
hanem a nyelvművelők által
megbélyegzett elemek
Nyelvművelői megközelítés
– „nyelvhelyesség” és a ht-szavak: a
határon túli magyarok nyelvhasználatában
nincs olyan fogalom, amelyet ne lehetne
„magyarul“ (értsd: magyarországi magyar
nyelven) kifejezni, ezért a sajátos határon
túli magyar szavak használata még a
nyelvhasználat alacsonyabb szintjén, a
mindennapi beszélt nyelvben sem
indokolt, az írásbeliség magasabb
szintjein pedig szóba sem jöhet
→ nyelvi homogenista
ideológia, amely abban a
korban egyeduralkodó volt
!!! a politikai rendszer
homogenista törekvései is
hathattak rá
a) közvetlen kölcsönszavak: nagyfokú
elutasítás (nem magyar szavak, sőt nem is
szavak)
b) közvetett kölcsönszavak:
– egy részük: „fordítási hiba”
– más részüket: kényszerűségből
elfogadták
! egyik csoportot sem tartották tudományos
vizsgálatra érdemesnek
→ nyelvi performancionalista ideológia
– a platonista ideológia egyik válfaja
– domináns volt a kor nyelvművelésében
– megtagadta a nyelvi státuszt azoktól az
elemektől, amelyek a szisztemista és/vagy
purista ideológia szempontjából nem
voltak megfelelőek (pl. a szó
idézőjelezése)
Helyesírási kéziszótár és
Magyar helyesírási szótár
– (tudtunkkal) egyedüli magyarországi
kiadvány, amely nem megbélyegzési
szándékkal közölt határon túli szókészleti
elemeket
– HKsz. (1988): alapiskola 'általános iskola‘,
egységes földműves-szövetkezet
'mezőgazdasági termelőszövetkezet‘;
Duna Menti Múzeum
– MHSz. (1999): alapiskola, Duna Menti
Múzeum
Szombathely 1983
– 4. nemzetközi magyar nyelvészkongresszus
– Pete István 1988. A magyar nyelv
állami változatai (Kárpátukrán
változat).
Kiss Jenő–Szűts László szerk.,
A magyar nyelv rétegződése I–II,
779–789.
Budapest: Akadémiai Kiadó.
– a magyar nyelv állami változatainak
fogalma
– a szótárkészítők a jövőben „nagyobb
mértékben“ legyenek tekintettel a
magyarországi standardtól eltérő ht
szókészlettani sajátosságokra
→ mérföldkő: a pluralista és vernakularista
nyelvi ideológiák nyílt megjelenése
! a „nyelvmentők” részéről visszhangtalan
maradt
Eger 1994
– 6. nemzetközi magyar
nyelvészkongresszus
– Lanstyák István–Szabómihály
Gizella 1994/1998. Standard –
köznyelv – nemzeti nyelv. Kontra
Miklós--Saly Noémi szerk.,
Nyelvmentés vagy nyelvárulás?
(Vita a határon túli magyar
nyelvhasználatról.), 211–216.
Budapest: Osiris Kiadó.
– a standard minden kritériumának megfelelő
szókészleti elemek bemutatása
– konklúzió:
– a Fv nyelvváltozatok sajátos
szókincsének három rétege: standard,
köznyelvi, szubstandard
→ ezek közül a standard és a köznyelvi
elemeket szükséges volna felvenni az
ÉKsz. új kiadásába
„Ha nem a magyar nyelv értelmező szótára
szorít nekik helyet, akkor vajon milyen nyelvű
szótárba kell őket utasítani?”
– Pusztai Ferenc 1994. Leíró lexikográfiánk
változó és változatlan feladatai. Magyar
Nyelv 90, 413–421.
– szükség van rá, hogy a ht magyar
nyelvváltozatok formális regisztereiben
használatos elemek egy része bekerüljön
a szótárakba
!!! ezek közt nem lehetnek „kevert“ elemek
!!! a készülő kiadásban még nem lehet erről
szó, megfelelő háttérkutatások hiányában
→ nyelvi purizmus
A „hőskor”
1994–2003
Budapest 1994 ősze
– a Nyelvtudományi Intézet átértékelte az
értelmező kéziszótár új kiadásának
koncepcióját
– Er: Péntek János és Szilágyi N. Sándor
– Fv: Lanstyák István
– Ka: Csernicskó István
(– Va: Ágoston Mihály)
1995 eleje
Pusztai Ferenc 8 irányelve
– 2. irányelv: a szótárba bevett lexéma nem
lehetett volna „kevert elem“ (közvetlen
kölcsönszó, tükörszó, tükörkifejezés,
jelentésbeli kölcsönszó)
→ nyelvi purizmus
– 3. irányelv: adatolható kellett volna legyen
az igényes publicisztikából,
szakirodalomból, sőt a szépirodalomból is,
méghozzá egynél több szerzőtől
→ nyelvi belletrizmus, nyelvi elitizmus,
nyelvi elegantizmus
→ e két irányelv figyelembevételével
egyetlen lexéma se kerülhetett volna be a
szótárba
Szótári munkálatok
1995–2003
– a felkért szakemberek javaslatait Pusztai
Ferenc korrektül bírálta el
!!! egy-egy szó szótárazásának elutasítása
sosem történt pusztán purista
megfontolások alapján, hanem az a szótár
egészének logikájából következett,
legtöbbször a következetesség
szempontjai indokolták
→ Er, Fv, Ka szójegyzékek: három önálló
szójegyzék
– egymástól teljesen függetlenül jöttek létre
– az egyes régiókban dolgozó munkatársak
nem ismerték egymás szójegyzékeit, így
nem is történt köztük semmiféle
egyeztetés
– ennek ellenére vannak a kéziszótárban
„többrégiós” szavak, azok, amelyeket
egynél több régióban javasoltak felvételre
a munkatársak, egymástól függetlenül
!!! a legtöbb közös szó viszont nem
tartalmazza mindhárom régió felségjelzését
→ megtévesztő, hiszen valamely régió
felségjelzésének megléte azt implikálja,
hogy a másik két ht régióban az illető szó
nem használatos
– pl. a blokk ‘lakótelepi panelház; tömbház’
jelentésben az ÉKSz.2-ben csak Er és Fv
szóként van jelölve, holott a Ka
nyelvváltozatokban is használatos (sőt
minden Kárpát-medencei ht régióban)
Példák egyéb „áldozatul esett”
Ka szavakra
– átmegy ‘<betegség, fáradtság stb.> elmúlik,
megszűnik’
– balkon (nem „választékos”), balkonos
– bufet ‘büfé’
– diplom ‘elismerő oklevél’
– elsős ‘elsőéves’, másodikos ‘másodéves’
stb.
– fal ‘szekrénysor’
– fizikai személy ‘természetes személy’
– fogpaszta (nem „régies”)
– halász ‘horgász’, halászik ‘horgászik’
– házasságlevél ‘házassági anyakönyvi
kivonat’
– infarkt ‘(szív)infarktus’
– internát ‘diákotthon’, internátus (nem
„régies”)
– kapitány ‘százados’ (nem „régies”)
– kaszárnya (nem „régies”)
– kibeszéli magát ‘kimagyarázkodik’ (nem
„ritka”)
– kihágás (nem „régies”)
– község ‘önálló jogállású település (város
is)’
– kurz ‘tanfolyam’
– kurzus (nem „kissé választékos”, inkább
„bizalmas”)
– leesik ‘elesik’
– norma ‘szabvány’
– paciens ‘páciens’
– pasztelina, plasztelina ‘gyurma’
– polgár ‘lakos’
– poliklinika ‘rendelőintézet’
– prorektor ‘rektorhelyettes’
– rászed ‘rávesz’
– respekt ‘tekintély’
– fizetetlen szabadság ‘fizetés nélküli
szabadság’
– szesztra ‘nővér, ápolónő’
– szirup ‘szörp’
– szvetter ‘kardigán’ (nem „régies”)
– tanító ‘tanár’
– útadó ‘súlyadó’
– vetrovka ‘dzseki’
– vizsgán van ‘vizsgázik’
Hu gondok
!!! mintha még a Hu anyaggal se történt
volna mindig egyeztetés
– respekt
→ valójában a nyelvi konzervativizmus
(nyelvi purizmus?, nyelvi originalizmus?
érvényesülése)
Stílusminősítés
– az egyeztetés hiánya miatt még a
többrégiósként felvett szavakban sem
biztos, hogy az azonos stílusminősítés
azonos stílusértéket takar-e, ill. az eltérő
stílusminősítés eltérő stílusértéket takar-e
(nem kaptunk szerkesztési útmutatót, sem
irányelveket)
A Termini Kutatóhálózat
szóhatártalanító
munkálatai
2003–
A „papír nélküli
papírszótár” korszaka
(2003—2007)
Regionális szólisták
2003 –2004
Papír nélküli „papírszótárak”
– regionális szólisták az Osiris Idegen szavak
szótára számára
– munkaeszközök:
a) szövegszerkesztő: papírszótár típusú
szócikkek
b) levelezőprogram: kapcsolattartás,
egyeztetés, anyagok átküldése egymásnak
c) koordinátor
– listák összehasonlítása
– változtatások bevitele
– értelmezések egységesítése
– stílusértékek egymáshoz viszonyítása
– példamondatok egyeztetése
– javaslatok új szócikkekre
→ „közvetett közös fejlesztés”
„Csatlakozási tárgyalások”
– 2003 őszén: a négy nagyrégióban
kezdődtek a munkálatok (Er, Fv, Va, Ka)
– 2003 végén: két kisrégió csatlakozása
(Mv, Őv)
– 2004 tavaszán: a hiányzó kisrégió
csatlakozása (Hv)
Ht-lista
2004–2007
– 2004 júniusában: a hét régió saját
szójegyzékeinek összeolvasztása
→ ht-lista
– áttekinthetőbbé vált a nyelvi anyag, s
némileg könnyebben kezelhetővé is
– minden változtatást a koordinátor vitt be (a
ht-lista szétfejlődésének megelőzése
érdekében)
Ht-online
(2007—)
– 2006 kora tavasza: Juhász Tihamér
kezdeményezése
→ fordulópont a szóhatártalanítás
történetében
– 2007 folyamán a szótár anyaga felkerült a
világhálóra, s létrejött egy interaktív online
szótár, amely fokozatosan multifunkciós
adatbázissá bővült
a) szótárként: hozzáférhetővé vált a
látogatók számára
b) multifunkciós adatbázisként: hatalmas
lehetőségeket magában rejtő, hatékony
munkaeszközzé vált az szerkesztők, ill.
kutatók számára
3. A Termini
magyar–magyar
szótár és adatbázis
Főbb jellemzői
1. Az együttműködést segítő
funkciók
a) Szimultán módon elérhető
– egymástól több száz kilométerre,
különböző országokban tartózkodó
munkatársak egyszerre dolgozhatnak
ugyanazzal az adatbázissal
b) Gyors
kommunikációs
lehetőséget biztosít
– ímélküldés a
keresőfelületről
– megjegyzések fűzése az egyes
szócikkekhez, azok részeihez
2. A szerkesztőmunkát
megkönnyítő további funkciók
a) kényelmesen kezelhető szerkesztőfelület
b) listázási lehetőségek,
pl.:
– adathiányos szócikkek
– konstruált
példamondatokat
tartalmazó szócikkek
– belső megjegyzéssel
ellátott szócikkek
– külső megjegyzéssel
ellátott szócikkek
– példamondat nélküli jelentéseket
tartalmazó címszók
– felségjelzések régiók szerint
– teljes lista készítése (→ ezáltal újjáéledt az
egykori ht-lista)
– részleges listák készítése, pl. A–C
kezdőbetűs szócikkek
– regionális listák készítése (→ ezáltal a
megszüntetett regionális listák is
újjáéledtek)
– a külső felhasználók elől elrejtett (nem
kész) szócikkek
c) kimutatások
– pl. példamondattípusok száma
3. A továbbfejlesztést segítő
funkciók
a) listázások
– keresési kifejezések rostált listája
b) kimutatások
(– leggyakrabban megtalált szócikkek)
– felhasználók regisztrációjának időbeli
eloszlása
– keresések
időbeli
eloszlása
4. Felügyeleti és
visszakereshetőségi funkciók
a) a kereső- és a böngészőfelületről elérhető
„módosítási lista”
– a módosítási lista segítségével az egyes
szerkesztők tevékenysége követhetővé és
szükség esetén visszafordíthatóvá vált
→ a program nem egyszerűen felülírja az
aktuális szerkesztés előtti változatot,
hanem meg is őrzi (szerkesztéstörténet)
b) listázások
– egy-egy szerkesztő által módosított
szócikkek jegyzéke
c) kimutatások, pl.:
– egy-egy szerkesztő által módosított
szócikkek száma és időbeli eloszlása
– felségjelzések száma régiók szerint
5. Kutatási funkciók
a) listázások, pl.:
– stílusminősítések
– stílusminősítések kombinációi
– többrégiós szócikkek listája
– egyszerűsített listák készítése (pl. csak
címszót, szófaji minősítést, nyelvtani
alakokat, felségjelzéseket tartalmazók)
b) kimutatások, pl.:
– különbözõ szófajú szavak száma
6. Online szótári funkciók
a) keresés
– címszóban, jelentésben, példamondatban
– szó elején, szó belsejében, szó végén,
teljes egyezéssel
– ékezetes és ékezet nélküli keresés
b) böngészés
– szó elején, szó belsejében, szó végén,
teljes egyezéssel
– választható a teljes szócikk vagy címszó
megjelenítése
7. Interaktivitás
a) „megjegyzés” funkció
a regisztrált felhasználók megjegyzéseket
fűzhetnek az egyes szócikkekhez
b) fórum
(eddig még nem
sikerült aktívvá
tenni)
Újszerű vonások
Többdimenziós
stílusminősítési
rendszer
– az ÉKSz.2-munkálatok során egyértelművé
vált: a hagyományos minősítésekkel
lehetetlen szakmailag korrekt módon
megragadni a ht szókincs változatosságát
(amiképp egyébként a közmagyar
szókincsét is…)
– legnagyobb probléma: a minősítések egy
részének többértelműsége, ill. néhány
minősítés „ideologizáltsága”
A Termini stílusminősítési rendszer
jellemzői:
a) többdimenziós rendszer: a minősítés
különféle szempontjai nem keverednek,
hanem elválnak egymástól
b) a semleges stílusértéket is jelöljük (a
listázások, azaz a kutatás megkönnyítése
végett)
c) nem alkalmazunk ideologikus
minősítéseket, mint az ÉKSz.2 „vulgáris”
és „kiveszőben” minősítése, ill. „pongyola
használatú”, „helyesebben” stb. kitételei
A stílusminősítési
rendszer dimenziói
1. Dialektális dimenzió
– a földrajzi és társadalmi (iskolázottsági,
kétnyelvűségi, korosztályi) dialektusokra
vonatkozó minősítések
2. Regiszterbeli dimenzió
– azok a stílusértékek, amelyekre a
bizonyos specializált tevékenységekhez
vagy élethelyzetekhez kötődő (vagy nem
kötődő) lexémák tesznek szert
3. Stílusváltozati dimenzió
– a beszédhelyzet formalitása által
meghatározott regiszterek alkotják
4. Időbeliség dimenziója
– a nyelv korábbi állapotából fennmaradt
elemek mai nyelvi sajátos stílusértéke
fejeződik ki ezekben a minősítésekben
5. Érzelmi dimenzió
– a lexémákhoz való pozitív vagy negatív
beszélői viszonyulás, érzelmi telítettség
6. Egyéb jelölések
– gyakoriság
– felségjelzések
Példamondatok
minősítése
A példamondatok státusza
– nagyban meghatározza a szövegrészletben
található címszó jelentésének és
stílusértékének megállapítását
A szó és a beszélő régióbeli
hovatartozásának
megkülönböztetése
– ehhez az a felismerés vezetett, hogy egy
beszélő alkalmanként más régió szavait is
használja, s az ilyen használat
dokumentálásának is nagy az értéke
(pl. Hu turisták Er szavakat tanulnak meg, Er
beszélő Szlovákiában vállal munkát, és Fv
szavakat tanul meg)
A példamondatok
nagy száma
– mivel nem korlátoz minket a terjedelem
úgy, mint a papírszótárak esetében,
korlátok nélkül gyűjtjük a
példamondatokat, ha kell, bő kontextussal
(a kontextus segít a jelentés/árnyalat/ és a
stílusérték megállapításában)
→ a Termini-szótár és adatbázis így egyre
inkább „korpusz alapúvá” válik, bár a
„korpusz”-t egyelőre még csak
szövegrészletek képviselik
– fontolóra vesszük, hogy nem lehetne-e a
Termini-szótár példamondatait hasonló
módon generálni egy korpuszból, mint azt
teszi pl. az MNSZ, természetesen
megőrizve szótár jellegét
– ehhez első lépésnek tekinthető a
nemrégiben elkezdett fejlesztés:
példamondatok automatikus keresése az
interneten, a példamondatokat tartalmazó
oldalak automatikus eltárolása
Az eddig megtett út
Az értelmező kéziszótár „blokk”kal kezdődő szócikkbokra
A ht-lista „blokk” szócikke
A Termini-szótár és adatbázis
„blokk” szócikkének
1.változata
(két-két példamondattal)
A Termini-szótár és adatbázis
„blokk” szócikkének
2.változata
(az összes példamondattal)
Tervek és álmok
a) ← a szótári adatbázis korpusz hátterűvé
való alakítása
b) értelmezéseknek a denotátumot ábrázoló
fényképekkel való kiegészítése tárgyat
jelölő szavak esetén
c) azokban az esetekben, amikor a
denotátum helyi kulturális sajátság,
néprajzi leírások beiktatása, ill. belinkelése
(saját adatbázisból)
d) a beszélt nyelvi példamondatok
meghallgathatósága
e) a szótárban közölt elemekre vonatkozó
bibliográfia létrehozása, ill. maguknak a
szövegeknek az összegyűjtése és
belinkelése
→ a fejlesztések nyomán az, ami
szójegyzékként indult, szótárként
folytatódott s többfunkciós adatbázissá
vált, fokozatosan olyan komplex
információs rendszerré nőhetné ki magát,
amely magába foglalná a szótár, a
strukturált adatbázis, a nyelvi korpusz,
valamint a lexikon és az enciklopédia
jellemzőit