Wat is taalkunde?

Download Report

Transcript Wat is taalkunde?

Taalkennis, taalverwerving, en taalevolutie

Henri ëtte de Swart

Inleiding op vandaag

Indeling van het vakgebied Formele structuur van taal.

Taal in het brein: software en ‘wetware’, taal en denken.

Hoe komt taal in het brein?  (i) eerste taalverwerving  (ii) taalevolutie Literatuur: Kirby (2007)

Taal en communicatie

Spreker boodschap Hoorder Begrip Verstaan Formulering Horen Spreken spraakklanken

Taalkennis

Het menselijk taalvermogen is complex Mensen hebben veel soorten kennis over hun taal:  Kennis over productie en begrip van klanken  Kennis over productie en begrip van woorden  Kennis over productie en begrip van structuren (complexe woorden, combinaties van woorden in zinnen, combinaties van zinnen in teksten).

Die kennis is onbewust: je kunt het meestal niet uitleggen.

Kennis van woorden

We weten wat welk woord bij dit concept hoort. We weten hoe we dat woord uitspreken.

We kunnen het woord herkennen als iemand anders het uitspreekt.

We weten wat variaties op het woord betekenen:

tafel-s, tafel-tje, tafelen.

Kennis van wat niet kan

‘Mrok’ kan geen Nederlands woord zijn, ‘wrok’ is dat wel.

‘Man de vrouw kust elke’ is geen Nederlandse zin, ‘Elke man kust de vrouw’ is dat wel.

Ook al weten we niet wat een ‘flimp’ is of ‘plit’, toch begrijpen we de essentie van: ‘Elke flimp is plit’ (als iemand een voorbeeld laat zien van een ‘flimp’ weten we gelijk dat dit object de eigenschap ‘plit’ heeft)

Taalkunde opgedeeld (1)

Fonologie (klankleer,

p/b, a/o

).

pak/bak/bok.

Fonemen hebben geen betekenis, maar zijn betekenisonderscheidend.

Fonetiek (fysische eigenschappen van spraak, geluidsgolven, intonatie).

B.v. de klankloze ‘k’ wordt in bepaalde conteksten uitgesproken als klankhebbend, b.v.

zakdoek

.

Fysieke eisen aan spraak

Strottenhoofd (achter in keel, waar luchtweg en slokdarm gescheiden worden) Stembanden (waar lucht door wordt geperst) Mond (tong, lippen: articulatie) Bewegende stembanden tijdens spraak

Verlaagde larynx

Mensen hebben een verlaagd strottenhoofd. Ademhaling en spijsvertering liggen daardoor dicht bij elkaar (‘in verkeerde keelgat schieten’) Baby’s hebben dat nog niet, en kunnen tegelijk drinken en ademhalen.

Nodig voor praten (apen hebben dat niet, en kunnen niet praten).

Taalkunde opgedeeld (2)

Morfologie (vormleer,

kind/kindje, tafel/tafels/tafelen

). Morfeem: kleinste betekenisdragende eenheid. Woordniveau.

Classificatie van morfemen naar hun rol in grotere gehelen: zelfstandig naamwoord, werkwoord, deelwoord, lidwoord, inflectie, derivatie..

Taalkunde opgedeeld (3)

Syntaxis (grammatica) Combinatie van woorden in grotere structurele eenheden (naamwoordelijke constituenten, werkwoordelijke constituenten, zinnen, ..) (boven woordniveau, niet hoger dan zinsniveau)

hij loopt

loopt hij

?

Jan slaat Piet

Piet slaat Jan.

Recursie

Onze kennis staat oneindig veel structuren toe, en in principe oneindig lange zinnen.

Neem ‘Jan slaapt’. Voeg daaraan toe: ‘Ik denk dat..’, Piet hoorde dat..’ De oom van een bijzonder intelligente en succesvolle student van een bevriende professor van mij hoorde dat Jan de auto die ik van de broer van de buurman van mijn tandarts gekregen heb niet wilde poetsen.

Dit spel heeft maar één regel en die luidt: dit spel heeft maar één regel en die luidt: dit ..

Indeling vakgebied (3)

Semantiek : betekenis van woorden en constructies binnen de taal

pen/schrijven/papier

(lexicale semantiek),

naar/langs/richting de rivier alle/geen/de meeste boeken (

semantiek van complexe structuren) Pragmatiek (taal in contekst)

ik/hier/nu:

deixis),

mogen/moeten

(implicaturen), beleefdheid

(u/jij),

teksten (discourse semantiek).

Rode draad door alle disciplines

Fonologie – morfologie – syntaxis – semantiek – pragmatiek Methode: vergelijk (een aspect) van natuurlijke taal met een formel taal.

Natuurlijke taal: we hebben meestal geen complete beschrijving.

Formele talen: we hebben expliciete kennis.

Formele eigenschappen van grammatica’s.

Denk ook aan: implementaties, taaltechnologie.

Formele structuur

Chomsky hi ërarchie : indeling in klassen van formele talen naar het type formele grammatika dat alle talen binnen een bepaalde klasse kan genereren.

Oorspronkelijk: informatica, toegepast op natuurlijke taal door Chomsky.

http://nl.wikipedia.org/wiki/Chomsky hi%C3%ABrarchie

Fonologie

Talen hebben beperkingen op welke fonemen op elkaar mogen volgen, b.v. ‘mrok’ vs. ‘wrok’.

Japans: sofuto wea (software) *soft  sofuto Vraag: wat voor soort grammatica heb je hiervoor nodig?

Formele talen (1)

Een formele taal is een verzameling symbolen-rijtjes (strings) o Formele talen over het alfabet {0,1}: {01, 0101, 010101, 01010101, …} o o {01, 001, 0001, 00001, ..} {01, 0011, 000111, 00001111, …} Wat is een welgevormde uitdrukking?

Formele talen (2)

o o Formele talen over het alfabet {a, b, c, …z} {ab, ac, ad, …, abab, abac, …} {sofuto, kanazawa, riku, arugato, …} Wat is een welgevormde uitdrukking?

Formele talen (3)

Formele talen over het alfabet {Jan, Marie, slaapt, zingt, haat, kust, …} {Jan slaapt, Marie zingt, Jan haat Marie, Marie kust Jan, …} Wat is een welgevormde uitdrukking?

algoritme

Formele grammatica’s

Een taal kun je karakteriseren door de grammatica (automaat) die ‘m herkent.

{01, 0101, 0101, 010101, ...}: finite state {01, 0011, 000111, 00001111, …}: phrase structure grammar.

Finite state grammatica

Hiermee kunnen we een eindige toestands automaat bouwen voor de taal {01, 0101, 010101, 01010101, …}.

Push down automaat

Geen eindige toestandsautomaat voor {01, 0011, 000111, 00001111, …}, want we moeten ‘onthouden’ dat er evenveel nullen als enen zijn ~ stapelautomaat.

S  S  01 0S1 Geheugen bestaat uit een stack: last in first out.

Recursie

Finiete bouwstenen + beperkt aantal regels  oneindig aantal uitdrukkingen.

Recursie in finite state sekwenties: (AB) n . ABABAB,… Recursie in contextvrije talen: A n B n . AAA…BBB… Phrase structure: [A[A[AB]B]B].

Drie klassen talen

Reguliere grammatica (finite state): Contekstvrije grammatica (push down automaat) Contekstgevoelige grammatica gebonden T üring machine).

(lineair

Contekstgevoelige grammatica

Lineair gebonden automaat: geheugen is tape; regels kunnen op verschillende cellen aangrijpen. Tape is oneindig, maar alleen eindig deel toegankelijk.

Restrictie op contekstgevoelige taal: geen string afbeelden op een kortere string dan zichzelf.

Chomsky hiërarchie

Elke taal die je kunt herkennen met een push down automaat kun je ook herkennen met een eindige toestands automaat (maar niet andersom).

Contekstvrije talen Reguliere talen

Formele talen en natuurlijke talen

Veel fonologische regels kun je schrijven m.b.v. een eindige toestandsautomaat (b.v. restricties op foneem volgorde in Japans) Voor syntaxis lukt dat niet: minimaal phrase structure automaat (contekstvrije grammatica).

Hebben we te maken met contekstvrije grammatica?

Nederlands/Duits

…omdat ik Jan Piet de nijlpaarden zag helpen voeren. …weil ich Jan Piet die hippopotamus füttern helfen sag.

Taal in het brein

Taal als kennissysteem: ‘software’.

Opgeslagen in brein: ‘wetware’ Bij rechtshandige mensen vooral in linkerhersenhelft.

Gebieden specifiek voor taal: Wernicke ’s gebied (taalbegrip), Broca ’s area (spraakproductie).

Taal: uniek menselijk

Wat is er uniek aan menselijke taal?

Meerdere kandidaten:  (i) recursie Chomsky, Hauser and Fitch (2004)

Science.

(ii

) dubbele articulatie  (iii) parametrische variatie  (iv) groot lexicon Homo erectus

Onderzoek naar taalevolutie

Taal laat geen fossielen achter – hoe doe je onderzoek naar taalevolutie?

Vergelijkend gedragsonderzoek (communicatie bij dieren) ‘Restricted linguistic systems’ waaruit je conclusies trekt over taalevolutie (b.v. pidgins, homesign) Computationele modellering.

Lexicon bij dieren

Rhesusapen: 3 verschillende roepen, voor verschillende roofdieren.

http://www.wjh.harvard.edu/~mnkylab/m edia/vervetcalls.html

Lexicon beperkt tot 3 uitdrukkingen – geen samenstelling tot complexere uitdrukkingen.

Lexicon bij getrainde dieren

mensen, 6 jaar: 14.000 woorden volwassen mensen: 60.000 woorden tussen mensen opgegroeide dieren:  Washoe (chimpanzee): 250 woorden  Koko (gorilla): 1000-2000 woorden  Rico (border collie): 200 woorden Vergelijkbaar: dolfijnen, zeeleeuwen, papagaaien

Links

Sign language used by Koko the gorilla http://www.koko.org/world/signlanguage .html

Spoken language understanding by Kanzi the bonobo http://www.greatapetrust.org/media/vide o-bonobo-kanzi.php

Recursie in apen

Fitch en Hauser (2004): Tamarin monkeys kunnen een finite state grammar leren herkennen, maar geen contextvrije, phrase structure grammatica.

Claim: phrase structure grammatica (contekstvrij/gevoelig) uniek menselijk.

Link

Computational Constraints on Syntactic Processing in a Nonhuman Primate

W. Tecumseh Fitch and Marc D. Hauser

Science

16 January 2004: Vol. 303. no. 5656, pp. 377 – 380.

http://www.sciencemag.org/cgi/content/full/30 3/5656/377/DC1 Maar vgl. recente nieuwe experimenten waar apen het beter zouden doen. http://news.bbc.co.uk/2/hi/8139322.stm

Recursie in spreeuwen

Gertner, Fenn et al. (2006),

Nature

: motieven (‘rattle’, ‘warble’). Sekwenties worden herkend in finite state grammar en contekstvrije grammatica.

Niet alleen geheugen, generalizatie naar nieuwe patronen: regels!

Vogelzang heeft geen compositionele betekenis. Phrase structure?

Syllabe structuur in vinkenzang

Link

Recursive syntactic pattern learning by songbirds,

byTimothy Q. Gentner, Kimberly M. Fenn, Daniel Margoliash, Howard C. Nusbaum,

Nature

440, 1204 – 1207. http://www.nature.com/nature/journal/v440/n7 088/abs/nature04675.html

Grote discussie op Language Log over interpretatie van de resultaten.

Universele recursie?

Everett (2005),

Science

: Pirah ã geen syntactische embedding.

Jan leest. Jan leest dat Marie droomt. Jan leest dat Marie droomt dat Tom kwam.

Pirah ã:

Jan zegt. Marie droomde. Tom kwam.

Links

Dan Everett (2005) Cultural constraints on grammar and cognition in Pirah ã,

Cultural Anthropology

46, 621-646.

More on Dan Everett: http://www.llc.ilstu.edu/dlevere/ More on Pirah ã: http://en.wikipedia.org/wiki/Pirah%C3%A 3_language

Dubbele articulatie

Fonemen zijn zelf betekenisloos, maar vormen in combinatie betekenisvolle eenheden (morfemen, woorden):

pak/bak/bok

.

Die woorden kunnen in combinatie met elkaar weer nieuwe betekenissen uitdrukken (compositionele semantiek).

Voordeel van dubbele articulatie

Door deze dubbele articulatie kunnen we met weinig klanken toe (beperking van spraakproductie organen), en kunnen we toch oneindig veel betekenissen uitdrukken.

Niet in dieren

Spreeuwen: ‘rattles’ en ‘warbles’ (motieven), maar geen ‘fonemen’, geen compositionele semantiek.

Vervet monkey calls: verschillende calls, voor verschillende roofdieren (arend, luipaard, slang), marginale sekwentie van calls, geen ‘fonemen’, geen compositionele semantiek.

Parametrische variatie

Vogelzang van spreeuwen op verschillende geogra fische locaties nauwelijks verschillend.

Calls van apen overal gelijk, gebaren wel groepsgebonden.

Mensentaal: grote variatie in lexicon, parametrische variatie in fonologie, syntaxis (binnen UG).

Joint attention als basis

Mensen: joint attention driehoek spreker-hoorder-referent. Hebben mensenkinderen van nature (v.a. 3 maanden). Tomasello Bij apen veel minder ontwikkeld.

samenwerking, vertrouwen, culturele ontwikkeling ~ wil tot communicatie

Conclusie

Groot gat tussen communicatiesystemen van dieren (anders dan de mens) en de mens.

Hoe heeft de mens dat gat overbrugd?

Waren er tussenstadia?

vgl. discussie over ontwikkeling oog in evolutionaire biologie).

Wat heb je aan een ‘beetje oog’?

http://www.kennislink.nl/publicaties/oge n-in-de-evolutie Ogen van weekdieren:

Wat heb je aan ‘beetje taal’?

Tussenstadium in taalevolutie: prototaal.

Evidentie komt van ‘restricted linguistic systems’: pidgins, homesign, L2 verwerving.

Eenvoudig taalsysteem, toch nuttig in communicatie ~ prototaal.

Pidgin

Pidgin zijn talen die spontaan ontstaan door contact tussen taalgemeenschappen Meestal wordt de taal van de meest dominante gemeenschap vereenvoudigd Klein lexicon, eenvoudige zinsbouw, gebruikt als

lingua franca

, nooit L1.

Indien het contact aanhoudt, ontstaat een creole: wordt geleerd door kinderen.

Hawaiian pidgin

Ontstaan als lingua franca onder plantagewerkers.

Grotendeels gebasseerd op het Engels. Ook invloed van Hawaiiaans, Portugees, Cantonees, Japans.

Geen lidwoorden, geen markering van tijd, geen copula’s (

is, zijn

), geen markering van geslacht (

hij/zij

) of getal (sg/pl).

Hawaiian pidgin

When time up I go to boss and say you take old woman back now. He get verra mad, and make me pay all up. Marie, he good woman, but talk, talk all time, make me mad then pilikia again.

(Een Portugese immigrant, 19e eeuw.) Uit: Hopper & Traugott 2003, citerend S. Roberts 1998, citerend Vergne 1898.

Prototaal

Eigenschappen van prototaal: Beperkt lexicon, mogelijk geen onderscheid tussen naamwoorden en werkwoorden.

Simpele Predikaat-argumentstructuur (geen kwantoren, etc.).

Rol van informatiestructuur: agent first, focus last.

Transitie naar taal

Prototaal  verdere ontwikkeling van cognitie (o.a. geheugen)  ontwikeling van taal  verdere cognitie  etc.

Leerbaarheid: overdracht op volgende generatie. Verankerd in genen? (Baldwin effect) Beperkt ons brein mogelijke talen door beperkingen op leerbaarheid van taal?

Cultuur

Rol van cultuur: begravingsrituelen, maken van objecten zoals kralen, ontwikkeling van religie.

Taal als ‘niche’: anders dan andere soorten.

Ontwikkeling van externe geheugens: schrift.

Tot slot

Kennis van taal is complex: veel verschillende soorten van kennis van taal.

Taalevolutie vereist interdisciplinair onderzoek: veel verschillende factoren die met elkaar samenhangen (fysiek, cognitief, cultureel).

Om verankering taalkennis in menselijke cognitie en ontwikkelingen als taalevolutie en taalverwerving beter te begrijpen moeten we meer weten van structuur van taal.