زبانشناسی پیکرهای شناختی
Download
Report
Transcript زبانشناسی پیکرهای شناختی
زبانشناس ی پیکرهای شناختی
رامین گلشائی
پژوهشگاه علوم و فناوری اطالعات ایران
1
علوم شناختی زبان
• علوم شناختی نسل اول (دهة )1950
– همزمانی با شکلگیری علوم رایانه بعد از جنگ جهانی دوم
– استفاده از روشهای منطقی و الگوریتمی در مطالعة ذهن
– قائل به دانش ذاتی و یادگیری از طریق سازوکارهای دامنهمحدود
• علوم شناختی نسل دوم (دهة )1980
– ذهن بهمثابة سیستم دینامیک و متاثر از جسم
– استفاده از روشهای دادهبنیاد و تجربی در مطالعة ذهن
– قائل به یادگیری از طریق سازوکارهای عمومی ذهن
2
زبانشناس ی زایش ی
)(Generative Linguistics
• شکلگیری زبانشناس ی زایش ی در ( 1957انقالب زبانشناس ی)
• نگاهی نوین به زبان:
–
–
–
–
–
–
–
نظریهای الهامگرفته از منطق و ریاضیات
قائل به جدایی قوة زبان از سایر قوای شناختی (نظیر حافظه،
ادراک ،مفهومسازی و غیره)
خودمختاری نحو و جدایی آن از معنا (سیستمهای الگوریتمی)
دستور زبان به عنوان مولد ریاض یوار جمالت نامتناهی
کاربرد زبان جایی در دانش زبانی افراد ندارد.
یادگیری زبان از تجربه امکانپذیر نیست ،لذا قسمت عمدة آن ذاتی است.
ً
روش تحلیل :عمدتا قیاس ی و مبتنی بر شم زبانی )(Schönefeld, 2011
3
زبانشناس
•
•
•
•
•
•
•
ی شناختی )(Cognitive Linguistics
شکلگیری از دهة 80میالدی
زبان در تعامل با دیگر قوای شناختی است (نظیر حافظه،
مفهومسازی ،ادراک ،و غیره).
معنی اصلیترین بخش از دستور زبان است.
دستور زبان انعکاس ی از سیستم مفهومسازی در مغز است.
دانش زبان بهواسطة کاربرد آن شکل میگیرد.
بخش عمدة فراگیری زبان به صورت استقرایی ) (inductiveو بر اساس
دادههای موجود در محیط کودک صورت میگیرد.
روش تحلیل :تجربی و دادهبنیاد
4
دادههای تجربی یا شم زبانی؟
• در زبانشناس ی زایش ی:
– اهل زبان بهترین مرجع برای تعیین دستوری/نادستوری بودن جمالت زبان هستند.
– قضاوت اهل زبان مبنای نظریهپردازی و مطالعات زبانی است.
• مشکالت شم زبانی بهعنوان منبع اصلی دادهها:
ً
• حافظه انسان محدود است (مثال نمی توان به تمام معانی عناصر زبانی دسترس ی داشت).
• اهل زبان عملکرد خوبی در توصیف دانش زبانی خود بهصورت خارج از بافت ندارند
)(Sinclair, 1991
• تنوع دانش زبانی اهل زبانی منجربه تضاد در قضاوت شمی میشود.
5
پیکرههای زبانی
•
•
•
•
•
پیکره = متون زبانی (گفتاری و نوشتاری) الکترونیکی که بهصورت طبیعی توسط اهل زبان
تولید شدهاند (مانند متون روزنامهای ،گفتگوهای تلفنی ،غیره).
پردازش توسط رایانه و فاقد محدودیتهای حافظة انسان
امکان بررس ی دقیقتر زبان در بافت کاربردیاش.
زبانشناس ی شناختی
زبانشناس ی پیکرهای رویکردی تجربی و مبتنی بر
دادههای پیکره به مطالعة زبان است.
کاربرد زبان
بهمثابة ابزار برای مطالعة کاربرد زبان
)(Language use
• روششناس ی بالقوه برای تحقیقات زبانشناس ی شناختی
زبانشناس ی پیکرهای
(بهمثابه ابزار)
6
پیکرهها و زبانشناس ی شناختی
• بررس ی تاثیر بسامد کاربرد بر تولید زبان
– تولید زبان تحت تاثیر تجربة قبلی گویشور زبان است.
ً
– مثال میان بسامد واژهها (یا عبارات) و طول (آوایی) آنها همبستگی منفی وجود دارد
)(Bybee, 2001; Zipf, 1935
– کاهش واکهای در زبان انگلیس ی
)(Hooper, 1976
– تنها %50از کلمات گفتار پیوسته درخارج از بافت گفتار قابل تشخیص هستند%50 .
دیگر بهکمک عوامل معنایی و از جمله بسامد کاربرد کلمه (که آن را پیشبینیپذیر
میکند) قابل تشخیصاند ).(Pollack and Picket, 1964
7
پیکرهها و زبانشناس ی شناختی
• بررس ی تاثیر بسامد کاربرد بر درک زبان
– تفسیر ساختار زبانی تحتتاثیر تجربة پیشینی فرد از زبان است.
ً
ی
– مثال ابهام ساختار ):(Ford et al., 1982
%90
%95
oبررس ی پیکرهای ):Jurafsky (1996
%75
%80
discuss + NP
keep + NP + PP
8
پیکرهها و زبانشناس ی شناختی
• فراگیری زبان 1
– اطالعات آماری در فرآیند یادگیری زبان نقش اساس ی ایفا میکنند
()Diessel, 2007
– کودکان قابلیت باالیی در کشف الگوهای توزیعی زبان دارند
– کودکان 8ماهه قادرند احتمال انتقالی ) (transitional probabilityرا در
گفتار پیوسته تعیین کنند )))Saffran et al., (1996
)(Saffran, 2001
9
پیکرهها و زبانشناس ی شناختی
• فراگیری زبان ( 1ادامه)
– )Saffran et al., (1996
– کودکان 8ماهه 2دقیقه در معرض شنود چهار ناکلمه قرار گرفتند.
– آزمون:
• موقعیت :1شنود ناکلمهها به صورت تصادفی
• موقعیت :2شنود هجاهای جداشده از ناکلمهها به صورت تصادفی
… [bi-da-ku] – [tu-pi-ro] – [ pa-do-ti] -
…ro-pa-ku-pi-do-da-tu-ku-go-ro-bu-
tupiro
golabu
bidaku
padoti
موقعیت 1
موقیعت 2
10
پیکرهها و زبانشناس ی شناختی
• فراگیری زبان 2
– فرضیة «فقر محرک» ،بنیادیترین فرضیة زبانشناس ی زایش ی در فراگیری زبان
)Poverty of stimulus (Chomsky, 1980
– فرضیة «فقر محرک» :دادههای محیطی غنای الزم برای شکلدهی به دانش دستور زبان را ندارد.
1) The man is tall
?Is the man tall
2) The man who is hungry is ordering dinner.
کمتر از ٪1دادهها در CHILDES
(پیکره گفتار کودکان)
?ordering dinner
– شواهد جدید در اتکای کودک به اطالعات آماری
Q2) Is the man who is hungry
غیرمستقیم )(Reali & Christiansen, 2005
– آموزش یک مدل آماری دو نگاشتی ) (bigramو سهنگاشتی ) (trigramبر روی پیکرة Bernstein-Ratner
)( (1984گفتار ضبظشدة 9مادر خطاب به کودکان 22-13ماهه در بازة زمانی 4تا 5ماه)
– آزمون نتایج بر روی جمالت سوالی ساختهشده از دادههای پیکره و دادههای دیگر.
دونگاشتی
سهنگاشتی
11
پیکرهها و زبانشناس ی شناختی
• فراگیری زبان ( 2ادامه)
)(Reali & Christiansen, 2005
٪96تعداد جمالت دستوری که بهدرستی دستوری تشخیص داده شدهاند (ستونهای سفید) ٪4 -تعداد جمالت غیردستوری که بهاشتباه دستوری تشخیص داده شدهاند (ستونهای تیره)
12
پیکرهها و زبانشناس ی شناختی
• معنیشناس ی شناختی 1
– )Golshaie & Golfam (in press
– بررس ی تاثیر بسامد کاربرد بر قدرت برانگیختگی استعارههای مفهومی در زبان فارس ی
– پیکرة 50میلیون کلمهای همشهری ،بررس ی 9استعاره مفهومی،
آزمایش زمان واکنش )(ms
عبارت استعاری کمبسامد
عبارت استعاری پربسامد
فاقد استعاره
13
پیکرهها و زبانشناس ی شناختی
• معنیشناس ی شناختی ( 1ادامه)
– تاثیر بسامد کاربرد بر قدرت برانگیختگی استعارههای مفهومی
)Golshaie & Golfam (in press
ی
غیراستعار
پربسامد
کمبسامد
14
پیکرهها و زبانشناس ی شناختی
• معنیشناس ی واژگانی و فرهنگنگاری
.1تعیین پروفایل معنایی واژهها )(semantic profile
– بررس ی فعل causeدر پیکره 1میلیون کلمهای (Stubbs, 1995) LOB
– ٪80باهمآییها منفی ٪2 ،مثبت
.2مدخلنویس ی
– «هدیه گرفتن» یا «گرفتن» بهعنوان مدخل فرهنگ لغت؟
– سیفاللهی و طبیبزاده (« :)1392هدیه» مفعول فعل سادة «گرفتن» است.
– بررس ی فعل «هدیه گرفتن» در پیکره همشهری حاکی از فعل مرکب بودن آن است:
•
•
در بهار امسال ایرانیان 580میلیون تومان هدیه گرفتند...
ما فقط یک ساعت از مقامات هدیه گرفتیم.
15
جمعبندی
• زبانشناس ی شناختی ،محصول نسل دوم علوم شناختی است.
• زبانشناس ی شناختی با روششناس ی دادهبنیاد ،تجربی و فراتر از شم زبانی سازگار است.
• رویکرد پیکرهبنیاد به زبان ،روش ی ّ
کمی ،عینی و مبتنی بر دادههای واقعی کاربرد زبان است.
• پیکرهها منبع مناسبی برای استخراج اطالعات بسامد کاربرد و هموقوعی عناصر زبانیاند.
• افزایش بسامد کاربرد باعث کاهش طول واژگانی و صورت آوایی میشود.
• افزایش بسامد کاربرد ،بازشناس ی کلمات در گفتار پیوسته را پیشبینیپذیر میکند.
• روشهای پیکرهای منجربه یافتههای جدید در مورد فراگیری زبان شده است.
• روشهای پیکرهای در حوزه معنیشناس ی شناختی و واژگانی کاربردهای گسترده دارند.
16
منابع
.104-93 ،6 و5 ، چه زنجیرههایی فعل مرکب نیستند؟ فرهنگنویس ی.)1392( امید، و طبیبزاده، مهربانو،سیفاللهی
•
•
•
•
•
•
•
•
•
•
•
17
•
•
Bybee, J. L. (2001). Phonology and language use. Cambridge: Cambridge University Press.
Chomsky, N. (1980). Rules and representations. Cambridge, MA: MIT Press.
Diessel, H. (2007). Frequency effects in language acquisition, language use, and diachronic change. New Ideas
in Psychology, 25, 108-127.
Ford, M., Bresan, J., & Kaplan, R. M. (1982). A competence-based theory of syntactic change. In J. Bresan (Ed.),
Mental representations and grammatical relations (pp. 727–796). Cambridge, MA: MIT Press.
Golshaie, R. and Golfam, A. (in press). Processing conventional conceptual metaphors in Persian: A corpusbased psycholinguistic study. Journal of Psycholinguistic Research.
Hooper, J. B. (1976). Word frequency in lexical diffusion and the source of morphophonological change. In W.
Christie (Ed.), Current progress in historical linguistics (pp. 96-105). Amsterdam: North Holland.
Jurafsky, D. (1996). A probabilistic model of lexical and syntactic access and disambiguation. Cognitive Science,
20, 137–194.
Saffran, J. R. (2001). Words in a sea of sounds: The output of infant statistical learning. Cognition, 81, 149–
169.
Saffran, J. R., Aslin, R. N., & Newport, E. L. (1996). Statistical learning by 8-months-old infants. Science, 274,
1926–1928.
Schönefeld, D. (2011) On evidence and the convergence of evidence in linguisti research. In Doris Schönefeld
(Ed.), Converging Evidence: Methodological and Theoretical Issues in Linguistic Research, pp. 1-32.
Stubbs, M. (1995). Collocations and semantic profiles: On the cause of the trouble with quantitative studies.
Functions of Language, 2, 23-55.
Zipf, G. (1935). The psycho-biology of language. Boston: Houghton Mifflin.