الندوة الدولية الأولى للحاسب واللغة الع
Download
Report
Transcript الندوة الدولية الأولى للحاسب واللغة الع
3rd IEEE International Conference on Arabic
Language Processing (CITALA09),
May 4-5, 2009, Rabat, Morocco
بناء معجم التعبيرات المتالزمة والمركبة
آ
تقنيات التعرف ال لي
عزا لدين غازي
،INPMAجامعة محمد بن عبد هللا – فاس
جمعية اللسانيات الحاسوبية العربيةALIA ،
مخطط الورقة
مقدمة،
آ
-Iتقنيات التعرف ال لي على المفردات المركبة والتعبيرات المتالزمة،
-1المتواليات المترابطة وغير المترابطة،
-2تمثيل بيانات المتواليات المركبة والمتالزمة،
آ
-IIخوارزمات التعرف ال لي على المفردات المركبة والمتالزمة (طريقة سيمون اولمان
وإيريك ثرنهر )،)1993
-1وصف المنطقة المعتمة،
-2اصناف البنيات (ملحق،)1
آ
استنتاجات وافاق.
تقديم
آ
يهدف هذا البحث إلى تقديم الدوات اللسانية والمعلوماتية المناسبة لبناء المعجم ال لي
للغة العربية ،باستغالل التقنيات المعلوماتية التي ابانت عن نجاعتها في معالجة لغات
عديدة في سائر المستويات المختلفة وخاصة الك فاية المعجمية .وذلك بهدف وضع معجم
آ
الي يرتكز على وصف المفردات اللغوية بسيطها ومركبها،يالءم شكل ومحتوى مداخل
ومواد المعجم المتمثلة في المتواليات المركبة و المتالزمة ،مستغلين ما توصلت إليه
آ
تقنيات وطرق التعرف ال لي باعتبارها خوارزمات تحليل المنطقة المعتمة المحتوية عليها
هذه البنيات ،وذلك باستخدام تقنية اوتومات الوضاع النهائية ()AEF
(َ )Automates à états finisوالمحولت ()transducteurs
مما سيجيب عن مدى نمذجة الك فاية المعجمية
والرسوم (.)graphes
ً
حاسوبيا ،وعن الدوات العقالنية و المعلوماتية المناسبة لتمثيل ومعالجة المداخل
المعجمية بجميع اصنافها ودرجاتها.
I
آ
تقنيات التعرف ال لي على البنيات المتالزمة
بينت التجربة(المستندة على جميع انواع واصناف التعبيرات المركبة في اللغة العربية) إمكانية تطبيق نفس المنهجية
آ
التي تتبع في التعرف ال لي على المفردات البسيطة ،ان تحدد شكلها الصوري (متوالياتها الحرفية المحاطة ببياضين).
وحسب معظم المعجميين الحاسوبيين فإن المفردة المركبة هي متوالية لسانية اسمية مؤلفة من اك ثر من مدخل
آ
معجمي بسيط من مداخل المعجم .وهي تتالف تارة من عنصر مشتق و اخر جامد ،وتارة اخرى من عنصرين جامدين،
علما بان اسمين مشتقين ناذرين في اللغة العربية .ومن المعجميين من يزعم ا ً
ً
يضا ،ان المفردة المركبة عبارة عن جملة
مختزلة خضعت عناصرها لتغيرات الصرفية،ومرد ذلك إلى انهم يتخذون المحمولت السمية المولدة بظاهرة التوسيم
كنموذج يعممه على المفردات المركبة ذلك ان بعض المتواليات المركبة ل تستجيب لهذا التحليل نحو:
شذر مذر -حيص بيص -مثنى مثنى ...
فحسب ماكس سلبرشتاين ) M.Selberztien (1993فإن كل مفردة مركبة هي متوالية مؤلفة على القل من
مفردتين بسيطتين كما في الصوغ التالي:
مفردة مركبة = (م ب +1م ب+)2ح
يعتبر هذا التعريف ً
تعريفا ً
مقيدا للمفردة المركبة ،خاصة وان مصطلح متوالية هو بالمعنى التقني منطقة مترابطة (
) zone connexeل يمكن النيل منها لكونها صامدة امام اي تغيير او استبدال ايا كان نوعه( ،وليس فقط
بالمعنى اللساني) .لنتامل المثلة التالية:
صباح مساء
عالمة المرور
عالمة الساعة
يمكن هنا ،ان نجري بعض التعديالت بإدماج عنصر او عناصر ضمن هذه المتواليات نحو:
العالمة الخاصة بالمرور
عالمة خاصة بالمرور
لكن:
*الصباح المساء
*صباح ومساء
*عالمة Xالساعة
*الصباح Xالمساء
يتبين من هذه المثلة ان بعضها يحتمل إدماج عنصر ما ضمن متواليتها البسيطة،لنها وحدات معجمية تقبل التواجد ضمن وحدات تؤلف التعبير
المركب والتي تختلف ً
نوعا ما من حيث قابليتها إلدماج عناصر غريبة عنها مقارنة مع التعبيرات المتالزمة (المتالزمة جزئيا) ،لنها تقبل إدماج بعض
المتواليات بصفة اك ثر حرية من التعبيرات المتالزمة كليا ،لنتامل التعبيرات التي ذكرنا ،التالية:
صباح مساء
عالمة الساعة،
فهذه مداخل غير قابلة للتجزيء ،لنها تشكل في اغلبها مداخل متحجرة،وهذا ما يستدعي القيام بوسمها ( )Etiquetageفي المعجم
آ
وتحليلها على المستوين التركيبي واإلعرابي ،وهذا ما يتطلب وصفا صرفيا واخر تركيبي و دللي .
عمليا يتم تحويل النص ( )inversion du texteمن البسيط إلى المركب ،خاصة وان هذه المركبات تجمع في الغالب بين فصيلتين م ن
السماء الموجودة في معجم المفردات البسيطة :
بين السم والصفة، بين السم والحرف -بين السم والظرف.
وهذا الجمع يعني اآن السم المركب يتالف من فصيلة صرفية كذلك ،وهو ما يتطل ب معالج ة وافي ة .وق د ت م تحدي د الص ناف(انظ ر الملح ق )1الت ي نعتم دها
في طرق التعرف ال لي وامن لبس المتواليات المعقدة ،لنتامل البنية الماخوذة من اللغة الفرنسية مثال :
Zeid a cassé le jeune -1
Zeid a cassé le verre- -2
2-I
المتواليات المترابطة والمتواليات غير المترابطة
Connexe et non connexe
ان المتواليات المتميزة بمنطقة مترابطة بنية صماء ل تتغير.
فان قبلت على المستوى التركيبي ،دمج احدى العناصر فيما بين مكوناتها ،اعتبرت غير مترابطة ( ) zone non connexe
وان لم تقبل ذلك اعتبرت مترابطة ( ) zone connexeنحو:
حينئذ ،مازال ،ما فتئ
ئذ ،ما Xفتئ
* ما Xزال ،حين X
لكن:
آ
فالتعرف ال لي على هذه البنيات يقتضي ،اعتماد المستوى الصرفي كمرحلة اولية .لنه رغم تكرار بروز بعضها في النصوص المعالجة ،سيتمكن البرنامج من التعرف
عليها ،بدون ان يعود -عند التحليل -للمستوى التركيبي مثال:
حيص بيص
شذر مذر
كما هي في المتواليتين التاليتين:
وقع زيد في حيص بيص
وتفرق العرب شذر مذر.
فالتحليل المعجمي يقدم جميع الفرضيات المعجمية الممكنة ،بحيث ل يهمنا في هذه المرحلة الحسم في رفع اللبس ال في مرحلتي التحليل التركيبي او الدللي.
آ
وبعد العودة الى قواعد البيانات الموسعة المصنفة ضمن المعجم ال لي للمفردات ،بفحص جميع الخصائص المورفولوجية والتركيبية المحتوية عليها.
آ
نقوم اول بفحص المتوالية البسيطة وتحليلها ثم توزيعها بين عناصر اخرى تختارها الك فاية المعجمية للمدخل المركب ،بمعنى اخر ،يحلل العنصر في الستعمال
العادي ثم بعده الستعمال المركب ،كما في استعمال لفعل "اكل" التالي:
-1اكلت هند التفاحة (ف س 0س ،)1بنية حرة
-2اكل عليه الدهر وشرب(ف س 0مت س ،)1بنية متالزمة
إن منطقة التالزم في المثال ( )2تقع بين الفعل والمركب "عليه الدهر" (ح +ضمير +س.)1
في هذا المثال يبرز العنصر الحر الذي يمكن ان نستغني عنه في تحديد المنطقة المعتمة ،بحيث نترك الفعل"اكل"
والتعبير"عليه الدهر"منفصلين لتظهر العالقة الدللية بينهما ،فإن وزعنا "عليه الدهر" مع الفعل المذكور سنحصل على
المتالزمة المقبولة في الك فاية المعجمية ،فالمنطقة المعتمة هي التي تسمح بالعدد المحدد للعناصر البسيطة لولوجها
بحسب تغييراتها الصرفية التي تلحقها في التعبير المتالزم نحو:
( -)3اكل عليهم الدهر وشرب
اكل عليها الدهر وشرب
اكل عليهن الدهر وشرب
على الرغم من التحويل الذي حصل في المثال ( ،)3فإننا نالحظ تشبث حرف الجر بالضمير ،وهذا ما يؤكد العالقة
المتالزمة بين الحرف والضمير من جهة ك تعبير مركب ،وبين الفعل والتعبير المركب من جهة اخرى.
2- I
تمثيل بيانات المفردات المركبة والمتالزمات:
آ
لتوض يح نتيج ة التع رف ال ل ي عل ى المف ردات المركب ة والبني ات المتالزم ة ،يب دا اول ب امن ل بس الوح دات
البس يطة المؤلف ة للمف ردات المركب ة الموج ودة ف ي ال نص المعجم ي ،معت دين بتقني ة مح ولت الوض اع
النهائية وبالرسوم للتمثيل ،ونورد (بعده) المتواليات المركبة على التوالي ( :العداد المركبة في اللغ ة
العربي ة) ” حك م ذات ي“ ”رخص ة الس ياقة“و البني ة المتالزم ة ”ض ري زي د ف ي الر " الممثل ة بالرس م
( )grapheكما في النماذج التالية :
مالحظة :
آ
ل يمكن للبرامج المعدة للتعامل مع المعجم ال لي ان تتعرف على جميع مكونات النص المك توب ،اذا لم يكن هذا
المعجم متضمنا لجميع انواع السماء المركبة في اللغة العربية ،ذلك ان عددا كبيرا من المداخل المعجمية جاءت مركبة
بشكل يمنع تناولها مجزاة مثل:
عالمة المرور -بصيص المل -المثوى الخير -ذهابا وايابا -مثنى مثنى-احد عشر وسائر الرقام المركبة
آ
وهي مداخل غير قابلة للتجزيء ،لنها تشكل في اغلبها مداخل متالزمة ،وبالتالي تتطلب وصفا اليا صرفيا من نوع
خاص.هذا الوصف الذي قد ل يفيد معه السلوب العالجي الصرفي المتبع مع المفردات البسيطة ،فهي ل تدخل في اي
من التصنيفات الخاصة باقسام الكلم كما حددناها اعاله وهي:
السم والصفة والظرف والحروف والدوات ،بل تتاسس في الغالب في اك ثر من قسم من اقسام الكلم.
فكان من الضروري ادخال مفاهيم وصفية اجرائية جديدة تتالءم مع هذه الوضعية الجديدة في المعالجة .وهذا يدعو
الى الجمع بين نوعين من الوصف:
-1الهتمام اول بالوضع المورفولوجي للعناصر التي تتالف منها المفردة المركبة،
-2وصف الوضعية الجديدة التي انشاها منه نظام اللغة ،خاصة ان السم المركب يجمع في الغالب بين فصيلتين من
السماء وهي:
بين السم والصفة او بين السم والحرف ،او بين السم والظرف ،الخ .هذا الجمع يعني:
.1
.2
.3
.4
.5
.6
ان المفردة المركبة تتالف من اك ثر من فصيلة صرفية ايضا.
وان تكون هذه المفردات كلها موجودة في معجم المفردات البسيطة.
ان المرك ب يتك ون ل يس فق ط م ن متوالي ة م ن الم داخل ب ل وايض ا م ن متوالي ة م ن البياض ات الفاص لة ب ين ك ل م دخل بس يط ،وض ع ب رامج
تستجيب لهذه الحالة كما تاخذ بعين العتبار هذا المظهر المعقد من وجهة نظر تقنية،
آ
فاذا كان المعجم المحوسب يقوم على طريقة التصنيف التي تجمع بين الترقيم الصرفي ،والحالة النحوية ،فانه سيقوم كذلك على اسلوب اخر
في ترتيب المعلومات.
وبفضله
ولن استدعاء المستوى التركيبي في عملية الوصف المورفولوجي تمكننا فعال من اقامة تصنيف مورفو -تركيبي لهذه المركبات .آ
سنتمكن فعال من انشاء هذه الصناف التي تسهل عملية ضبط هذا المعجم وبالتالي بناؤه بالشكل الذي يستجيب به للعالج ال لي المتوخى
من هذا العمل.
آ
ولذلك تم تحديد هذه الصناف ،الى اصناف صورية كبرى وصنيفات صغرى مما سيسهل عملية المعالجة ال لية ،ويبقى علينا البحث عن
المتواليات المناسبة في الستعمال العادي للغة العربية مع تجنب ما امكن المهمل منها.
مالحظة :وهذا ايضا ،ما لم ينتبه اليه اغلب المعجميين العرب في وضع معجم خاص بالمفردات المركبة على ك ثرتها وانتاجية بنياتها في
النظام العربي .نظرا لهذا الخلط التصوري في تطبيق الجراءات التصريفية والتركيبية ،فايهما سيكون الولى ام هما معا وكيف؟ هذا مما يفقد
الصيغ التي تشملها المعاجم العربية خاصيتها اهي مفردات بسيطة ام مركبة؟ وكان المفردات المركبة والتعبيرات المتالزمة غير موجودة .مع
ان بداية هذا الهتمام برز مع اللسانيات الحاسوبية.
-II
آ
خوارزميات التعرف ال لي
على المفردات المركبة والمتالزمة
آ
تنحص ر ه ذه الخوارزمي ات ف ي التع رف ال ل ي عل ى المتوالي ات المركب ة وذل ك بالرتك از عل ى البح ث المتوالي اتي (recherche
) ،séquentielleانتهج هذا السلوي ايريك ثرنهر ) (E.Thurnherr 1993الذي حاول تحليل المركب ات ف ي اللغ ة ال لماني ة .منطلق ًا
من تحليل المفردة المركبة وتجزيئها إلى وحدات صغرى بسيطة مثل ما يحصل في التعبيرات التالية:
eingänge ، haus
حي ث يتب ين ان ع دد م رات الول وج المباش ر لتحلي ل ه ذه المتواليات،حرف ًا بح رف ،ح والي تس عة .ولك ن مارت ان س يمون اولم ان (Martin
) Simon Ulmannحاول تطوير عملية التعرف المباشر للنصوص المتوفرة على هذه المركب ات بدق ة وس رعة تتمث ل ف ي إدراج ح والي 640ولوج ًا
مباش ًرا لتحلي ل معطي ات المركب ات ف ي ه ذه اللغ ة (بمق دار 6.6حرف ًا بالثاني ة) .و تع ود ه ذه الص عوبة إل ى ط ول المف ردة المركب ة ف ي اللغ ة ال لماني ة م ن
جهة ،وإلى الولوج المفرداتي المتعدد للبرنامج من جهة ثانية.
آ
لذلك وجب بناء خوارزم يتناسب مع هذه المعطيات لرفع اللبس الحاصل اثناء المعالج ة ال لي ة.ولتحدي د عناص ر المتوالي ة المركب ة بش كل دقي ق ومقب ول
آ
آ
في الك فاية المعجمية ،اعتمد ايريك ثرنهر تحليال اخر يتجه من اليمين إلى اليسار (الشكل )1و اخر يتجه من اليسار إلى اليمين (الشكل )2حيث تب ين
ان نسبة %70من المتواليات التي تتكون من ثالثة عناصر تتجه إلى اليسار بينما حوالي %30تتجه إلى اليمينً ،
علما بان هناك متواليات تتوفر على
اك ثر من ثالثة عناصر كما في اللغة العربية نحو :
البطاقة الرمادية
ال+بطاقة +ال +رمادية
شكل :1اتجاه الى اليمين
شكل :2اتجاه الى اليسار
اقت رح س يمون اولم ان اس تراتيجية خواريزمي ة اخ رى للتحلي ل ف ي إط ار ت واتر بع ض المف ردات المركب ة ف ي نص وص اللغ ة ال لماني ة،
تتمث ل ف ي ع دم اعتم اد التسلس ل الخلف ي ف ي البح ث ،وذل ك بالقتص ار عل ى ع دد مح دد م ن ال دوال الرياض ية لحس اي تقطي ع
ُالع َج ْيم ات البديل ة او المش تقة ف ي المف ردة المركب ة المعالج ة ،فيخت ار َص ْو ًغا رياض ًيا يع ين الرم ز ال ذي يمث ل ُالع َج ْيم ات المؤلف ة
للكلمة بداية من حرف iالذي يتضمن عدد معين من الحروف jبحيث تكون المعادلة على
الشكل التالي :
0 ≤ I < n ,0 ≤ j < n-I
ترتك ز ه ذه العملي ة الرياض ية ف ي التحلي ل عل ى معطي ات اساس ية ش املة للط ول القص ى ل بعض الكلم ات الممكن ة الت ي وق ع عليه ا
الحس اي .وفك رة اعتم اد الكلم ة القص ى ط ول اعط ت نت ائج هام ة لنه ا تمكن ت ب الملموس م ن إحص اء الكلم ات المحتمل ة ف ي
التحلي ل ،وبالت الي يس هل التوص ل به ذا إل ى تحس ين اداء الخ وارزم الم ذكور ،وذل ك باعتم اد مجموع ة م ن اإلج راءات ف ي الك تاب ة.
وتتلخص في اعتماد لئحة معين ة م ن المف ردات المركب ة للتحلي ل ث م بداي ة وهيك ل ونهاي ة البرن امج حي ث الحص ول عل ى الحج م او
العدد النهائي من ُالع َج ْيمات المكونة للمفردة المركبة موضوع المعالجة.
1-2
وصف المنطقة المعتمة
zone fixe
إن المنطقة المعتمة مختلفة الشكل ،فهي تحتوي على عدد ثابت من المفردات البسيطة رغم قابلية هذه الخيرة للتحويل الصرفي إل انها تنصهر ً
دلليا مع
العناصر الخرى ،فيستحيل معها القيام بنفس الحساي الدللي خارج هذه المنظومة الفعلية ،ولذلك فإن المفردة المركبة كمتوالية هي التي تمثل المنطقة
المعتمة في التعبير ،لنها تتالف من اك ثر من مدخل معجمي بسيط ،كما اشرنا ،المتالزمة جز ًئيا والمتالزمة ّ
كلي ًا .كما تختلف المركبات السمية المتالزمة
عن غيرها بانعدام إمكانية إدماج اي عنصر بين مكوناتها (كما اسلفنا الذكر اعاله) ،نحو:
اخماسا في اسداس
لكن:
* اخماسا Xفي اسداس
ً
خالفا لالسماء المتالزمة جز ًئيا نحو:
عالمة المرور
العالمة الخاصة بالمرور.
يميز العالم الفرنسي ماكس شلبرزتاين ( ،)1993في هذا الصدد ،بين المنطقة التي تقبل إدم اج عنص ر م ا ب ين مكوناته ا باس تخدام تقني ة اوتوم ات اإلدم اج
( ،)Automate d'insertionواخرى ل تقبل إدماج اي نوع من الوتومات ،بمعنى ل تترك الحرية للتنقل بين العق د قص د اختي ار عناص ر ص ورية
آ
اخرى ،وهذا ل ه دور اساس ي ف ي التمثي ل ال دللي والمعرف ي ال ل ي ال ذي ي روم تيس ير التولي د التركيب ي– المعجم ي وال دللي .ولإلش ارة هن ا ف إن دور المح ولت
( )Transducteursونوع اوتومات الوضاع النهائية ( .)Automate à état finiكم ا س بق م ع تجرب ة بيئت ي ( )INTEXو( )NooJ
قد حلت معهما مجموعة من القيود التركيبية للتعبيرات المتالزمة المتمثلة بصفة خاصة ،في مسالة إحالة التعريف وخاص ة م ع البني ات الص ورية المص نفة،
ويحصل هذا مع البنيات الصورية للتعبيرات المتالزمة في اللغة العربية ،وذلك بمساعدة النحاء الصورية المحلية التي تستطيع تمثيل المعطي ات وتولي دها
في خوارزمات التحويل نحو:
ضرب زيد اخماسا في اسداس.
(ي) ضرب زيد ال (اخماس ) في ال ( اسداس
إن إتباع المنهجية العقالنية في الوصف من شانه ان يساعد على ضبط الخصائص التوزيعية للتعبيرات المتالزمة ومعالجته ا ،لنه ا تق وم بال دور المح وري ف ي
تص نيف وض بط البني ات الم ذكورة تاسيس ًا لقاع دة البيان ات ،خصوص َا وان ع ً
ددا كبي ًرا م ن الم داخل المعجمي ة ت اتي مركب ة وليس ت مج زاة لنه ا غي ر قابل ة
للتجزيء ،ونظ ًرا لتكوينها المعقد ،سواء اكانت البنيات متالزمة ً
كليا او جزئي ًا ..،فل ن نك تف ي بإس ناد رم ز نح وي تص نيفي موح د لن المف ردة المركب ة تتض من
اك ثر من قسم من اقسام الكلم العربي.كل ذلك يجعل إتباع اساليب وصفية تصنف التعبيرات المتالزمة وفق بياتها الصرفية-التركيبية والمعجمية -التركيبي ة
آ
كذلك ،وتتمثل في ك تابة جميع التعبيرات وفق نمط من الترقيم الذي نتخذه ً
مرجعا عند بناء برنامج الي للتعرف عليها ،بإسناد رقم لك ل ص نف م ن اص نافها
التوزيعية ،مع مراعاة الفاصل الموجود بين مكونات كل صنف على حدة بوضع عالمة خاصة مكان البيا على الشكل التالي:
صنف :تع /س /تع /ص /ال /قيمة /ال /مضافة
صنف :ص /تع /س /بصيص /ال /امل
إن الرم ز الوحي د ال ذي يرس م البي ا ب ين العناص ر البس يطة ف ي ال نص ه ي العالم ة ( ،)/يس اعد عل ى تقس يم التعبي رات المركب ة إل ى ملف ات ،وه ي عب ارة ع ن
اصناف كبرى ثم اصناف صغرى واجزاء صغيرة ،تتمث ل ف ي العملي ات اإلعرابي ة الناتج ة ع ن التغي رات التص ريفية الت ي ت تحكم فيه ا الدوار التركيبي ة .وه ذا م ا
يعب ر عن ه م اكس سلبرش تاين بالبني ات الص غرى الغامض ة الت ي تحت اج التعام ل ال دقيق ،بالتعام ل إل م ع راس المتالزم ة ،لن ه ه و ال ذي ي تحكم ف ي العملي ة
التوزيعية .فيجوز مثال ،إعراي السماء المركبة ويتعامل ً
صرفيا إل مع الجزء الول نحو:
جواز السفر -جوازي السفر -جوازات السفر ...
غير ان دور المستوى التصريفي يتقلص ً
تماما هنا نظ ًرا لرفض هذه البنيات اي تحرك صرفي نحو:
حيص بيص /لكن *حيص ( جمع/مثنى/تصغير) بيص
آ
إن الش كال الص ورية المتبع ة ف ي الوص ف هن ا ،ه ي نفس ها الت ي اعتم دت م ع التعبي رات الح رة ،فاله دف واح د ه و بن اء نظ ام ال ي يس تطيع حوس بة الش كال
آ
اللغوية بسيطها ومركبها .ولما كانت التعبيرات متميزة بالثبات الكلي في التعت يم ال دللي فإن ه يص عب معه ا اس تدراج اي برن امج للتع رف ال ل ي .وه ذا م ا بق ي
قيد التجريب والختبار لحد الساعة ببناء انظمة وبيائت للمعالجة اللغوية المتطورة .واما فكرة تصنيف البيانات اللغوي ة لمعالجته ا فينبن ي اساس ًا عل ى تص ور
آ
خوارزمي مضبوط ينس ب ك ل جمل ة او تعبي ر إل ى الص نف المناس ب له ا دون اي تردد،وذل ك لتمك ين الب رامج الخاص ة بالمع اجم ال لي ة ان تتع رف عل ى ه ذه
التعبيرات بواسطة جداول معجمية -تركيبية بنيت لهذا الغر .وهذه الصناف محصورة صور ًيا في ستة بنيات صورية كما في الملحق . 1
آ
نتائج وافاق البحث
•
غالبا ما تكون اك ثر تحج ًرا و ً
تتميز التعبيرات المتالزمة بضعف و استحالة استبدال احد العناصر التي ً
تكلسا ،فهي بهذا العتبار ليست شفافة بل معتمة.مما
يجعلها ل تاليفية شكال ومعنى .فهي إذن ،حاصل حسابي بين المستوى الصوري والمستوى التركيبي والصوتي.
•
استحالة تجزيء هذه البنيات إلى ابعا وعناصر ُوع ْجمات ،وهذا ما يعتبر حجرة عثراء امام العديد من التطبيقات الحاسوبية حيث يجب ان تشغل هذه
التعبيرات حي ًزا ً
جمليا ُيالئم المدخل المعجمي باعتباره ادنى وحدة للدللة.مما يستدعي بناء معجم مقارن للتعبيرات المتالزمة في كل اللغات.
•
تتميز التعبيرات المتالزمة بالدرجة في التعتيم ويفسر ذلك درجة البساطة والتعقيد الذي تتحكم في بناء المتوالية المتالزمة.فهي مؤلفة من مفردتين
بسيطتين بها منطقة مترابطة ،فالتي تتوفر على منطقة مترابطة قارة اسهل َتع ُّر ًفا من غيرها من التعبيرات،مما يسهل وضعها ضمن قاعدة البيانات الخاصة
آ
بالمعجم ال لي للمفردات المركبة .
•
آ
ينشا الغمو من اول عملية للتعرف ال لي المطرد وهو من اهم المشاكل المطروحة على المتواليات المتالزمة والمركبة ،مما يستدعي بناء برمجيات اك ثر
تطو ًرا و مالئمة لنظام اللغة الطبيعي .ولن يتاتى ذلك ،إل ببناء قاعدة بيانات شاملة تتضمن جميع الصناف وليس العتماد فقط على امثلة قليلة العدد.
•
كلما كانت التعبيرات المتالزمة تتمتع بحرية استبدال عناصرها او تقبلها لتغيير ما ،كلما كان التعرف عليها بالوتومات في النص اقل دقة.
•
تجاوز محنة فقدان كل استقالل معجمي ودللي عند إدماج السم في البنية المتالزمة ،ببناء انحاء محلية جزئية ل تختلف عن النظام اللغوي العام ،مما
سيساعد برامج التعرف آال لي القائمة على اوتوماتات الوضاع النهائية بوصف ادق لعناصر التعبير المتالزم،لنه تركيب خاص في ذاته ل يخرج ً
إطالقا عن نظام
الك فاية المعجمية.
ملحق(:)1
جدول يلخص الصناف الصورية للبنيات المركبة والمتالزمة
-1ف [مت ]0البنية التي منطقتها الثابتة هي الفاعل
-2ف [س 0س ]1البنية التي منطقتها الثابتة هي المفعول له المباشر البسيط
-3ف س [ 0ح مت ]1البنية التي منطقتها الثابتة هي المفعول المجرور.
-4ف س [ 0مت ح مت] 1البنية التي منطقتها الثابتة هي المركب من عنصرين:اولهما مباشر والثاني مجرور.
-5ف س [ 0ح مت ح مت] 1البنية التي منطقتها الثابتة هي مفعولها المركب من عنصرين غير مباشرين
-6ف س [ 0مت مت] 1البنية التي منطقتها الثابتة هي مفعولها المباشر المركب من عنصرين اسميين مباشرين
ً
ْ
ُ
ُ
َ
َ
وشكرا ع َلى انتب ِاهكم