الندوة الدولية الأولى للحاسب واللغة الع

Download Report

Transcript الندوة الدولية الأولى للحاسب واللغة الع

3rd IEEE International Conference on Arabic
Language Processing (CITALA09),
May 4-5, 2009, Rabat, Morocco
‫بناء معجم التعبيرات المتالزمة والمركبة‬
‫آ‬
‫تقنيات التعرف ال لي‬
‫عزا لدين غازي‬
‫‪ ،INPMA‬جامعة محمد بن عبد هللا – فاس‬
‫جمعية اللسانيات الحاسوبية العربية‪ALIA ،‬‬
‫مخطط الورقة‬
‫مقدمة‪،‬‬
‫آ‬
‫‪ -I‬تقنيات التعرف ال لي على المفردات المركبة والتعبيرات المتالزمة‪،‬‬
‫‪ -1‬المتواليات المترابطة وغير المترابطة‪،‬‬
‫‪ -2‬تمثيل بيانات المتواليات المركبة والمتالزمة‪،‬‬
‫آ‬
‫‪-II‬خوارزمات التعرف ال لي على المفردات المركبة والمتالزمة (طريقة سيمون اولمان‬
‫وإيريك ثرنهر )‪،)1993‬‬
‫‪ -1‬وصف المنطقة المعتمة‪،‬‬
‫‪ -2‬اصناف البنيات (ملحق‪،)1‬‬
‫آ‬
‫استنتاجات وافاق‪.‬‬
‫تقديم‬
‫آ‬
‫يهدف هذا البحث إلى تقديم الدوات اللسانية والمعلوماتية المناسبة لبناء المعجم ال لي‬
‫للغة العربية‪ ،‬باستغالل التقنيات المعلوماتية التي ابانت عن نجاعتها في معالجة لغات‬
‫عديدة في سائر المستويات المختلفة وخاصة الك فاية المعجمية‪ .‬وذلك بهدف وضع معجم‬
‫آ‬
‫الي يرتكز على وصف المفردات اللغوية بسيطها ومركبها‪،‬يالءم شكل ومحتوى مداخل‬
‫ومواد المعجم المتمثلة في المتواليات المركبة و المتالزمة‪ ،‬مستغلين ما توصلت إليه‬
‫آ‬
‫تقنيات وطرق التعرف ال لي باعتبارها خوارزمات تحليل المنطقة المعتمة المحتوية عليها‬
‫هذه البنيات‪ ،‬وذلك باستخدام تقنية اوتومات الوضاع النهائية (‪)AEF‬‬
‫(‪َ )Automates à états finis‬والمحولت (‪)transducteurs‬‬
‫مما سيجيب عن مدى نمذجة الك فاية المعجمية‬
‫والرسوم (‪.)graphes‬‬
‫ً‬
‫حاسوبيا‪ ،‬وعن الدوات العقالنية و المعلوماتية المناسبة لتمثيل ومعالجة المداخل‬
‫المعجمية بجميع اصنافها ودرجاتها‪.‬‬
‫‪I‬‬
‫آ‬
‫تقنيات التعرف ال لي على البنيات المتالزمة‬
‫بينت التجربة(المستندة على جميع انواع واصناف التعبيرات المركبة في اللغة العربية) إمكانية تطبيق نفس المنهجية‬
‫آ‬
‫التي تتبع في التعرف ال لي على المفردات البسيطة‪ ،‬ان تحدد شكلها الصوري (متوالياتها الحرفية المحاطة ببياضين)‪.‬‬
‫وحسب معظم المعجميين الحاسوبيين فإن المفردة المركبة هي متوالية لسانية اسمية مؤلفة من اك ثر من مدخل‬
‫آ‬
‫معجمي بسيط من مداخل المعجم‪ .‬وهي تتالف تارة من عنصر مشتق و اخر جامد‪ ،‬وتارة اخرى من عنصرين جامدين‪،‬‬
‫علما بان اسمين مشتقين ناذرين في اللغة العربية‪ .‬ومن المعجميين من يزعم ا ً‬
‫ً‬
‫يضا‪ ،‬ان المفردة المركبة عبارة عن جملة‬
‫مختزلة خضعت عناصرها لتغيرات الصرفية‪،‬ومرد ذلك إلى انهم يتخذون المحمولت السمية المولدة بظاهرة التوسيم‬
‫كنموذج يعممه على المفردات المركبة ذلك ان بعض المتواليات المركبة ل تستجيب لهذا التحليل نحو‪:‬‬
‫شذر مذر‪ -‬حيص بيص ‪ -‬مثنى مثنى ‪...‬‬
‫فحسب ماكس سلبرشتاين )‪ M.Selberztien (1993‬فإن كل مفردة مركبة هي متوالية مؤلفة على القل من‬
‫مفردتين بسيطتين كما في الصوغ التالي‪:‬‬
‫مفردة مركبة = (م ب ‪ +1‬م ب‪+)2‬ح‬
‫يعتبر هذا التعريف ً‬
‫تعريفا ً‬
‫مقيدا للمفردة المركبة‪ ،‬خاصة وان مصطلح متوالية هو بالمعنى التقني منطقة مترابطة (‬
‫‪ ) zone connexe‬ل يمكن النيل منها لكونها صامدة امام اي تغيير او استبدال ايا كان نوعه‪( ،‬وليس فقط‬
‫بالمعنى اللساني)‪ .‬لنتامل المثلة التالية‪:‬‬
‫صباح مساء‬
‫عالمة المرور‬
‫عالمة الساعة‬
‫يمكن هنا‪ ،‬ان نجري بعض التعديالت بإدماج عنصر او عناصر ضمن هذه المتواليات نحو‪:‬‬
‫العالمة الخاصة بالمرور‬
‫عالمة خاصة بالمرور‬
‫لكن‪:‬‬
‫*الصباح المساء‬
‫*صباح ومساء‬
‫*عالمة ‪ X‬الساعة‬
‫*الصباح ‪X‬المساء‬
‫يتبين من هذه المثلة ان بعضها يحتمل إدماج عنصر ما ضمن متواليتها البسيطة‪،‬لنها وحدات معجمية تقبل التواجد ضمن وحدات تؤلف التعبير‬
‫المركب والتي تختلف ً‬
‫نوعا ما من حيث قابليتها إلدماج عناصر غريبة عنها مقارنة مع التعبيرات المتالزمة (المتالزمة جزئيا) ‪ ،‬لنها تقبل إدماج بعض‬
‫المتواليات بصفة اك ثر حرية من التعبيرات المتالزمة كليا‪ ،‬لنتامل التعبيرات التي ذكرنا‪ ،‬التالية‪:‬‬
‫صباح مساء‬
‫عالمة الساعة‪،‬‬
‫فهذه مداخل غير قابلة للتجزيء‪ ،‬لنها تشكل في اغلبها مداخل متحجرة‪،‬وهذا ما يستدعي القيام بوسمها (‪ )Etiquetage‬في المعجم‬
‫آ‬
‫وتحليلها على المستوين التركيبي واإلعرابي‪ ،‬وهذا ما يتطلب وصفا صرفيا واخر تركيبي و دللي ‪.‬‬
‫عمليا يتم تحويل النص (‪ )inversion du texte‬من البسيط إلى المركب‪ ،‬خاصة وان هذه المركبات تجمع في الغالب بين فصيلتين م ن‬
‫السماء الموجودة في معجم المفردات البسيطة ‪:‬‬
‫ بين السم والصفة‪،‬‬‫ بين السم والحرف‬‫‪ -‬بين السم والظرف‪.‬‬
‫وهذا الجمع يعني اآن السم المركب يتالف من فصيلة صرفية كذلك‪ ،‬وهو ما يتطل ب معالج ة وافي ة‪ .‬وق د ت م تحدي د الص ناف(انظ ر الملح ق‪ )1‬الت ي نعتم دها‬
‫في طرق التعرف ال لي وامن لبس المتواليات المعقدة‪ ،‬لنتامل البنية الماخوذة من اللغة الفرنسية مثال ‪:‬‬
‫‪Zeid a cassé le jeune -1‬‬
‫‪Zeid a cassé le verre- -2‬‬
‫‪2-I‬‬
‫المتواليات المترابطة والمتواليات غير المترابطة‬
‫‪Connexe et non connexe‬‬
‫ان المتواليات المتميزة بمنطقة مترابطة بنية صماء ل تتغير‪.‬‬
‫فان قبلت على المستوى التركيبي‪ ،‬دمج احدى العناصر فيما بين مكوناتها‪ ،‬اعتبرت غير مترابطة ( ‪) zone non connexe‬‬
‫وان لم تقبل ذلك اعتبرت مترابطة ( ‪ ) zone connexe‬نحو‪:‬‬
‫حينئذ‪ ،‬مازال‪ ،‬ما فتئ‬
‫ئذ ‪ ،‬ما ‪ X‬فتئ‬
‫* ما ‪ X‬زال ‪ ،‬حين ‪X‬‬
‫لكن‪:‬‬
‫آ‬
‫فالتعرف ال لي على هذه البنيات يقتضي‪ ،‬اعتماد المستوى الصرفي كمرحلة اولية‪ .‬لنه رغم تكرار بروز بعضها في النصوص المعالجة‪ ،‬سيتمكن البرنامج من التعرف‬
‫عليها‪ ،‬بدون ان يعود ‪ -‬عند التحليل ‪ -‬للمستوى التركيبي مثال‪:‬‬
‫حيص بيص‬
‫شذر مذر‬
‫كما هي في المتواليتين التاليتين‪:‬‬
‫وقع زيد في حيص بيص‬
‫وتفرق العرب شذر مذر‪.‬‬
‫فالتحليل المعجمي يقدم جميع الفرضيات المعجمية الممكنة‪ ،‬بحيث ل يهمنا في هذه المرحلة الحسم في رفع اللبس ال في مرحلتي التحليل التركيبي او الدللي‪.‬‬
‫آ‬
‫وبعد العودة الى قواعد البيانات الموسعة المصنفة ضمن المعجم ال لي للمفردات‪ ،‬بفحص جميع الخصائص المورفولوجية والتركيبية المحتوية عليها‪.‬‬
‫آ‬
‫نقوم اول بفحص المتوالية البسيطة وتحليلها ثم توزيعها بين عناصر اخرى تختارها الك فاية المعجمية للمدخل المركب‪ ،‬بمعنى اخر‪ ،‬يحلل العنصر في الستعمال‬
‫العادي ثم بعده الستعمال المركب‪ ،‬كما في استعمال لفعل "اكل" التالي‪:‬‬
‫‪ -1‬اكلت هند التفاحة (ف س‪ 0‬س‪ ،)1‬بنية حرة‬
‫‪ -2‬اكل عليه الدهر وشرب(ف س‪ 0‬مت س‪ ،)1‬بنية متالزمة‬
‫إن منطقة التالزم في المثال (‪ )2‬تقع بين الفعل والمركب "عليه الدهر" (ح ‪ +‬ضمير‪ +‬س‪.)1‬‬
‫في هذا المثال يبرز العنصر الحر الذي يمكن ان نستغني عنه في تحديد المنطقة المعتمة‪ ،‬بحيث نترك الفعل"اكل"‬
‫والتعبير"عليه الدهر"منفصلين لتظهر العالقة الدللية بينهما‪ ،‬فإن وزعنا "عليه الدهر" مع الفعل المذكور سنحصل على‬
‫المتالزمة المقبولة في الك فاية المعجمية‪ ،‬فالمنطقة المعتمة هي التي تسمح بالعدد المحدد للعناصر البسيطة لولوجها‬
‫بحسب تغييراتها الصرفية التي تلحقها في التعبير المتالزم نحو‪:‬‬
‫( ‪ -)3‬اكل عليهم الدهر وشرب‬
‫اكل عليها الدهر وشرب‬
‫اكل عليهن الدهر وشرب‬
‫على الرغم من التحويل الذي حصل في المثال (‪ ،)3‬فإننا نالحظ تشبث حرف الجر بالضمير‪ ،‬وهذا ما يؤكد العالقة‬
‫المتالزمة بين الحرف والضمير من جهة ك تعبير مركب‪ ،‬وبين الفعل والتعبير المركب من جهة اخرى‪.‬‬
‫‪2- I‬‬
‫تمثيل بيانات المفردات المركبة والمتالزمات‪:‬‬
‫آ‬
‫لتوض يح نتيج ة التع رف ال ل ي عل ى المف ردات المركب ة والبني ات المتالزم ة‪ ،‬يب دا اول ب امن ل بس الوح دات‬
‫البس يطة المؤلف ة للمف ردات المركب ة الموج ودة ف ي ال نص المعجم ي‪ ،‬معت دين بتقني ة مح ولت الوض اع‬
‫النهائية وبالرسوم للتمثيل‪ ،‬ونورد (بعده) المتواليات المركبة على التوالي‪ ( :‬العداد المركبة في اللغ ة‬
‫العربي ة) ” حك م ذات ي“ ”رخص ة الس ياقة“و البني ة المتالزم ة ”ض ري زي د ف ي الر " الممثل ة بالرس م‬
‫(‪ )graphe‬كما في النماذج التالية ‪:‬‬
‫مالحظة ‪:‬‬
‫آ‬
‫ل يمكن للبرامج المعدة للتعامل مع المعجم ال لي ان تتعرف على جميع مكونات النص المك توب‪ ،‬اذا لم يكن هذا‬
‫المعجم متضمنا لجميع انواع السماء المركبة في اللغة العربية‪ ،‬ذلك ان عددا كبيرا من المداخل المعجمية جاءت مركبة‬
‫بشكل يمنع تناولها مجزاة مثل‪:‬‬
‫عالمة المرور‪ -‬بصيص المل‪ -‬المثوى الخير‪ -‬ذهابا وايابا‪ -‬مثنى مثنى‪-‬احد عشر وسائر الرقام المركبة‬
‫آ‬
‫وهي مداخل غير قابلة للتجزيء‪ ،‬لنها تشكل في اغلبها مداخل متالزمة‪ ،‬وبالتالي تتطلب وصفا اليا صرفيا من نوع‬
‫خاص‪.‬هذا الوصف الذي قد ل يفيد معه السلوب العالجي الصرفي المتبع مع المفردات البسيطة‪ ،‬فهي ل تدخل في اي‬
‫من التصنيفات الخاصة باقسام الكلم كما حددناها اعاله وهي‪:‬‬
‫السم والصفة والظرف والحروف والدوات‪ ،‬بل تتاسس في الغالب في اك ثر من قسم من اقسام الكلم‪.‬‬
‫فكان من الضروري ادخال مفاهيم وصفية اجرائية جديدة تتالءم مع هذه الوضعية الجديدة في المعالجة‪ .‬وهذا يدعو‬
‫الى الجمع بين نوعين من الوصف‪:‬‬
‫‪ -1‬الهتمام اول بالوضع المورفولوجي للعناصر التي تتالف منها المفردة المركبة‪،‬‬
‫‪ -2‬وصف الوضعية الجديدة التي انشاها منه نظام اللغة‪ ،‬خاصة ان السم المركب يجمع في الغالب بين فصيلتين من‬
‫السماء وهي‪:‬‬
‫بين السم والصفة او بين السم والحرف‪ ،‬او بين السم والظرف‪ ،‬الخ‪ .‬هذا الجمع يعني‪:‬‬
‫‪.1‬‬
‫‪.2‬‬
‫‪.3‬‬
‫‪.4‬‬
‫‪.5‬‬
‫‪.6‬‬
‫ان المفردة المركبة تتالف من اك ثر من فصيلة صرفية ايضا‪.‬‬
‫وان تكون هذه المفردات كلها موجودة في معجم المفردات البسيطة‪.‬‬
‫ان المرك ب يتك ون ل يس فق ط م ن متوالي ة م ن الم داخل ب ل وايض ا م ن متوالي ة م ن البياض ات الفاص لة ب ين ك ل م دخل بس يط‪ ،‬وض ع ب رامج‬
‫تستجيب لهذه الحالة كما تاخذ بعين العتبار هذا المظهر المعقد من وجهة نظر تقنية‪،‬‬
‫آ‬
‫فاذا كان المعجم المحوسب يقوم على طريقة التصنيف التي تجمع بين الترقيم الصرفي‪ ،‬والحالة النحوية‪ ،‬فانه سيقوم كذلك على اسلوب اخر‬
‫في ترتيب المعلومات‪.‬‬
‫وبفضله‬
‫ولن استدعاء المستوى التركيبي في عملية الوصف المورفولوجي تمكننا فعال من اقامة تصنيف مورفو‪ -‬تركيبي لهذه المركبات‪ .‬آ‬
‫سنتمكن فعال من انشاء هذه الصناف التي تسهل عملية ضبط هذا المعجم وبالتالي بناؤه بالشكل الذي يستجيب به للعالج ال لي المتوخى‬
‫من هذا العمل‪.‬‬
‫آ‬
‫ولذلك تم تحديد هذه الصناف‪ ،‬الى اصناف صورية كبرى وصنيفات صغرى مما سيسهل عملية المعالجة ال لية‪ ،‬ويبقى علينا البحث عن‬
‫المتواليات المناسبة في الستعمال العادي للغة العربية مع تجنب ما امكن المهمل منها‪.‬‬
‫مالحظة ‪ :‬وهذا ايضا‪ ،‬ما لم ينتبه اليه اغلب المعجميين العرب في وضع معجم خاص بالمفردات المركبة على ك ثرتها وانتاجية بنياتها في‬
‫النظام العربي‪ .‬نظرا لهذا الخلط التصوري في تطبيق الجراءات التصريفية والتركيبية‪ ،‬فايهما سيكون الولى ام هما معا وكيف؟ هذا مما يفقد‬
‫الصيغ التي تشملها المعاجم العربية خاصيتها اهي مفردات بسيطة ام مركبة؟ وكان المفردات المركبة والتعبيرات المتالزمة غير موجودة‪ .‬مع‬
‫ان بداية هذا الهتمام برز مع اللسانيات الحاسوبية‪.‬‬
‫‪-II‬‬
‫آ‬
‫خوارزميات التعرف ال لي‬
‫على المفردات المركبة والمتالزمة‬
‫آ‬
‫تنحص ر ه ذه الخوارزمي ات ف ي التع رف ال ل ي عل ى المتوالي ات المركب ة وذل ك بالرتك از عل ى البح ث المتوالي اتي ‪(recherche‬‬
‫)‪ ،séquentielle‬انتهج هذا السلوي ايريك ثرنهر )‪ (E.Thurnherr 1993‬الذي حاول تحليل المركب ات ف ي اللغ ة ال لماني ة‪ .‬منطلق ًا‬
‫من تحليل المفردة المركبة وتجزيئها إلى وحدات صغرى بسيطة مثل ما يحصل في التعبيرات التالية‪:‬‬
‫‪eingänge ، haus‬‬
‫حي ث يتب ين ان ع دد م رات الول وج المباش ر لتحلي ل ه ذه المتواليات‪،‬حرف ًا بح رف‪ ،‬ح والي تس عة‪ .‬ولك ن مارت ان س يمون اولم ان ‪(Martin‬‬
‫)‪ Simon Ulmann‬حاول تطوير عملية التعرف المباشر للنصوص المتوفرة على هذه المركب ات بدق ة وس رعة تتمث ل ف ي إدراج ح والي ‪ 640‬ولوج ًا‬
‫مباش ًرا لتحلي ل معطي ات المركب ات ف ي ه ذه اللغ ة (بمق دار ‪ 6.6‬حرف ًا بالثاني ة) ‪ .‬و تع ود ه ذه الص عوبة إل ى ط ول المف ردة المركب ة ف ي اللغ ة ال لماني ة م ن‬
‫جهة‪ ،‬وإلى الولوج المفرداتي المتعدد للبرنامج من جهة ثانية‪.‬‬
‫آ‬
‫لذلك وجب بناء خوارزم يتناسب مع هذه المعطيات لرفع اللبس الحاصل اثناء المعالج ة ال لي ة‪.‬ولتحدي د عناص ر المتوالي ة المركب ة بش كل دقي ق ومقب ول‬
‫آ‬
‫آ‬
‫في الك فاية المعجمية‪ ،‬اعتمد ايريك ثرنهر تحليال اخر يتجه من اليمين إلى اليسار (الشكل‪ )1‬و اخر يتجه من اليسار إلى اليمين (الشكل‪ )2‬حيث تب ين‬
‫ان نسبة ‪ %70‬من المتواليات التي تتكون من ثالثة عناصر تتجه إلى اليسار بينما حوالي ‪ %30‬تتجه إلى اليمين‪ً ،‬‬
‫علما بان هناك متواليات تتوفر على‬
‫اك ثر من ثالثة عناصر كما في اللغة العربية نحو ‪:‬‬
‫البطاقة الرمادية‬
‫ال‪+‬بطاقة‪ +‬ال‪ +‬رمادية‬
‫شكل ‪ :1‬اتجاه الى اليمين‬
‫شكل ‪ :2‬اتجاه الى اليسار‬
‫اقت رح س يمون اولم ان اس تراتيجية خواريزمي ة اخ رى للتحلي ل ف ي إط ار ت واتر بع ض المف ردات المركب ة ف ي نص وص اللغ ة ال لماني ة‪،‬‬
‫تتمث ل ف ي ع دم اعتم اد التسلس ل الخلف ي ف ي البح ث‪ ،‬وذل ك بالقتص ار عل ى ع دد مح دد م ن ال دوال الرياض ية لحس اي تقطي ع‬
‫ُالع َج ْيم ات البديل ة او المش تقة ف ي المف ردة المركب ة المعالج ة‪ ،‬فيخت ار َص ْو ًغا رياض ًيا يع ين الرم ز ال ذي يمث ل ُالع َج ْيم ات المؤلف ة‬
‫للكلمة بداية من حرف ‪ i‬الذي يتضمن عدد معين من الحروف ‪ j‬بحيث تكون المعادلة على‬
‫الشكل التالي ‪:‬‬
‫‪0 ≤ I < n ,0 ≤ j < n-I‬‬
‫ترتك ز ه ذه العملي ة الرياض ية ف ي التحلي ل عل ى معطي ات اساس ية ش املة للط ول القص ى ل بعض الكلم ات الممكن ة الت ي وق ع عليه ا‬
‫الحس اي‪ .‬وفك رة اعتم اد الكلم ة القص ى ط ول اعط ت نت ائج هام ة لنه ا تمكن ت ب الملموس م ن إحص اء الكلم ات المحتمل ة ف ي‬
‫التحلي ل‪ ،‬وبالت الي يس هل التوص ل به ذا إل ى تحس ين اداء الخ وارزم الم ذكور‪ ،‬وذل ك باعتم اد مجموع ة م ن اإلج راءات ف ي الك تاب ة‪.‬‬
‫وتتلخص في اعتماد لئحة معين ة م ن المف ردات المركب ة للتحلي ل ث م بداي ة وهيك ل ونهاي ة البرن امج حي ث الحص ول عل ى الحج م او‬
‫العدد النهائي من ُالع َج ْيمات المكونة للمفردة المركبة موضوع المعالجة‪.‬‬
‫‪1-2‬‬
‫وصف المنطقة المعتمة‬
‫‪zone fixe‬‬
‫إن المنطقة المعتمة مختلفة الشكل‪ ،‬فهي تحتوي على عدد ثابت من المفردات البسيطة رغم قابلية هذه الخيرة للتحويل الصرفي إل انها تنصهر ً‬
‫دلليا مع‬
‫العناصر الخرى‪ ،‬فيستحيل معها القيام بنفس الحساي الدللي خارج هذه المنظومة الفعلية‪ ،‬ولذلك فإن المفردة المركبة كمتوالية هي التي تمثل المنطقة‬
‫المعتمة في التعبير‪ ،‬لنها تتالف من اك ثر من مدخل معجمي بسيط‪ ،‬كما اشرنا‪ ،‬المتالزمة جز ًئيا والمتالزمة ّ‬
‫كلي ًا‪ .‬كما تختلف المركبات السمية المتالزمة‬
‫عن غيرها بانعدام إمكانية إدماج اي عنصر بين مكوناتها (كما اسلفنا الذكر اعاله)‪ ،‬نحو‪:‬‬
‫اخماسا في اسداس‬
‫لكن‪:‬‬
‫* اخماسا ‪ X‬في اسداس‬
‫ً‬
‫خالفا لالسماء المتالزمة جز ًئيا نحو‪:‬‬
‫عالمة المرور‬
‫العالمة الخاصة بالمرور‪.‬‬
‫يميز العالم الفرنسي ماكس شلبرزتاين ( ‪ ،)1993‬في هذا الصدد‪ ،‬بين المنطقة التي تقبل إدم اج عنص ر م ا ب ين مكوناته ا باس تخدام تقني ة اوتوم ات اإلدم اج‬
‫(‪ ،)Automate d'insertion‬واخرى ل تقبل إدماج اي نوع من الوتومات‪ ،‬بمعنى ل تترك الحرية للتنقل بين العق د قص د اختي ار عناص ر ص ورية‬
‫آ‬
‫اخرى‪ ،‬وهذا ل ه دور اساس ي ف ي التمثي ل ال دللي والمعرف ي ال ل ي ال ذي ي روم تيس ير التولي د التركيب ي– المعجم ي وال دللي‪ .‬ولإلش ارة هن ا ف إن دور المح ولت‬
‫(‪ )Transducteurs‬ونوع اوتومات الوضاع النهائية (‪ .)Automate à état fini‬كم ا س بق م ع تجرب ة بيئت ي (‪ )INTEX‬و( ‪)NooJ‬‬
‫قد حلت معهما مجموعة من القيود التركيبية للتعبيرات المتالزمة المتمثلة بصفة خاصة‪ ،‬في مسالة إحالة التعريف وخاص ة م ع البني ات الص ورية المص نفة‪،‬‬
‫ويحصل هذا مع البنيات الصورية للتعبيرات المتالزمة في اللغة العربية‪ ،‬وذلك بمساعدة النحاء الصورية المحلية التي تستطيع تمثيل المعطي ات وتولي دها‬
‫في خوارزمات التحويل نحو‪:‬‬
‫ضرب زيد اخماسا في اسداس‪.‬‬
‫(ي) ضرب زيد ال (اخماس ) في ال ( اسداس‬
‫إن إتباع المنهجية العقالنية في الوصف من شانه ان يساعد على ضبط الخصائص التوزيعية للتعبيرات المتالزمة ومعالجته ا‪ ،‬لنه ا تق وم بال دور المح وري ف ي‬
‫تص نيف وض بط البني ات الم ذكورة تاسيس ًا لقاع دة البيان ات‪ ،‬خصوص َا وان ع ً‬
‫ددا كبي ًرا م ن الم داخل المعجمي ة ت اتي مركب ة وليس ت مج زاة لنه ا غي ر قابل ة‬
‫للتجزيء‪ ،‬ونظ ًرا لتكوينها المعقد‪ ،‬سواء اكانت البنيات متالزمة ً‬
‫كليا او جزئي ًا‪ ..،‬فل ن نك تف ي بإس ناد رم ز نح وي تص نيفي موح د لن المف ردة المركب ة تتض من‬
‫اك ثر من قسم من اقسام الكلم العربي‪.‬كل ذلك يجعل إتباع اساليب وصفية تصنف التعبيرات المتالزمة وفق بياتها الصرفية‪-‬التركيبية والمعجمية‪ -‬التركيبي ة‬
‫آ‬
‫كذلك‪ ،‬وتتمثل في ك تابة جميع التعبيرات وفق نمط من الترقيم الذي نتخذه ً‬
‫مرجعا عند بناء برنامج الي للتعرف عليها‪ ،‬بإسناد رقم لك ل ص نف م ن اص نافها‬
‫التوزيعية‪ ،‬مع مراعاة الفاصل الموجود بين مكونات كل صنف على حدة بوضع عالمة خاصة مكان البيا على الشكل التالي‪:‬‬
‫صنف ‪ :‬تع ‪ /‬س ‪ /‬تع ‪ /‬ص‪ /‬ال ‪ /‬قيمة ‪ /‬ال‪ /‬مضافة‬
‫صنف‪ :‬ص ‪ /‬تع ‪ /‬س‪ /‬بصيص ‪ /‬ال ‪ /‬امل‬
‫إن الرم ز الوحي د ال ذي يرس م البي ا ب ين العناص ر البس يطة ف ي ال نص ه ي العالم ة (‪ ،)/‬يس اعد عل ى تقس يم التعبي رات المركب ة إل ى ملف ات‪ ،‬وه ي عب ارة ع ن‬
‫اصناف كبرى ثم اصناف صغرى واجزاء صغيرة‪ ،‬تتمث ل ف ي العملي ات اإلعرابي ة الناتج ة ع ن التغي رات التص ريفية الت ي ت تحكم فيه ا الدوار التركيبي ة‪ .‬وه ذا م ا‬
‫يعب ر عن ه م اكس سلبرش تاين بالبني ات الص غرى الغامض ة الت ي تحت اج التعام ل ال دقيق‪ ،‬بالتعام ل إل م ع راس المتالزم ة‪ ،‬لن ه ه و ال ذي ي تحكم ف ي العملي ة‬
‫التوزيعية‪ .‬فيجوز مثال‪ ،‬إعراي السماء المركبة ويتعامل ً‬
‫صرفيا إل مع الجزء الول نحو‪:‬‬
‫جواز السفر ‪ -‬جوازي السفر ‪ -‬جوازات السفر ‪...‬‬
‫غير ان دور المستوى التصريفي يتقلص ً‬
‫تماما هنا نظ ًرا لرفض هذه البنيات اي تحرك صرفي نحو‪:‬‬
‫حيص بيص‪ /‬لكن *حيص ( جمع‪/‬مثنى‪/‬تصغير) بيص‬
‫آ‬
‫إن الش كال الص ورية المتبع ة ف ي الوص ف هن ا‪ ،‬ه ي نفس ها الت ي اعتم دت م ع التعبي رات الح رة‪ ،‬فاله دف واح د ه و بن اء نظ ام ال ي يس تطيع حوس بة الش كال‬
‫آ‬
‫اللغوية بسيطها ومركبها‪ .‬ولما كانت التعبيرات متميزة بالثبات الكلي في التعت يم ال دللي فإن ه يص عب معه ا اس تدراج اي برن امج للتع رف ال ل ي‪ .‬وه ذا م ا بق ي‬
‫قيد التجريب والختبار لحد الساعة ببناء انظمة وبيائت للمعالجة اللغوية المتطورة‪ .‬واما فكرة تصنيف البيانات اللغوي ة لمعالجته ا فينبن ي اساس ًا عل ى تص ور‬
‫آ‬
‫خوارزمي مضبوط ينس ب ك ل جمل ة او تعبي ر إل ى الص نف المناس ب له ا دون اي تردد‪،‬وذل ك لتمك ين الب رامج الخاص ة بالمع اجم ال لي ة ان تتع رف عل ى ه ذه‬
‫التعبيرات بواسطة جداول معجمية ‪-‬تركيبية بنيت لهذا الغر ‪ .‬وهذه الصناف محصورة صور ًيا في ستة بنيات صورية كما في الملحق ‪. 1‬‬
‫آ‬
‫نتائج وافاق البحث‬
‫•‬
‫غالبا ما تكون اك ثر تحج ًرا و ً‬
‫تتميز التعبيرات المتالزمة بضعف و استحالة استبدال احد العناصر التي ً‬
‫تكلسا‪ ،‬فهي بهذا العتبار ليست شفافة بل معتمة‪.‬مما‬
‫يجعلها ل تاليفية شكال ومعنى‪ .‬فهي إذن‪ ،‬حاصل حسابي بين المستوى الصوري والمستوى التركيبي والصوتي‪.‬‬
‫•‬
‫استحالة تجزيء هذه البنيات إلى ابعا وعناصر ُوع ْجمات‪ ،‬وهذا ما يعتبر حجرة عثراء امام العديد من التطبيقات الحاسوبية حيث يجب ان تشغل هذه‬
‫التعبيرات حي ًزا ً‬
‫جمليا ُيالئم المدخل المعجمي باعتباره ادنى وحدة للدللة‪.‬مما يستدعي بناء معجم مقارن للتعبيرات المتالزمة في كل اللغات‪.‬‬
‫•‬
‫تتميز التعبيرات المتالزمة بالدرجة في التعتيم ويفسر ذلك درجة البساطة والتعقيد الذي تتحكم في بناء المتوالية المتالزمة‪.‬فهي مؤلفة من مفردتين‬
‫بسيطتين بها منطقة مترابطة‪ ،‬فالتي تتوفر على منطقة مترابطة قارة اسهل َتع ُّر ًفا من غيرها من التعبيرات‪،‬مما يسهل وضعها ضمن قاعدة البيانات الخاصة‬
‫آ‬
‫بالمعجم ال لي للمفردات المركبة ‪.‬‬
‫•‬
‫آ‬
‫ينشا الغمو من اول عملية للتعرف ال لي المطرد وهو من اهم المشاكل المطروحة على المتواليات المتالزمة والمركبة‪ ،‬مما يستدعي بناء برمجيات اك ثر‬
‫تطو ًرا و مالئمة لنظام اللغة الطبيعي‪ .‬ولن يتاتى ذلك‪ ،‬إل ببناء قاعدة بيانات شاملة تتضمن جميع الصناف وليس العتماد فقط على امثلة قليلة العدد‪.‬‬
‫•‬
‫كلما كانت التعبيرات المتالزمة تتمتع بحرية استبدال عناصرها او تقبلها لتغيير ما‪ ،‬كلما كان التعرف عليها بالوتومات في النص اقل دقة‪.‬‬
‫•‬
‫تجاوز محنة فقدان كل استقالل معجمي ودللي عند إدماج السم في البنية المتالزمة‪ ،‬ببناء انحاء محلية جزئية ل تختلف عن النظام اللغوي العام‪ ،‬مما‬
‫سيساعد برامج التعرف آال لي القائمة على اوتوماتات الوضاع النهائية بوصف ادق لعناصر التعبير المتالزم‪،‬لنه تركيب خاص في ذاته ل يخرج ً‬
‫إطالقا عن نظام‬
‫الك فاية المعجمية‪.‬‬
‫ملحق(‪:)1‬‬
‫جدول يلخص الصناف الصورية للبنيات المركبة والمتالزمة‬
‫‪ -1‬ف [مت ‪ ]0‬البنية التي منطقتها الثابتة هي الفاعل‬
‫‪ -2‬ف [س ‪ 0‬س ‪ ]1‬البنية التي منطقتها الثابتة هي المفعول له المباشر البسيط‬
‫‪ -3‬ف س ‪[ 0‬ح مت‪ ]1‬البنية التي منطقتها الثابتة هي المفعول المجرور‪.‬‬
‫‪ -4‬ف س‪ [ 0‬مت ح مت] ‪1‬البنية التي منطقتها الثابتة هي المركب من عنصرين‪:‬اولهما مباشر والثاني مجرور‪.‬‬
‫‪ -5‬ف س ‪[ 0‬ح مت ح مت]‪ 1‬البنية التي منطقتها الثابتة هي مفعولها المركب من عنصرين غير مباشرين‬
‫‪ -6‬ف س ‪[ 0‬مت مت] ‪ 1‬البنية التي منطقتها الثابتة هي مفعولها المباشر المركب من عنصرين اسميين مباشرين‬
‫ً‬
‫ْ‬
‫ُ‬
‫ُ‬
‫َ‬
‫َ‬
‫وشكرا ع َلى انتب ِاهكم‬