مشاريع صغيرة للغة عظيمة

Download Report

Transcript مشاريع صغيرة للغة عظيمة

‫يوم حرية البرمجيات‪،‬‬
‫جامعة يحيى فارس‪ ،‬المدية‪ 26 ،‬نوفمبر ‪2011‬‬
‫مشاريع صغيرة للغة عظيمة‬
‫خطوات نحو الق ّمة‬
‫طه زروقي‬
‫المجلس األعلى للغة العربية‪ ،‬الجزائر‬
‫المدرسة الوطنية العليا للمعلوماتية الجزائر‬
‫‪Taha.zerrouki@gmail‬‬
‫اإلشكالية‬
‫‪ ‬المعالجة اآللية للغة العربية موضوع هام‬
‫‪ ‬كثرة الهيئات والمخابر العاملة‬
‫‪ ‬قلة البرامج والتطبيقات‬
‫الفكرة‬
‫مشاكل‬
‫مسائل‬
‫العربية‬
‫المشاريع‬
‫مشاريع‬
‫برمجيات اللغة العربية‬
‫المدقق اإلمالئي‬
‫مفتوح المصدر‬
‫التدقيق اإلمالئي‬
‫‪ ‬إنشاء قواميس في اللغة العربية للتطبيقات المكتبية الحرة‬
‫‪ ‬قاموس التدقيق اإلمالئي العربي‬
‫‪ ‬قاموس المترادفات‬
‫‪ ‬التدقيق النحوي‬
‫‪ ‬يعتمد على المدقق اإلمالئي هانسبال‬
‫‪http://ayaspell.sf.net‬‬
‫صورة‬
http://ayaspell.sf.net
‫التميّز‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫أكثر من ‪ 1‬مليون تحميل‬
‫الحصول على جائزة المصادر المفتوحة العربية‬
‫دعم من مدينة الملك عبد العزيز للتقنية‬
‫والمنظمة العربية للتربية والثقافة والعلوم‬
‫‪http://ayaspell.sf.net‬‬
‫قطرب لتصريف األفعال‬
‫قطرب لتصريف األفعال‬
‫‪ ‬برنامج لتصريف األفعال العربية في جميع األزمنة‬
‫‪ ‬الماضي والمضارع واألمر و المبني للمجهول‬
‫‪ ‬والمؤكد‬
‫‪ ‬باالعتماد على القواعد ال الجداول‬
‫‪http://qutrub.org‬‬
‫الفكرة‬
‫فاعل يفاعل‬
‫ساءل يساءل‬
‫همزة‪+‬كسرة => ئـ‬
‫ُي ًساء ُل => ُي َسائ ُل‬
‫‪http://qutrub.org‬‬
‫صورة‬
http://qutrub.org
‫صورة‬
http://qutrub.org
‫نفطويه لتصنيف الكلمات‬
‫تصنيف الكلمات العربية‬
‫‪Naftawayh: Arabic Word Tagger ‬‬
‫‪ ‬مكتبة برمجية لتصنيف الكلمات إلى أقسامها‬
‫‪ ‬اسم‬
‫‪ ‬فعل‬
‫‪ ‬حرف‬
‫‪http://naftawayh.sf.net‬‬
‫الفكرة‬
‫‪‬‬
‫ومبدأه يعمل على بنية الكلمة العربية‪،‬‬
‫‪‬فكرة ==> اسم‬
‫‪ ‬يستغفرون ==> فعل‬
‫‪ ‬مدرس ==> اسم‬
‫‪ ‬إعالن ==> اسم‬
‫‪ ‬العربي ==> اسم‬
‫صورة‬
http://naftawayh.sf.net
‫التصحيح التلقائي‬
‫األخطاء اإلمالئية الشائعة‬
‫‪ ‬تشيع في الكتابة بالعربية بعض األخطاء مثل‬
‫‪ ‬عدم التفريق بين همزة الوصل وهمزة القطع‪،‬‬
‫‪ ‬والخلط بين الضاد والظاء‪،‬‬
‫‪ ‬إغفال نقطتي الياء‪،‬‬
‫‪ ‬وكتابة التاء المربوطة هاء‪.‬‬
‫التصحيح التلقائي‬
‫اذا أردت إستعارة كتاب‪ ،‬اذهب الى المكتبه‬
‫او االدارة فى الضهيرة‬
‫ إذا أردت استعارة كتاب‪ ،‬اذهب إلى المكتبة أو‬
‫اإلدارة في الظهيرة‬
‫تطبيقات‬
‫‪ ‬قائمة التصحيح التلقائي في برامج المكتبية‬
‫‪OpenOffice/LibreOffice‬‬
‫‪ ‬تدقيق مواقع ذات المحتوى الضخم‪ ،‬مثل ويكيبيديا‪.‬‬
‫‪ ‬مساعدة الكاتب في برامج المراسالت‪ ،‬والترجمة‪ ،‬وغيرها‪.‬‬
‫‪ ‬تدقيق المدوّ نات اللغوية (‪.)corpus‬‬
‫‪ ‬تصحيح استعالمات البحث‪.‬‬
‫‪ ‬مساعدة الكتابة في األجهزة المحمولة‬
‫‪http://ghalatawi.sf.net‬‬
‫المدقق النحوي العربي‬
‫‪‬تصحيح عالمات الترقيم‪ ،‬وبعض‬
‫األخطاء الشائعة‪.‬‬
‫ جر المثنى وجمع المذكر‬‫السالم‪.‬‬
‫ أخطاء شائعة مثل عالوة‬‫على ذلك‪،‬‬
‫‪http://ayaspell.sf.net‬‬
‫المدقق النحوي العربي‬
‫‪http://ayaspell.sf.net‬‬
http://adawaty.appspot.com
‫الموارد اللغوية‬
‫الرديف‬
‫المترادفات واألضداد‬
‫وصف‬
‫•‬
‫الرديف للقواميس المتخصصة‪:‬‬
‫–‬
‫–‬
‫–‬
‫–‬
‫المترادفات‬
‫األضداد‬
‫القوافي‬
‫جمع التكسير‬
‫تطبيقات‬
‫‪‬‬
‫مترادفات ‪OpenOffice‬‬
‫‪‬موقع للبحث عن‬
‫المترادفات واألضداد‬
‫وجموع التكسير والقوافي‬
‫‪http://radif.sf.net‬‬
‫الكلمات المستبعدة‬
‫‪Arabic Stop Words‬‬
‫الكلمات ال ُمستبعدة‬
‫‪ ‬هي الكلمات التي ُتستبعد قبل‬
‫المعالجة اآللية للبيانات (نصوص)‪.‬‬
‫‪ ‬مثل (في‪ ،‬من‪ ،‬إلى‪)...،‬‬
‫‪ ‬ويستحسن تجاهلها وعدم فهرستها‬
‫من أجل تحسين البحث‪.‬‬
‫‪http://arabicstopwords.sf.net‬‬
‫الكلمات ال ُمستبعدة مصنفة‬
‫‪‬‬
‫قائمة الكلمات المستبعدة بكل أشكالها‬
‫الراموز الوسيط‬
‫الراموز الوسيط‬
‫الراموز الوسيط‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫معجم عربي حر مفتوح‪،‬‬
‫توفيرا بيانات معجمية قابلة لالستخدام والتطوير‪،‬‬
‫للعاملين في مجال المعالجة اآللية للغة العربية‪.‬‬
‫المفردات مشكولة شكال تامّا ومرفقة بالمعلومات عن ما يلحقها من‬
‫زيادات صرفية‪.‬‬
‫فيه أكثر من ‪ 50.000‬مفردة منها‪:‬‬
‫‪ 10.000 ‬فعل عربي‪،‬‬
‫‪ 40.000 ‬اسم‬
‫‪ ‬األدوات وما استثني منها‪.‬‬
‫‪http://arramooz.sf.net‬‬
‫دليل المكانز العربية المتاحة‬
‫‪ ‬يهتم بنشر روابط المكانز (المدونات اللغوية) المفتوحة‪،‬‬
‫تسهيال لعمل اللسانيين الحاسوبيين‪.‬‬
‫‪http://aracorpus.e3rab.com/‬‬
‫تشكيلة‪ :‬مدونة النصوص العربية المشكولة‬
‫‪ ‬ضم ‪ 85‬كتابا من كتب المكتبة‬
‫الشاملة‪ ،‬وفيها ما يزيد عن ‪6‬‬
‫ماليين كلمة‪.‬‬
‫‪http://aracorpus.e3rab.com‬‬
‫مسكوك ‪ :‬المتالزمات اللفظية‬
‫‪ ‬التالزم اللفظي يساعد معرفة العالقات بين الكلمات مثال كرة‬
‫القدم‪ ،‬الوطن العربي‪ ،‬العالم اإلسالمي‪ ،‬وغيرها من الكلمات‬
‫التي تتوارد معا‪،‬‬
‫‪ ‬تطبيقها في تشكيل الكلمة حسب سياقها‪،‬‬
‫‪http://maskouk.sf.com‬‬
‫مكتبات برمجية‬
‫‪Arabic Python‬‬
‫‪ ‬مكتبة بايثون خاصة باللغة العربية‪،‬‬
‫‪ ‬تجمع وظائف للتعامل مع‪:‬‬
‫‪ ‬الحروف العربية والتعرف عليها تصنيفها‪،‬‬
‫‪ ‬وحذف الحركات من الكلمات‪،‬‬
‫‪ ‬وتنميط الكلمات‬
‫‪ ‬وغيرها‪,,,‬‬
‫‪http://pypi.python.org/pypi/Tashaphyne‬‬
‫مكتبة تاشفين للتجذيع الخفيف‬
‫‪‬‬
‫‪Arabic Light Stemming and segmentor.‬‬
‫‪ ‬تجذيع الكلمة العربية‬
‫‪ ‬استخراج الجذر‬
‫‪ ‬تقطيع الكلمة إلى جميع الحاالت الممكنة‪.‬‬
‫‪ ‬تنميط الكلمة‪.‬‬
‫‪ ‬قائمة مسبقة للزوائد وحروف الزيادة‬
‫‪ ‬إمكانية تعديل قوائم الزوائد‪.‬‬
‫‪http://pypi.python.org/pypi/Tashaphyne‬‬
‫ألعاب‬
‫لعبة الكلمة المنزلقة‬
‫‪ ‬لعبة كلمات عربية‪،‬‬
‫اجمع الحروف لتكوين‬
‫الكلمات المطلوبة على‬
‫الشاشة‬
‫‪http://arabicwordslide.sf.net‬‬
‫مدونات‬
‫مبادرة لغات البرمجة العربية‬
‫‪ ‬مدونة تهتم بلغات البرمجة العربية‪ ،‬ومتابعة أخبارها‪،‬‬
‫والدعاية لها والتواصل بين العاملين عليها‪.‬‬
‫لغة كلمات‬
‫‪ ‬لغة زاي‬
‫لغة واضح‬
‫‪ ‬لغة جيم‬
‫‪http://arabproglang.wordpress.com‬‬
‫غيوم‬
‫‪ ‬مرصد ألخبار‬
‫المشاريع العربية‬
‫المفتوحة المصدر‬
‫‪http://www.gwewm.com‬‬
‫دليل المصطلحات‬
‫دليل المصطلحات للسنة األولى إعالم آلي‬
‫دليل مصطلحات المجلس األعلى للغة العربية‬
‫مشكال‬
‫تشكيل النصوص‬
‫مشكال‪ :‬تشكيل النصوص العربية‬
‫‪ ‬ويأتي هذا المشروع في ط ّل فراغ كبير‪ ،‬ليق ّدم أول مشروع‬
‫مفتوح المصدر للتشكيل‪ ،‬بل المتاح الوحيد للمستخدم حاليا‬
‫على اإلنترنت‪ ،‬بعد أن أغلقت غوغل مشروع غوغل تشكيل‪.‬‬
‫‪http://tashkeel.qutrub.org‬‬
‫مشكال‪ :‬تشكيل النصوص العربية‬
‫اقتراح التشكيل‬
http://tashkeel.qutrub.org
‫مساهمة عربية‬
‫مروان البواب‬
‫باسم جركس‬
‫مؤيد السعدي‬
‫الشيخ سالم الصباح‬
‫طه زروقي‬
‫عصام حمود‬
‫مصطفى عمارة‬
‫المجلس األعلى‬
‫للغة العربية‬
‫خالد حسني‬
‫المنظمة العربية للتربية والثقافة والعلوم‬
‫عيون العرب‬
‫مهاويس التقنية العرب‪.‬‬
‫يوسف شهيبي‬
‫محمد كبداني‬
‫لالتصال‬
‫‪ ‬مدونتي ‪http://tahadz.wordpress.com‬‬
‫لالتصال‬
‫‪[email protected] ‬‬
‫معلومات وروابط المشاريع على مدونتي‬