Transcript prs2030000

‫استرجاع المعلومات بالغة العربية‬
‫الطالب‪:‬‬
‫رائد الريس‬
‫عبدهللا الهدلق‬
‫حاتم بن زينة‬
‫المحاور الرئيسية‬
‫المقدمة‬
‫نبذة حول استرجاع المعلومات‬
‫طرق وأنواع استرجاع المعلومات‬
‫مشاكل استرجاع المعلومات باللغة العربية‬
‫بعض اللحلول للمشاكل‬
‫النتائج والخاتمة‬
‫المراجع‬
‫المحاور الرئيسية‬
‫المقدمة‬
‫نبذة حول استرجاع المعلومات‬
‫طرق وأنواع استرجاع المعلومات‬
‫مشاكل استرجاع المعلومات باللغة العربية‬
‫بعض اللحلول للمشاكل‬
‫النتائج والخاتمة‬
‫المراجع‬
‫المقدمـــة‬
‫‪ ‬نظام يساعد على عملية ترتيب وفرز وإحصاء أوعية المعلومات‬
‫وتسهيل الوصول إليها‪.‬‬
‫‪ ‬في السابق كان يعتمد على نظم استرجاع المعلومات في المكتبات‪.‬‬
‫‪ ‬طريقة استرجاع المعلومات بشكل عام‪.‬‬
‫‪ ‬استرجاع المعلومات باللغة العربية ومشاكلها‪.‬‬
‫المحاور الرئيسية‬
‫المقدمة‬
‫نبذة حول استرجاع المعلومات‬
‫طرق وأنواع استرجاع المعلومات‬
‫مشاكل استرجاع المعلومات باللغة العربية‬
‫بعض اللحلول للمشاكل‬
‫النتائج والخاتمة‬
‫المراجع‬
‫محاور النبذة حول استرجاع المعلومات‬
‫تعريف استرجاع المعلومات‬
‫تعريف استرجاع المعلومات العربية‬
‫الحاجة الى المعلومات‬
‫تاريخ استرجاع المعلومات‬
‫االتجاهات المستقبلية في استرجاع المعلومات‬
‫تقييم نظم استرجاع المعلومات‬
‫التعاريــــــــــــف‬
‫‪ ‬تعريف استرجاع المعلومات‬
‫هو علم البحث عن المستندات ‪ ,‬النصوص والمعلومات بداخل‬
‫المستندات ‪ ,‬وايضا البحث بداخل قواعد البيانات وصفحات‬
‫االنترنت‪.‬‬
‫‪ ‬تعريف استرجاع المعلومات العربية‬
‫هو استرجاع المعلومات التي تكون فيها اللغة العربية هي اللغة‬
‫االساس للختزان والمعالجة واالسترجاع بحيث تراعي هذه‬
‫النظم خصائص اللغة العربية ‪.‬‬
‫الحاجة الى المعلومات‬
‫‪ ‬الحاجة إلى المعلومات‬
‫‪-1‬الحاجة إلى المعلومات للمساعدة في حل مشكلة معينة أو لتيسير‬
‫اتخاذ القرار ‪.‬‬
‫‪-2‬الحاجة إلى المعلومات األساسية حول موضوع معين‪.‬‬
‫‪ -3‬الحاجة إلى المعلومات حول التطورات الجديدة في مجال معين‪.‬‬
‫تاريخ استرجاع المعلومات‬
‫‪ ‬مع تطور وسائط التخزين‪ ,‬تزايدت الحاجة الى ايجاد آلية للبحث ‪,‬‬
‫لتسهل العملية ‪.‬‬
‫‪ ‬مابين عامي ‪. 1960 – 1950‬‬
‫اول نظام استرجاع معلومات آلي ‪.‬‬
‫‪ ‬بعد ‪1990‬‬
‫وزارة الدفاع األمريكيه‬
‫محركات البحث‬
‫االتجاهات المستقبلية في استرجاع المعلومات‬
‫‪ ‬تطور أساليب البحث‪:‬‬
‫استخدام الترابط النصي ‪.Hyper text‬‬
‫‪ ‬االنظمة الخبيرة‪:‬‬
‫حيث احد اهم مكونات االنظمة الخبيره هو قاعدة المعرفة‬
‫‪.Knowledge Base‬‬
‫‪ ‬تطور تقنيات الوسائط المتعددة ‪:‬‬
‫البحث عن المعلومات واسترجاعها من خالل الصورة‬
‫والصوت‪.‬‬
‫تقييم نظم استرجاع المعلومات‬
‫‪ ‬ان الشخص الوحيد القادر على تقييم نظم استرجاع المعلومات هو‬
‫الباحث نفسه‪.‬‬
‫‪ ‬تقاس كفاءة النظام عن طريق حساب دقة البحث وحساب كفاءة‬
‫االسترجاع‪.‬‬
‫‪ ‬دقة البحث هي درجة تطابق المعلومات المسترجعة مع‬
‫المعلومات المطلوبة للباحث‪.‬‬
‫‪ ‬كفاءة االسترجاع تعبر عن درجة استرجاع جميع المعلومات‬
‫المتطابقة‬
‫المحاور الرئيسية‬
‫المقدمة‬
‫نبذة حول استرجاع المعلومات‬
‫طرق وأنواع استرجاع المعلومات‬
‫مشاكل استرجاع المعلومات باللغة العربية‬
‫بعض اللحلول للمشاكل‬
‫النتائج والخاتمة‬
‫المراجع‬
‫أنواع استرجاع المعلومات‬
‫‪ ‬أنواع استرجاع المعلومات من ناحية البيانات المسترجعة‪.‬‬
‫‪ ‬هناك العديد من وجهات النظر حول تقسيم استرجاع المعلومات‬
‫وابرزها تقسيم النكستر الى اربعة اقسام‪:‬‬
‫‪ -1‬نظم استرجاع االشارات الببليوجرافية‪:‬‬
‫شخص يبحث عن كتاب ‪ ,‬يعرف مؤلفة او عنوانه‪.‬‬
‫‪ -2‬نظم االجابة عن االسئلة ‪:‬‬
‫العملة المستخدمة في أحد الدول‪.‬‬
‫أنواع استرجاع المعلومات‬
‫‪ -3‬نظم استرجاع البيانات‪:‬‬
‫نظم بيانات التعداد او البيانات الخاصة بالخواص الفيزيائية‪.‬‬
‫‪ -4‬نظم استرجاع النصوص‪:‬‬
‫البحث عن كلمة التين في القران تاتي باآليه كامله او جزء منها‪.‬‬
‫طرق استرجاع المعلومات‬
‫‪ ‬طرق استرجاع المعلومات من ناحية طبيعة البيانات المدخلة‪,‬‬
‫تنقسم الى قسمين‪:‬‬
‫‪ ‬استرجاع المعلومات باللغة الطبيعية ‪:‬‬
‫‪ -1‬لغة طبيعية حرة‬
‫‪ -2‬لغة طبيعية مقيدة‬
‫‪ ‬استرجاع المعلومات باللغة االصطناعية‪:‬‬
‫لغة االلة الثنائية والترميز‬
‫المحاور الرئيسية‬
‫المقدمة‬
‫نبذة حول استرجاع المعلومات‬
‫طرق وأنواع استرجاع المعلومات‬
‫مشاكل استرجاع المعلومات باللغة العربية‬
‫بعض اللحلول للمشاكل‬
‫النتائج والخاتمة‬
‫المراجع‬
‫محاور مشاكل استرجاع المعلومات‬
‫التكـرار‬
‫التـرادف‬
‫االشتراك اللفظي‬
‫االشتقاقات‬
‫(ال) التعريف و (ال) األصلية‬
‫الحروف المتشابهه والزوائد‬
‫االخطاء اإلمالئية في كتابة الكلمات االعجمية‬
‫مشكلة التكــرار‬
‫‪ ‬تعريفها‪ :‬هي تكرار الكلمات والمصطلحات التي تعتبر عديمة‬
‫الدالله ‪ ,‬او ليس لها معنى ‪ ,‬وتستخدم في استرجاع الملعومات‪.‬‬
‫‪ ‬امثلتها‪:‬حروف الجر ‪ ,‬اسماء االشاره ‪ ,‬االسماء الموصوله‪,‬‬
‫حروف العطف ‪ ...‬الخ‪.‬‬
‫مشكلة التــرادف‬
‫‪ ‬تعريفها‪ :‬هو وجود اكثر من بديل للداللة على المعنى او المفهوم‬
‫الواحد‪.‬‬
‫‪ ‬امثلتها‪ :‬السيف والحسام والمهند‪.‬‬
‫مشكلة االشتراك اللفظي‬
‫‪ ‬تعريفها‪ :‬هو داللة اللفظ او الكلمة على شيئين مختلفين او اكثر ‪.‬‬
‫فهم داللة الكلمة الكلمة في سياق الجملة‪.‬‬
‫هناك نوعان من االشتراك االشتراك اللفظي‪:‬‬
‫‪ -1‬اشتراك لفظي طبيعي‪.‬‬
‫‪ -2‬اشتراك لفظي اصطناعي‪.‬‬
‫مشكلة االشتقاقات‬
‫‪ ‬السوابق تعريفها ‪:‬هي عدد من الحروف العربية التي تلتصق‬
‫بالكلمة العربية وترتبط بها ارتباطا وثيقا مما يؤدي الى تغيير‬
‫الرسم االمالئي للكلمة‪.‬‬
‫‪‬السوابق امثلتها‪:‬‬
‫(ال) التعريف (و) العطف‪.‬‬
‫‪ ‬اللواحق تعريفها‪:‬وهي الحروف المضافة على اخر الكلمة لبيان‬
‫الجمع والتثنية‪.‬‬
‫امثلة توضيحية لالشتقات اللغوية‪:‬‬
‫كلمة معلم‪:‬‬
‫المعلم‪ ،‬والمعلم‪ ،‬بمعلم‪ ،‬للمعلم‪ ،‬كمعلم‪ ،‬معلمون‪ ،‬معلمين‪ ،‬معلمان‪.‬‬
‫مشكلة (ال) التعريفية و (ال) االصلية‬
‫يكثر وجود (ال) التعريف وهي تؤثر على جودة النظام‪.‬‬
‫ومن االمثلة على ( ال ) التعريفية ‪:‬‬
‫المدرسة‬
‫ومن االمثلة على ( ال ) االصلية ‪:‬‬
‫ألغاز‬
‫مشكلة الحروف المتشابهة والزوائد‬
‫‪ ‬الحروف المتشابهة والزوائد‪:‬‬
‫‪-1‬التطويل ( ـــ )‬
‫‪-2‬الهمزة بأنواعها ( ا ‪ ,‬أ ‪ ,‬إ ‪ ,‬آ )‬
‫‪ -3‬الهاء والتاء ( ه ‪ ,‬ة )‬
‫‪ -4‬الياء وااللف المقصوره ( ي ‪ ,‬ى )‬
‫‪ ‬ومن االمثلتها‪:‬‬
‫البحث عن موقع التعريــــــب‪ ,‬من خالل كتابة التعريب‪.‬‬
‫تسجيل اكثر من مستخدم بنفس االسم (ساره ‪ ,‬سارة )‬
‫مشكلة االخطاء االمالئية في كتابة الكلمات االعجمية‬
‫‪ ‬من امثلتها‪:‬‬
‫تلفون ‪ ,‬تيليفون ‪ ,‬تليفون‬
‫المحاور الرئيسية‬
‫المقدمة‬
‫نبذة حول استرجاع المعلومات‬
‫طرق وأنواع استرجاع المعلومات‬
‫مشاكل استرجاع المعلومات باللغة العربية‬
‫بعض اللحلول للمشاكل‬
‫النتائج والخاتمة‬
‫المراجع‬
‫محاور حلول استرجاع المعلومات‬
‫التكـرار‬
‫التـرادف‬
‫االشتراك اللفظي‬
‫االشتقاقات‬
‫(ال) التعريف و (ال) األصلية‬
‫الحروف المتشابهه والزوائد‬
‫االخطاء اإلمالئية في كتابة الكلمات االعجمية‬
‫حل مشكلة التكــرار‬
‫‪ ‬الحل المقترح لمشكلة التكرار هو في قائمة االستبعاد‪.‬‬
‫‪ ‬تعريف قائمة االستبعاد‪:‬‬
‫هي القائمة التي تضم الكلمات التي ال يرد لها مصمم النظام ان‬
‫تبرز في استرجاع المعلومات‪.‬‬
‫‪ ‬مكونات قائمة االستبعاد‪:‬‬
‫أ‪ -‬الكلمات النحوية او الوظيفية‪.‬‬
‫ب‪ -‬الكلمات التي تتردد بكثافة في مجال البحث‪.‬‬
‫حل مشكلة التـــرادف‬
‫‪ ‬الحل المقترح لهذه المشكله عمل برنامج فرعي للسيطره على‬
‫مشكلة المترادفات‪.‬‬
‫‪ ‬يعتمد اساسا على ملف مساعد‬
‫يتضمن كل المترادفات الممكنة‪.‬‬
‫‪ ‬من االمثلة للمترادفات (األسد ‪ ,‬الليث ‪ ,‬الغضنفر ‪ ,‬السبع )‪.‬‬
‫حل مشكلة التـــرادف‬
‫‪ ‬خوارزمية حل مشكلة الترادف‬
‫حل مشكلة االشتراك اللفظي‬
‫‪ ‬دور السياق في توضيح داللة الكلمة‪.‬‬
‫‪ ‬حل مشكلة االشتراك اللفظي الطبيعي‪:‬‬
‫‪ -1‬اختيار مرادف اخر‪.‬‬
‫‪ -2‬اضافة كلمة او اكثر للتخصيص‪.‬‬
‫حل مشكلة االشتراك اللفظي االصطناعي‪:‬‬
‫صعوبة تطبيق هذا االمر في الحاسبات‬
‫حل مشكلة االشتقاقات اللغوية‬
‫‪ ‬إرجاع الكلمة إلى جذرها اللغوي ومن ثم اشتقاق جميع الكلمات‬
‫منه ومن ثم البحث عن هذه الكلمات المشتقة عن طريق احد‬
‫الخوارزميات المعروفه مثل خوارزمية الشلبي او االفندي‪.‬‬
‫‪ ‬محاولة فك االلتباس بين السوابق واللواحق و الحروف األصلية‬
‫مثل كلمة ( كالم ) و (لون)‪.‬‬
‫حل مشكلة االشتقاقات اللغوية‬
‫خوارزمية حل مشكلة السوابق‬
‫حل مشكلة (ال) التعريف و (ال) االصلية‬
‫‪‬حل هذه المشكلة نظريا يكمن في ارجاع الكلمة لجذرها‪.‬‬
‫‪‬الحل المقترح عمل برنامج فرعي يعتمد اساسا على تجريد‬
‫الكلمات من (ال)‪.‬‬
‫‪‬ولكن يجب االنتباه الى الكلمات التي تحتوي على الف‬
‫والم اصليتين مثل (الم) ‪.‬‬
‫حل مشكلة (ال) التعريف و (ال) االصلية‬
‫‪ ‬خوارزمية حل مشكلة (ال) التعريف‬
‫حل مشكلة الحروف المتشابهة والزوائد‬
‫‪ ‬حذف التطويل من قاعدة البيانات وحذفها عند البحث عن اسم‬
‫يحتوي على تطويل‬
‫‪ ‬البحث عن جميع المتشابهات من الحروف‬
‫حل مشكلة االخطاء االمالئية في كتابة الكلمات االعجمية‬
‫‪ ‬البحث عن الكلمات من خالل النطق الصوتي للكلمة‪ ,‬وليس كتابتها‬
‫خوازرمية ‪Soundex‬‬
‫المحاور الرئيسية‬
‫المقدمة‬
‫نبذة حول استرجاع المعلومات‬
‫طرق وأنواع استرجاع المعلومات‬
‫مشاكل استرجاع المعلومات باللغة العربية‬
‫بعض اللحلول للمشاكل‬
‫النتائج والخاتمة‬
‫المراجع‬
‫النتائج والخاتمة‬
‫‪ ‬هدف البحث‪.‬‬
‫‪ ‬اللغة العربية صالحة لالستخدام على كافة المستويات‪.‬‬
‫‪ ‬التوصيات للباحثين والناشرين‪.‬‬
‫‪ ‬خاتمة‪.‬‬
‫المحاور الرئيسية‬
‫المقدمة‬
‫نبذة حول استرجاع المعلومات‬
‫طرق وأنواع استرجاع المعلومات‬
‫مشاكل استرجاع المعلومات باللغة العربية‬
‫بعض اللحلول للمشاكل‬
‫النتائج والخاتمة‬
‫المراجع‬
‫المراجع‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫]‪ [1‬د‪.‬طالل ناظم الزهيري‪ ،‬العوامل المؤثرة في عمليات استرجاع المعلومات‪ ،‬مدونة الدكتور طالل‬
‫ناظم الزهيري‪2007 ،‬م ‪http://azuhairi.jeeran.com/files/81701.doc‬‬
‫]‪[2‬عمرو عبدالحليم ناصف‪ ،‬نظم استرجاع المعلومات‪ ،‬مدونة المكتبيين‪2008 ،‬م‬
‫‪http://librariansinmenofia.blogspot.com/2008/03/blog‬‬‫‪post_9242.html‬‬
‫]‪ [3‬د‪ .‬محمد سالم غنيم ‪،‬نظم استرجاع المعلومات العربية مظاهر الغموض وآفاق الحلول ‪،‬مكتبة‬
‫الملك فهد الوطنية السلسلة الثانية ‪2008‬م‬
‫‪http://www.kfnl.gov.sa/idarat/alnsher%20el/nothom/Pub‬‬
‫‪Main.htm‬‬
‫]‪[4‬د‪.‬فاتن سعيد بامفلح ‪،‬أساسيات نظم استرجاع المعلومات اإللكترونية‪ ،‬مكتبة الملك فهد الوطنية‬
‫السلسلة الثانية ‪2007‬م‬
‫‪http://www.kfnl.gov.sa/idarat/alnsher%20el/asaseiat%20nzm‬‬
‫‪%20istrgaa%20almalomat/PubMain.htm‬‬
‫المراجع‬
‫‪[5] ‬موقع ويكيبيديا‪ ،‬استرجاع المعلومات‪،‬‬
‫‪http://ar.wikipedia.org/wiki/‬استرجاع_المعلومات‪ ،‬آخر زيارة‪ 26 :‬أبريل ‪.2010‬‬
‫‪[6] ‬موقع ويكيبيديا‪( ،‬ال) التعريف‪http://ar.wikipedia.org/wiki/ ،‬ال‪ ،‬آخر زيارة‪:‬‬
‫‪ 20‬أبريل ‪.2010‬‬
‫‪ [7] ‬مدونة مشروع ‪،WebM‬‬
‫‪http://webmproject.blogspot.com/2010/05/introducing-webm‬‬‫‪ ،open-web-media-project.html‬آخر زيارة‪ 17 :‬ماي ‪.2010‬‬
‫استرجاع المعلومات بالغة العربية‬
‫نهاية العرض‬
‫شكرا لكم‬