ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Conditional Light Stemming for Enhanced Arabic Information Retrieval

العنوان بلغة أخرى: تحسين استرجاع المعلومات باللغة العربية باستخدام تجذيع مخفف مشروط
المؤلف الرئيسي: مطارنة، خولة (مؤلف)
مؤلفين آخرين: حسان، محمد (مشرف)
التاريخ الميلادي: 2017
موقع: الزرقاء
الصفحات: 1 - 58
رقم MD: 992633
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة الزرقاء
الكلية: كلية الدراسات العليا
الدولة: الاردن
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

30

حفظ في:
المستخلص: شهد مجال استرجاع المعلومات (Information Retrieval) تطورا ملحوظا في العقود الأخيرة وذلك نتيجة النمو المتزايد للشبكة العنكبوتية وحاجة المستخدمين الماسة للبحث في هذا الكم الهائل من المعلومات الرقمية. وهذا يتطلب إيجاد أنظمة استرجاع معلومات تعتني بالخصائص الفريدة للغة العربية وتحسن التعامل معها. اللغة العربية لغة اشتقاقية وليست إلصاقيه، حيث يعد نظامها الصرفي من أكثر النظم الصرفية تطورا، فهو مبني على تصريف الجذور بناء على مجموعة محددة من الأوزان. وكل ما سبق ذكره يمثل تحديات لمكننة التحليل الصرفي والإعرابي للغة العربية ومن ثم لاسترجاع النصوص العربية. هناك العديد من الأنظمة التي تم بنائها لاسترجاع المعلومات باللغة العربية مثل Light Stemmer (التجريد الخفيف) و heavy stemmers (التجريد الثقيل) وغيرها من المحللات الصرفية المعقدة. Light Stemmer أظهر (التجريد الخفيف) فعالية أكثر في استرجاع المعلومات، يعتبر Light10 أفضل نسخة من سلسلة Light Stemmer فهو يزيل حروف السوابق وحروف اللواحق من الكلمة إذا كانت موجودة في جدول معرف مسبقا، لا يوجد شروط لإزالة اللواحق في Light10، لذا من الممكن أن يكون هناك كلمتين بنفس الجذر ولكن لهما معاني مختلفة. في هذه الرسالة سيتم إنشاء نظام استرجاع لزيادة كفاءة عملية الاسترجاع والفهرسة من خلال اقتراح إضافة حروف سوابق وحروف لواحق إلى الجدول، ويفرض بعض الشروط على إزالة هذه اللواحق. تنفيذ واختبار الطريقة المقترحة تظهر دقة أفضل من Light10 حيث أظهرت النتائج أن (التجريد الخفيف المشروط) Conditional Light stemmer حقق معدل تحسين 5% أكثر من Light10 الأصلي.

عناصر مشابهة