العنوان بلغة أخرى: |
طريقة محسنة لاختيار الكلمات المفتاحية لاستخدامها في فرز الوثائق |
---|---|
المؤلف الرئيسي: | عبدالرحيم، محمد حسين علي (مؤلف) |
مؤلفين آخرين: | اللحام، ياسر (مشرف) , القرم، أحمد (مشرف) |
التاريخ الميلادي: |
2016
|
موقع: | الزرقاء |
الصفحات: | 1 - 49 |
رقم MD: | 992051 |
نوع المحتوى: | رسائل جامعية |
اللغة: | الإنجليزية |
الدرجة العلمية: | رسالة ماجستير |
الجامعة: | جامعة الزرقاء |
الكلية: | كلية الدراسات العليا |
الدولة: | الاردن |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
نظم استرجاع المعلومات المفهرسة مهمة جدا لملاءمتها لفرز المستندات، وتعتبر طريقة اختيار الكلمات المفتاحية من أكثر الخطوات تأثيرا في كفاءة فرز المستندات. تقترح هذه الأطروحة نهجا ذا كفاءة في اختيار الكلمات المفتاحية لفرز المستندات، وذلك عن طريق استثناء كلمات معينة تتصف بقدرة منخفضة في الفرز بين المستندات. حيث استخدم توزيع تكرار المستندات لتقرير مدى قدرة الكلمة على الفرز. تم استخدام مجموعة البيانات رويترز 21758، حيث تم تجريبيا استثناء الكلمات ذات التكرار الأكثر وكذلك الكلمات ذات التكرار الأقل، حيث تم التأكد في كل مرة أن ما تبقى من الكلمات يتوافق مع قانون Zipf، ومن حيث العدد مع قانون Heap، ثم تطبيق فرز الوثائق باستخدام ما تبقى من الكلمات. جرى تقييم هذا النهج المقترح باستخدام مقياس النقاء وحقق نسبة النقاء 0.71 وهي قيمة مقبولة بالمقارنة مع نتائج الباحثين الآخرين على نفس مجموعة البيانات. |
---|