ارسل ملاحظاتك

ارسل ملاحظاتك لنا







A Comparison of Term Weighting Schemes for theses Classification

العنوان بلغة أخرى: مقارنة بين مخططات ترجيح المصطلح لتصنيف الأطروحات
المؤلف الرئيسي: المنعي، عفره بنت حميد (مؤلف)
مؤلفين آخرين: Al-Hasani, Iman (Advisor) , Wesonga, Ronald (Advisor)
التاريخ الميلادي: 2020
موقع: مسقط
الصفحات: 1 - 84
رقم MD: 1182196
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة السلطان قابوس
الكلية: كلية العلوم
الدولة: عمان
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

3

حفظ في:
المستخلص: ترجيح المصطلح هو أساس تحليل تصنيف النصوص، والذي قد يؤثر على أداء تصنيف المصنفات. تتوفر مخططات مختلفة لترجيح المصطلح ولكن تم العثور على القليل من الأدلة على وجود اختلاف أساسي بين المخططات المتاحة على أداء التصنيف. في هذا البحث، قدمنا استقصاء حول ثلاثة مخططات ترجيح: العد، مصطلح تردد-عكس تردد الوثيقة (TF-IDF) ومصطلح تردد-فئة معكوس التردد (TF-ICF). أجرينا تجارب لمقارنة المخططات الثلاثة على ملخصات أطروحات طلاب الدراسات العليا بكلية العلوم بجامعة السلطان قابوس، باستخدام خوارزميات التصنيف (Multinomial naive bayes) (MNB) و(Support vector machine) (SVM). استندت المقارنة إلى أربعة مقاييس لأداء التصنيف: Accuracy، Recall، Precision، ودرجة F1. كشفت نتائجنا أن مخطط العد باستخدام MNB أعطى معدل Recall أعلى مقارنة بالأنظمة الأخرى باستخدام SVM. بالإضافة إلى ذلك، من خلال النظر فيSVM ، وجدنا أن TF-ICF أعطت معدل Recall أعلى مقارنة بالمخططين الآخرين. تشير النتائج إلى أن مخططات ترجيح المصطلح له تأثيرات مختلفة على مقاييس أداء التصنيف. أظهرت النتائج أن نظام ترجيح العد يؤدي بشكل أفضل في تصنيف الأطروحات وخاصة مع MNB. ومع ذلك، يمكن لنظام العد باستخدام SVM التعامل مع مشكلة الفئة الغير المتوازنة بشكل أفضل من العد باستخدام MNB. بالإضافة إلى ذلك، كان لدى TF-ICF مع SVM ميزة على العد وTF-IDF مع SVM لذلك، تقترح هذه الدراسة أنه يمكن تصنيف أطروحات الطلاب باستخدام العد مع MNB أو TF-ICF مع SVM. نوصى كلية العلوم والمكتبة الرئيسية بجامعة السلطان قابوس أن تدرج ترجيح المصطلحات لتسهيل التصنيف الآلي لأطروحات الدراسات العليا.

عناصر مشابهة