ارسل ملاحظاتك

ارسل ملاحظاتك لنا







يجب تسجيل الدخول أولا

A Comparison of Term Weighting Schemes for theses Classification

العنوان بلغة أخرى: مقارنة بين مخططات ترجيح المصطلح لتصنيف الأطروحات
المؤلف الرئيسي: المنعي، عفره بنت حميد (مؤلف)
مؤلفين آخرين: Al-Hasani, Iman (Advisor) , Wesonga, Ronald (Advisor)
التاريخ الميلادي: 2020
موقع: مسقط
الصفحات: 1 - 84
رقم MD: 1182196
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة السلطان قابوس
الكلية: كلية العلوم
الدولة: عمان
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

3

حفظ في:
LEADER 04014nam a2200361 4500
001 1536165
041 |a eng 
100 |9 632762  |a المنعي، عفره بنت حميد  |e مؤلف 
245 |a A Comparison of Term Weighting Schemes for theses Classification 
246 |a مقارنة بين مخططات ترجيح المصطلح لتصنيف الأطروحات 
260 |a مسقط  |c 2020 
300 |a 1 - 84 
336 |a رسائل جامعية 
502 |b رسالة ماجستير  |c جامعة السلطان قابوس  |f كلية العلوم  |g عمان  |o 0661 
520 |a ترجيح المصطلح هو أساس تحليل تصنيف النصوص، والذي قد يؤثر على أداء تصنيف المصنفات. تتوفر مخططات مختلفة لترجيح المصطلح ولكن تم العثور على القليل من الأدلة على وجود اختلاف أساسي بين المخططات المتاحة على أداء التصنيف. في هذا البحث، قدمنا استقصاء حول ثلاثة مخططات ترجيح: العد، مصطلح تردد-عكس تردد الوثيقة (TF-IDF) ومصطلح تردد-فئة معكوس التردد (TF-ICF). أجرينا تجارب لمقارنة المخططات الثلاثة على ملخصات أطروحات طلاب الدراسات العليا بكلية العلوم بجامعة السلطان قابوس، باستخدام خوارزميات التصنيف (Multinomial naive bayes) (MNB) و(Support vector machine) (SVM). استندت المقارنة إلى أربعة مقاييس لأداء التصنيف: Accuracy، Recall، Precision، ودرجة F1. كشفت نتائجنا أن مخطط العد باستخدام MNB أعطى معدل Recall أعلى مقارنة بالأنظمة الأخرى باستخدام SVM. بالإضافة إلى ذلك، من خلال النظر فيSVM ، وجدنا أن TF-ICF أعطت معدل Recall أعلى مقارنة بالمخططين الآخرين. تشير النتائج إلى أن مخططات ترجيح المصطلح له تأثيرات مختلفة على مقاييس أداء التصنيف. أظهرت النتائج أن نظام ترجيح العد يؤدي بشكل أفضل في تصنيف الأطروحات وخاصة مع MNB. ومع ذلك، يمكن لنظام العد باستخدام SVM التعامل مع مشكلة الفئة الغير المتوازنة بشكل أفضل من العد باستخدام MNB. بالإضافة إلى ذلك، كان لدى TF-ICF مع SVM ميزة على العد وTF-IDF مع SVM لذلك، تقترح هذه الدراسة أنه يمكن تصنيف أطروحات الطلاب باستخدام العد مع MNB أو TF-ICF مع SVM. نوصى كلية العلوم والمكتبة الرئيسية بجامعة السلطان قابوس أن تدرج ترجيح المصطلحات لتسهيل التصنيف الآلي لأطروحات الدراسات العليا. 
653 |a الأطروحات العلمية  |a خوارزميات التصنيف  |a الجامعات العمانية  |a طلبة الدراسات العليا 
700 |a Al-Hasani, Iman  |e Advisor  |9 632764 
700 |a Wesonga, Ronald  |e Advisor  |9 570875 
856 |u 9809-008-007-0661-T.pdf  |y صفحة العنوان 
856 |u 9809-008-007-0661-A.pdf  |y المستخلص 
856 |u 9809-008-007-0661-C.pdf  |y قائمة المحتويات 
856 |u 9809-008-007-0661-F.pdf  |y 24 صفحة الأولى 
856 |u 9809-008-007-0661-1.pdf  |y 1 الفصل 
856 |u 9809-008-007-0661-2.pdf  |y 2 الفصل 
856 |u 9809-008-007-0661-3.pdf  |y 3 الفصل 
856 |u 9809-008-007-0661-4.pdf  |y 4 الفصل 
856 |u 9809-008-007-0661-5.pdf  |y 5 الفصل 
856 |u 9809-008-007-0661-6.pdf  |y 6 الفصل 
856 |u 9809-008-007-0661-R.pdf  |y المصادر والمراجع 
856 |u 9809-008-007-0661-S.pdf  |y الملاحق 
930 |d y 
995 |a Dissertations 
999 |c 1182196  |d 1182196 

عناصر مشابهة