ارسل ملاحظاتك

ارسل ملاحظاتك لنا







The Effect of Improved CHI Square (As a Feature Selection Method) on Arabic Text Classifiers

العنوان بلغة أخرى: تأثير مربع كاي المطور (كطريقة اختيار الخصائص) على مصنفات النصوص العربية
المؤلف الرئيسي: الشاعر، هديل نعيم (مؤلف)
مؤلفين آخرين: عطير، محمد عبدالله عارف (مشرف)
التاريخ الميلادي: 2018
موقع: عمان
الصفحات: 1 - 95
رقم MD: 990636
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة عمان العربية
الكلية: كلية العلوم الحاسوبية والمعلوماتية
الدولة: الاردن
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

3

حفظ في:
المستخلص: يمكن تعريف تصنيف النص على أنه طريقة توزيع النصوص إلى مجموعات محددة مسبقا اعتمادا على محتوياتها. في السنوات القليلة الماضية، تضاعف حجم المعلومات في مجالات المتنوعة عبر الإنترنت، مما جعل تصنيف النصوص أحد أهم القضايا، حتى مع صعوبتها. يستخدم تصنيف النصوص بشكل كبير في العديد من التطبيقات ولأهداف مختلفة. إن الاستخدام الكبير والموسع للإنترنت، لا سيما في العالم العربي، فضلا عن العدد الهائل للوثائق والصفحات التي توفرها باللغة العربية، زادت من الحاجة إلى وجود أدوات مناسبة لتصنيف هذه الصفحات والوثائق حسب أصنافها ومواضيعها. إن الهدف من هذه الرسالة هو دراسة تأثير طريقة مربع كاي المحسنة (impCHI) على أداء ستة مصنفات نصية عربية مشهورة هي Random Forest، Decision Tree، Naïve Bayes،Naïve Bayes Multinomial ، Bayes Net، و Artificial Neural Networksالتقنيات المقترحة جميعها تعتبر جديدة ومهمة للغاية لتحسين تصنيف النصوص العربية ويمكن اعتبارها أساسا واعدا لمرحلة تصنيف النص لأنها تساهم في تصنيف النصوص إلى فئات محددة مسبقا. تضم قاعدة البيانات التي استخدمت في هذه الرسالة 9055 وثيقة عربية تم جمعها من مصادر عربية مختلفة. وبناء على محتواها، تم تقسيم هذه الوثائق إلى اثني عشر فئة مختلفة. وفيما يتعلق بالأداء، فقد تم استخدام أربعة معايير لتقييم الأداء: F-Measure، recall، precision، Time build model أظهرت نتائج التجارب أن استخدام مربع كاي المحسن يعطي نتائج تصنيف أفضل من طريقة كاي التقليدية وذلك مع جميع المصنفات التي تم دراستها، وذلك طبقاً إلى جميع معايير الأداء المستخدمة.

عناصر مشابهة