ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Feature Selection and Hybrid Ensemble Learning Methods for SPAM Email Classification

المؤلف الرئيسي: محمد، دعاء محمد عبدالرحيم (مؤلف)
مؤلفين آخرين: Elsayed, Ashraf Osman Ibrahim (Advisor)
التاريخ الميلادي: 2018
موقع: الخرطوم
الصفحات: 1 - 77
رقم MD: 1103866
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة النيلين
الكلية: كلية الدراسات العليا
الدولة: السودان
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

23

حفظ في:
المستخلص: أدت تقنيات التنقيب عن البيانات دورا فعالا في العديد من المجالات. أصبحت رسائل البريد الإلكتروني غير المرغوبة معضلة خطيرة ومسألة مهمة للحصول على حلول مختلفة، وتحسين الأساليب والخوارزميات. باستخدام طرق المجموعة (Ensemble) وهي المصنفات المبنية ضمن الأداة المعروفة WEKA وهي أداة تستخدم في حل مختلف أغراض التنقيب والتنصنيف عن البيانات. في هذا البحث تم استخدام تقنيات التنقيب عن البيانات لتصنيف البريد الإلكتروني العشوائي باستخدام مجموعة بيانات (spambase dataset)، والتي تم الحصول عليها من موقع جامعة كاليفورنيا. النتائج التي حققتها أدوات وتقنيات التعلم الآلي، وطرق تعلم المجموعة (Ensemble)، بعد تطبيق طرق اختيار الميزة (feature selection) على مجموعة البيانات (dataset)؛ مما أعطى نتيجة أفضل ودقة تصنيف أفضل. بالنسبة لطريقة التقييم، يتم استخدام التحقق المتقاطع (cross-validation) للاختبار التدريب، ومصفوفة الارتباك (confusion matrix) لعرض نتائج الدقة والأداء لكل مصنف. المنصنفات المستخدمة هي boosting, stacking, random subspace, bagging، والتي تم استخدامها في خمس تجارب، كل تجربة تحتوي على أربعة نماذج تعطي ما مجموعة عشرين نموذجا على الكل. أعطت مصنفات Boosting, (94.44%) random subspace, (94.6%), bagging (94.43%) وهي أفضل نتائج للدقة تم تسجيلها وذلك بعد تطبيق اختيار الميزة (feature selection)، التقنية الهجينة (hybrid technique) مقارنة بمصنف (%6.59) stacking الذي أعطى أسوأ نتائج للدقة خلال كل التجارب التي تم تطبيقها.

عناصر مشابهة