ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Evaluating the Effect of Hybrid Arabic Classification Techniques Based on Naïve Bayes Algorithm

العنوان بلغة أخرى: تقييم تأثير خوارزمية الهجينة على تصنيف النصوص العربية
المؤلف الرئيسي: زقوت، سمية ابراهيم (مؤلف)
مؤلفين آخرين: عطير، محمد عبدالله عارف (مشرف)
التاريخ الميلادي: 2018
موقع: عمان
الصفحات: 1 - 66
رقم MD: 990655
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة عمان العربية
الكلية: كلية العلوم الحاسوبية والمعلوماتية
الدولة: الاردن
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

31

حفظ في:
المستخلص: يعتبر تصنيف النصوص من أهم التطبيقات في مجال التنقيب عن البيانات والتي لها وزنا كبيرا في العالم الرقمي الحديث، حيث أنها تستخدم في العديد من التطبيقات مثل فلترة البريد الإلكتروني، تصنيف المكتبات الإلكترونية، وكذلك تحديد التهديدات الأمنية في العديد من المجالات الأخرى. تعد الجهود البحثية المبذولة في مجال تصنيف النصوص العربية محدودة مما يفتح المجال للعمل على بحوث جديدة ومتنوعة، حيث تعد اللغة العربية من أكثر خمسة لغات متحدث بها عالميا، مما يدل على توافر النصوص العربية الإلكترونية بكثرة. في هذ الرسالة تم تطبيق مجموعة من الخوارزميات الهجينة هي SVM)، ANN، و (j48 لمعرفة تأثير خوارزمية Naive Bayes على أداء هذه الخوارزميات عند استخدامها مع كل واحدة منها على حدي. ومن خلال عملية الدمج فقد تم الحصول على ثلاثة خوارزميات هجينة سميت ب (Vote NBSVM, Vote NBANN, Vote NBJ48): وقد دمجها من خلال طريقة التصويت الموجودة في الويكا. كما تم استخدام تقنية هجينة اعتمادا على ال Naive Bayes مع خوارزمية j48 وسميت الخوارزمية الجديدة باسم NBJ48 وتم استخدام ثلاث قواعد بيانات قياسية لنصوص عربية تحتوي على 32262 مستند عربي في المجمل لتقييم عمل هذه الخوارزميات. تم مقارنة أداء الخوارزميات المدموجة مع خوارزمية NAIVE BAYES باستخدام طريقة الانتخاب، وتم تطبيق خوارزمية جديدة تم دمجها مع NAIVE BAYES في أداة WEKA. أظهرت النتائج أنه عند دمج طريقة الانتخاب للــــ NAIVE BAYES مع الخوارزميات الأخرى، فإن ذلك أدى إلى التقليل من الأداء في الخوارزميات جميعها. فقد انخفضت مستويات الدقة بها بنسبة 2.25% لخوارزمية ANN، و6.62% لخوارزمية SVM و2.52% لخوارزمية J48 ولكن النتائج أظهرت تفوق الخوارزمية الجديدة NBJ48 بنتائج ممتازة ذات تنافسية عالية وزادت من دقة J48 بنسبة 5.72%، وهذا مهم جدا خاصة أن هذه الخوارزمية لم يتم تطبيقها أبداً على النصوص العربي.

عناصر مشابهة