Arabic SMS Spam Detection Based on Semantic Classification

أبو عودة، أيمن محمد نجيب; بركة، ربحى سليمان

Arabic SMS Spam Detection Based on Semantic Classification

المؤلف الرئيسي:	أبو عودة، أيمن محمد نجيب (مؤلف)
مؤلفين آخرين:	بركة، ربحى سليمان (مشرف)
محكمة:	نعم
التاريخ الميلادي:	2017
موقع:	غزة
الصفحات:	1 - 92
رقم MD:	876673
نوع المحتوى:	رسائل جامعية
اللغة:	الإنجليزية
الدرجة العلمية:	رسالة ماجستير
الجامعة:	الجامعة الإسلامية (غزة)
الكلية:	كلية تكنولوجيا المعلومات
الدولة:	فلسطين
قواعد المعلومات:	Dissertations
مواضيع:	الرسائل العربية القصيرة المزعجة \| الأنطولوجيا \| القواعد الدلالية \| تصنيف النص \| التسبيب
رابط المحتوى:	صفحة العنوان المستخلص قائمة المحتويات 24 صفحة الأولى 1 الفصل 2 الفصل 3 الفصل 4 الفصل 5 الفصل 6 الفصل الخاتمة المصادر والمراجع

عدد مرات التحميل

63

المستخلص:

تعرف رسائل الــ (Spam) بأنها الرسائل الإلكترونية المزعجة والغير مرغوب فيها والتي ترسل من خلال الإنترنت (الويب) أو من وإلى أجهزة الهاتف المحمول، وقد جذبت الرسائل القصيرة المزعجة المتطفلين لاستخدامها بشكل أكبر من البريد الإلكتروني المزعج؛ وذلك لعدة أسباب منها رخص هذه الطريقة في الاحتيال على الزبائن؛ حيث باستطاعتهم إرسال مجموعات هائلة من الرسائل الموجهة كإرسالها لمشتركي بلد معين، بالإضافة إلى أن استجابة المشتركين للرسائل القصيرة أكبر من استجابتهم للبريد الإلكتروني وذلك لاعتقادهم بالموثوقية العالية للرسائل القصيرة. معظم الحلول المطروحة حاليا لعلاج قضية الرسائل المزعجة لم تعد كافية حيث أنها مكلفة في بعض الأحيان، أو غير فعالة في أحيان أخرى، فمعظم التقنيات الحالية لكشف الرسائل القصيرة المزعجة قد تجاوزها المتطفلون، علاوة على تجدد أساليبهم في إرسال الرسائل القصيرة المزعجة، مما يحد من فعالية هذه الحلول، ناهيك عن أن معظم تلك الحلول موجه لخدمة لغات غير اللغة العربية. نقترح -في هذه الرسالة- طريقة جديدة لكشف الرسائل القصيرة العربية المزعجة اعتمادا على التصنيف الدلالي، وذلك باستخدام أنطولوجيا صممناها خصوصا لهذا المجال (SMS spam domain ontology) بالإضافة إلى استخدام القواعد الدلالية (semantic rules). تم إنشاء أنطولوجيا للرسائل القصيرة العربية المزعجة بدعم من WordNet العربية من خلال تحديد فئات الرسائل المزعجة والتسلسل الهرمي وإضافة مجموعة من الرسائل القصيرة المزعجة المختلفة لإنشاء قاعدة المعرفة التي تعكس المجال. ولتمكين الكشف وتصنيف الرسائل استنادا إلى قاعدة المعرفة، تمت كتابة مجموعة من القواعد الدلالية بلغة SWRL بحيث يتم استخدام هذه القواعد من قبل المسبب (reasoner) لتصنيف الرسائل كرسائل غير مرغوب فيها أو مشروعة. استنادا إلى قاعدة المعرفة المعززة هذه، تم إنشاء نظام ويب للكشف عن الرسائل غير المرغوب فيها (spam SMS) وهو يتألف من عدة وحدات مثل وحدة الاستعلام، وحدة المنطق، وحدة المرادفات، وحدة إرسال الرسائل وأخيرا وحدة المصنف. تم تقييم النظام بناء على قدرته على تصنيف وكشف الرسائل القصيرة كرسائل غير مرغوب فيها أو مشروعة. حيث تم استخدام عدد من مقاييس الأداء لهذا الغرض. وأسفر التقييم عن دقة ((Accuracy بلغت 96.5% وفي مقياس (f-measure) 90.5% وهي أفضل من تلك التي تحققت باستخدام مصنف تقليدي مثل (Naïve Bayes).

عناصر مشابهة

Ontology-Based Arabic Documents Classification
بواسطة: Abu Jasser, Mohammed M. منشور: (2015)
Enhancing Associative Classification Technique for Spam Detection
بواسطة: جراح، محمد أحمد محمد منشور: (2017)
Extracting Semantic Relations From The Quranic Arabic Based On Arabic Conjunctive Patterns
بواسطة: Bentrcia, Rahima منشور: (2018)
Deriving Ontological Semantic Relations Between Arabic Compound Nouns Concepts
بواسطة: Mezghanni, Imen Bouaziz منشور: (2017)
Immune-inspired predictive models for email classification and spam filtering
بواسطة: Al Hasan, Ali A. منشور: (2015)

Arabic SMS Spam Detection Based on Semantic Classification

عدد مرات التحميل

63

عناصر مشابهة

دليل المستخدم

دليل الفيديو