ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Arabic SMS Spam Detection Based on Semantic Classification

المؤلف الرئيسي: أبو عودة، أيمن محمد نجيب (مؤلف)
مؤلفين آخرين: بركة، ربحى سليمان (مشرف)
التاريخ الميلادي: 2017
موقع: غزة
الصفحات: 1 - 92
رقم MD: 876673
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: الجامعة الإسلامية (غزة)
الكلية: كلية تكنولوجيا المعلومات
الدولة: فلسطين
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

60

حفظ في:
المستخلص: تعرف رسائل الــ (Spam) بأنها الرسائل الإلكترونية المزعجة والغير مرغوب فيها والتي ترسل من خلال الإنترنت (الويب) أو من وإلى أجهزة الهاتف المحمول، وقد جذبت الرسائل القصيرة المزعجة المتطفلين لاستخدامها بشكل أكبر من البريد الإلكتروني المزعج؛ وذلك لعدة أسباب منها رخص هذه الطريقة في الاحتيال على الزبائن؛ حيث باستطاعتهم إرسال مجموعات هائلة من الرسائل الموجهة كإرسالها لمشتركي بلد معين، بالإضافة إلى أن استجابة المشتركين للرسائل القصيرة أكبر من استجابتهم للبريد الإلكتروني وذلك لاعتقادهم بالموثوقية العالية للرسائل القصيرة. معظم الحلول المطروحة حاليا لعلاج قضية الرسائل المزعجة لم تعد كافية حيث أنها مكلفة في بعض الأحيان، أو غير فعالة في أحيان أخرى، فمعظم التقنيات الحالية لكشف الرسائل القصيرة المزعجة قد تجاوزها المتطفلون، علاوة على تجدد أساليبهم في إرسال الرسائل القصيرة المزعجة، مما يحد من فعالية هذه الحلول، ناهيك عن أن معظم تلك الحلول موجه لخدمة لغات غير اللغة العربية. نقترح -في هذه الرسالة- طريقة جديدة لكشف الرسائل القصيرة العربية المزعجة اعتمادا على التصنيف الدلالي، وذلك باستخدام أنطولوجيا صممناها خصوصا لهذا المجال (SMS spam domain ontology) بالإضافة إلى استخدام القواعد الدلالية (semantic rules). تم إنشاء أنطولوجيا للرسائل القصيرة العربية المزعجة بدعم من WordNet العربية من خلال تحديد فئات الرسائل المزعجة والتسلسل الهرمي وإضافة مجموعة من الرسائل القصيرة المزعجة المختلفة لإنشاء قاعدة المعرفة التي تعكس المجال. ولتمكين الكشف وتصنيف الرسائل استنادا إلى قاعدة المعرفة، تمت كتابة مجموعة من القواعد الدلالية بلغة SWRL بحيث يتم استخدام هذه القواعد من قبل المسبب (reasoner) لتصنيف الرسائل كرسائل غير مرغوب فيها أو مشروعة. استنادا إلى قاعدة المعرفة المعززة هذه، تم إنشاء نظام ويب للكشف عن الرسائل غير المرغوب فيها (spam SMS) وهو يتألف من عدة وحدات مثل وحدة الاستعلام، وحدة المنطق، وحدة المرادفات، وحدة إرسال الرسائل وأخيرا وحدة المصنف. تم تقييم النظام بناء على قدرته على تصنيف وكشف الرسائل القصيرة كرسائل غير مرغوب فيها أو مشروعة. حيث تم استخدام عدد من مقاييس الأداء لهذا الغرض. وأسفر التقييم عن دقة ((Accuracy بلغت 96.5% وفي مقياس (f-measure) 90.5% وهي أفضل من تلك التي تحققت باستخدام مصنف تقليدي مثل (Naïve Bayes).

عناصر مشابهة