المستخلص: |
بسبب تزايد حجم المعلومات على الإنترنت والاستخدام المستمر لشبكات التواصل الاجتماعي العربية مثل الفيسبوك تويتر، لينكد إن، الواتس آب، إنستغرام ينتهز مرسلو الرسائل غير المرغوب فيها على مواقع التواصل الاجتماعي دائما الفرصة لنشر الرسائل المزعجة الخاصة بهم ولاسيما الإعلانات والاحتيال. أدى العدد المتزايد من مرسلي الرسائل غير المرغوب فيها في شبكات التواصل الاجتماعي في الوطن العربي إلى ضرورة دراسة استخدام نمذجة الموضوعات لتحديد الرسائل غير المرغوب فيها في شبكات التواصل الاجتماعي العربية. في هذه الأطروحة، استخدمنا نهج النمذجة التلقائية للموضوع غير الخاضع للإشراف لاكتشاف الرسائل غير المرغوب فيها في شبكات التواصل الاجتماعي العربية واستخدمنا الخوارزمية الجينية لتحسين النتائج. تم استخدام (2290) من التعليقات العربية التي تم جمعها من منشورات المناقشة على فيسبوك والتي تم جمعها بشكل يدوي وتطبيق نهج نمذجة الموضوعات مع المتغيرات الخاصة بها. تم تقييم جودة نموذج الموضوع باستخدام مقياس التماسك بقيمة تساوي 0.29388، ثم تم تطبيق الخوارزمية الجينية على مدار 100 جيل، حدث تحسن في التماسك بقيمة تساوي 0.641395. طبقنا 13 مصنفا للتعلم الآلي مع ثلاث ميزات على مجموعة البيانات العربية باستخدام أناكوندا حيث أظهرت النتائج أن المصنف البيرسيبترون مع خاصية تمثيل ن-غرام أعطت أفضل أداء بقيمة 0.90
|