العنوان بلغة أخرى: |
الكشف عن البرامج الضارة في الأندرويد باستخدام التعلم الآلي مع ملاحظات المستخدم والميزات الثابتة |
---|---|
المؤلف الرئيسي: | مدلل، محمد مفيد محمود (مؤلف) |
المؤلف الرئيسي (الإنجليزية): | Modallal, Mohamed |
مؤلفين آخرين: | السعدة، أحمد (مشرف) |
التاريخ الميلادي: |
2020
|
موقع: | بيرزيت |
الصفحات: | 1 - 56 |
رقم MD: | 1249316 |
نوع المحتوى: | رسائل جامعية |
اللغة: | الإنجليزية |
الدرجة العلمية: | رسالة ماجستير |
الجامعة: | جامعة بيرزيت |
الكلية: | كلية الهندسة |
الدولة: | فلسطين |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
وفقا لشركة البيانات الدولية (International Data Corporation)، يشكل نظام تشغيل أندرويد (Android) معظم حصة السوق ومن المتوقع أن يزيد إلى أكثر من 87.4% بحلول نهاية عام 2023. للأسف، هناك عدد كبير من التطبيقات الضارة التي تهاجم نظام التشغيل أندرويد بطرق مختلفة. لذلك، تم إجراء العديد من الأبحاث في هذا المجال للكشف عن هذه البرامج الضارة، ولكن حتى الآن لا يوجد حل كامل يمكنه الكشف عن جميع هذه البرامج الضارة؛ خاصة البرامج الضارة الجديدة التي تزداد من عام إلى أخر. في هذا البحث، اقترحنا منهج لمكافحة البرامج الضارة الذي يكتشف تلقائيا تطبيقات أندرويد الضارة باستخدام تقنيات التعلم الآلي (machine-learning). يستخدم هذا الأسلوب 14984 تطبيقا حميدا و2116 تطبيقا ضارا من متاجرGoogle Play وAptoide مع أراء المستخدمين. تحتاج مجموعة البيانات المجمعة إلى التنظيف لتكون جاهزة للمعالجة. لذلك، يتم تطبيق مرحلة المعالجة المسبقة لتنظيف البيانات باستخدام العديد من الخطوات مثل تنظيف البيانات وتكامل البيانات وتحويل البيانات. يستخدم المنهج المقترح ميزات ثابتة مثل أذونات استخدام مصادر الأجهزة المشغلة لتطبيقات الأندرويد وتعليقات وأراء المستخدمين وميزات أخرى. تنتج مرحلة استخراج الميزات آلاف الميزات، لذلك قمنا بتطبيق مرحلة اختيار الميزة لتحديد أفضل عدد من الميزات (n-features) عن طريق تقييم استخدام الميزات مع التصنيفات المختلفة لتعلم الآلة مثل خوارزمية (support vector machines)، خوارزمية (Random Forest)؛ خوارزمية (Decision Tree)' خوارزمية (K-Nearest Neighbors)؛ خوارزمية (AdaBoost)، خوارزمية (Naive Bayes) من أجل تصنيف تطبيقات أندرويد غير المعرفة والتي إما أن تكون تطبيقات ضارة أو حميدة. تظهر نتيجة التجربة أن نهجنا يتمتع بأداء جيد جدا مقارنة بالأعمال ذات الصلة. حيث يحقق دقة (Accuracy) بقيمة 98.21% واستدعاء (Recall) بقيمة 93.52% عند استخدام خوارزمية (SVM). |
---|