ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Privacy Preserving Defect Prediction Using Generalization and Entropy-Based Data Reduction

العنوان بلغة أخرى: التنبؤ بأخطاء البرمجيات مع حفظ خصوصيتها باستخدام التعميم وتقليل حجم البيانات المستند إلى الانتروبيا
المؤلف الرئيسي: اللطايفه، زينب فيصل (مؤلف)
مؤلفين آخرين: سعيفان، أحمد (مشرف)
التاريخ الميلادي: 2020
موقع: إربد
الصفحات: 1 - 87
رقم MD: 1125390
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة اليرموك
الكلية: كلية تكنولوجيا المعلومات وعلوم الحاسوب
الدولة: الاردن
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

30

حفظ في:
المستخلص: ينتج مجتمع هندسة البرمجيات بيانات يمكن تحليلها لتحسين جودة البرمجيات المستقبلية. ويمكن هذا علماء البيانات استخدام البيانات المتعلقة بعيوب وأخطاء البرمجيات الحالية لإنشاء تنبؤات بعيوب وأخطاء البرمجيات المستقبلية. ومع ذلك، فإن مشاركة هذه البيانات بشكل علني تثير مخاوف تتعلق بالخصوصية، وذلك نظرا لأن خصائص البرمجيات الحساسة عادة ما تعتبر أصولا تجارية يجب حمايتها وفقا للقانون. وقد حاولت الجهود البحثية المتعلقة بحماية خصوصية بيانات البرمجيات إلى أن إيجاد طرق تقوم بتشويش البيانات التقليدية من خلال حذف وإضافة بعض الخصائص الإحصائية لإخفاء هوية الخصائص الحساسة، لكن ذلك كان يؤدي دائما إلى انخفاض جودة البيانات التي تتم مشاركتها مع علماء البيانات والباحثين في المجال. بالإضافة إلى ذلك، فإن البيانات التي تنتجها هذه الطرق ليست محصنة ضد الهجمات المعروفة مثل الاستدلال وهجمات المعرفة المسبقة لبعض خصائص البرمجيات. تقترح هذه الدراسة طريقة جديدة لمشاركة إصدارات محمية لبيانات تتعلق بعيوب وأخطاء البرمجيات بحيث يمكن بعد ذلك استخدامها في خوارزميات علم البيانات المطبقة في مجال هندسة البرمجيات. قمنا بإنشاء نهج قائم على التعميم )التجميع( لإخفاء هوية خصائص البرمجيات الحساسة. ولتحسين جودة البيانات التي ستتم مشاركتها وقد اقترحنا طريقة جديدة تقوم على منهج تقليل حجم البيانات باستخدام طريقتين معا هما Tomek Links و AllNNلتجاهل السجلات ذات الوزن والأهمية الأقل والتي قد تؤثر على فائدة البيانات المشاركة ودقتها التنبؤية. يحافظ النهج المقترح على تنوع البيانات المشاركة وهي ميزة مهمة لتجنب الاستدلال وهجمات المعرفة المسبقة على البيانات المشفرة. أجرينا مجموعة تجارب على العديد من بيانات مرجعية تتعلق بعيوب وأخطاء البرمجيات الموجودة. وقد تم استخدام كل من جودة البيانات المشفرة ودرجة الخصوصية المتحققة لتقييم النهج المقترح. بينت نتائجنا أن النهج المقترح تفوق على التقنيات المعروفة بالاعتماد على مقياسي دقة التنبؤ بأخطاء البرمجيات وخصوصية البيانات المشاركة.

عناصر مشابهة