العنوان بلغة أخرى: |
تأثير مقاييس المسافة والتشابه على أداء مصنف اقرب جار |
---|---|
المؤلف الرئيسي: | ابو الفيلات، حنين عرفات (مؤلف) |
مؤلفين آخرين: | الحسنات، أحمد بشير عبدالله (مشرف) |
التاريخ الميلادي: |
2017
|
موقع: | مؤتة |
الصفحات: | 1 - 180 |
رقم MD: | 951430 |
نوع المحتوى: | رسائل جامعية |
اللغة: | الإنجليزية |
الدرجة العلمية: | رسالة ماجستير |
الجامعة: | جامعة مؤتة |
الكلية: | عمادة الدراسات العليا |
الدولة: | الاردن |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
المصنف الجار الأقرب (KNN) هو واحد من أبسط المصنفات والأكثر شيوعا، وأدائه يتنافس مع المصنفات الأكثر تعقيدا في الدراسات. ويعتمد جوهر هذا المصنف أساسا على قياس المسافة أو التشابه بين المثال المختبر وأمثلة التدريب. وهذا يثير تساؤلا رئيسيا حول أي تدابير للمسافات ينبغي استخدامها في المصنف (KNN) بين عدد كبير من تدابير المسافة والتشابه؟ هذه الأطروحة تحاول الإجابة على السؤال السابق من خلال تقييم الأداء (precision, recall and accuracy) ل المصنف (KNN) باستخدام عدد كبير من تدابير المسافة، واختبارها على عدد من مجموعات البيانات في العالم الحقيقي، مع وبدون إضافة مستويات مختلفة من الضوضاء. أظهرت النتائج التجريبية أن أداء المصنف (KNN) يعتمد بشكل كبير على المسافة المستخدمة، وأظهرت النتائج فجوات كبيرة بين أداء المسافات المختلفة. على سبيل المثال وجدنا أن (Hassanat distance) تعطي أفضل أداء عندما تطبق على معظم مجموعات البيانات مقارنة بالمسافات الأخرى التي تم اختبارها. وبالإضافة إلى ذلك، فإن أداء (KNN) يقل فقط بحوالي 20% في حين أن مستوى الضوضاء يصل إلى 90%، وهذا ينطبق على جميع المسافات المستخدمة. وهذا يعني أن المصنف (KNN) باستخدام أي من المسافات العشرة الأولى يتسامح مع الضوضاء إلى درجة معينة. وعلاوة على ذلك، تبين النتائج أن بعض المسافات أقل تأثرا بالضوضاء المضافة مقارنة بمسافات أخرى، على سبيل المثال وجدنا أن (Hassanat distance) حققت أفضل أداء عندما طبقت على معظم مجموعات البيانات تحت مستويات مختلفة من الضوضاء الكثيفة. |
---|