ارسل ملاحظاتك

ارسل ملاحظاتك لنا







The Effect of the Number of Clusters on K-Means Performance

العنوان بلغة أخرى: تأثير عدد العناقيد على أداء خوارزمية العنقدة
المؤلف الرئيسي: الأخرس، طه محمد عثمان (مؤلف)
المؤلف الرئيسي (الإنجليزية): Alakhras, Taha Mohammad Othman
مؤلفين آخرين: عطير، محمد عبدالله عارف (مشرف)
التاريخ الميلادي: 2021
موقع: عمان
الصفحات: 1 - 109
رقم MD: 1257408
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة عمان العربية
الكلية: كلية العلوم الحاسوبية والمعلوماتية
الدولة: الاردن
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

13

حفظ في:
LEADER 04438nam a2200337 4500
001 1544887
041 |a eng 
100 |9 670514  |a الأخرس، طه محمد عثمان  |e مؤلف  |g Alakhras, Taha Mohammad Othman  
245 |a The Effect of the Number of Clusters on K-Means Performance 
246 |a تأثير عدد العناقيد على أداء خوارزمية العنقدة 
260 |a عمان  |c 2021 
300 |a 1 - 109 
336 |a رسائل جامعية 
502 |b رسالة ماجستير  |c جامعة عمان العربية  |f كلية العلوم الحاسوبية والمعلوماتية  |g الاردن  |o 0122 
520 |a الخوارزمية الأكثر استخداما في التجميع هي خوارزمية ال (K-Means)، تاريخيا تعد خوارزمية ال (K-Means) أفضل وأسرع خوارزمية تجميع بين الخوارزميات الأخرى ولديها القدرة على التعامل مع البيانات الضخمة في وقت قصير ووقت حوسبة فعال (Umargono et al, 2020). وتستخدم خوارزمية ال (K-Means) على نطاق واسع في مختلف المجالات، في التنقيب عن البيانات والتعلم الآلي ومعالجة الصور، لكن لا تزال هناك نقاط ضعف في هذه الخوارزمية أولا: يعتمد تحديد عدد المجموعات مسبقا على افتراضيات، ثانيا يكون الاختيار الأولي لعدد العناقيد عشوائيا، ومن اجل التعامل مع نقاط الضعف هذه هناك المئات من الأبحاث والكثير من الطرق لتحديد عدد العناقيد مسبقا، في هذه الدراسة سوف نوضح تأثير عدد العناقيد على أداء خوارزمية العنقدة وسوف نقترح تقنية لاستخدامها لتحديد عدد المجموعات الأمثل مسبقا ، وسنقارن نتائج التقنية المقترحة مع طريقة ال (elbow) وطريقة ال (gap) بالإضافة إلى 26 طريقة أخرى متوفرة في حزمة ال (noblest) والنسبة بين مجموع المربعات بين المجموعات(between-ss) إلى مجموع المربعات الكلى(total_ss) والتي كلما اقتربت من الواحد كلما زادة دقة العنقدة، كما سيتم استخدام ثلاثة أنواع مختلفة من مجموعة البيانات التي خضعت لدراسات سابقة على الخوارزميات العنقودية (iris dataset, wine dataset, yeast dataset)، وتشير نتائج هذه الدراسة إلى انه وبالتأكيد لا يوجد خيار بالإجماع فيما يتعلق بالعدد الأمثل للعناقيد بين جميع الطرق السابقة، وكانت نتائج التقنية المقترحة ناجحة إلى حد كبير في تحديد عدد المجموعات حيث كانت النتائج (between_SS / total_SS = 90.2%) مع مجموعة البيانات (wine) و (71.5%) مع مجموعة البيانات (iris ) و ( 81.8%) مع مجموعة البيانات (yeast) وهى نسب جيدة جدا، كما انه حاولنا إعطاء مراكز العناقيد مسبقا، كانت ناجحة مع مجموعة البيانات (wine) و (iris) و لم تنجح مع مجموعة البيانات (yeast). 
653 |a التعلم الآلي  |a الخوارزميات العنقودية  |a الخوارزميات البيانية  |a معالجة الصور  |a الصور الرقمية 
700 |a عطير، محمد عبدالله عارف  |g Otair, Mohammed A.  |e مشرف  |9 276042 
856 |u 9802-016-013-0122-T.pdf  |y صفحة العنوان 
856 |u 9802-016-013-0122-A.pdf  |y المستخلص 
856 |u 9802-016-013-0122-C.pdf  |y قائمة المحتويات 
856 |u 9802-016-013-0122-F.pdf  |y 24 صفحة الأولى 
856 |u 9802-016-013-0122-1.pdf  |y 1 الفصل 
856 |u 9802-016-013-0122-2.pdf  |y 2 الفصل 
856 |u 9802-016-013-0122-3.pdf  |y 3 الفصل 
856 |u 9802-016-013-0122-4.pdf  |y 4 الفصل 
856 |u 9802-016-013-0122-5.pdf  |y 5 الفصل 
856 |u 9802-016-013-0122-R.pdf  |y المصادر والمراجع 
856 |u 9802-016-013-0122-S.pdf  |y الملاحق 
930 |d y 
995 |a Dissertations 
999 |c 1257408  |d 1257408 

عناصر مشابهة