ارسل ملاحظاتك

ارسل ملاحظاتك لنا







A Comparative Investigation of K-means and Partition Around Medoid Methods of Clustering : a Case Study with Acute Lymphoblastic Leukemia Data

العنوان بلغة أخرى: دراسة مقارنة بين طرق التحليل العنقودى المجمعة حول الوسط وحول الوسيط باستخدام بيانات الدم الليمفاوى الحاد : كحالة دراسية
المصدر: مجلة جامعة فلسطين للأبحاث والدراسات
الناشر: جامعة فلسطين - عمادة الدراسات العليا والبحث العلمي
المؤلف الرئيسي: Almaghri, Khaled I. A. (Author)
مؤلفين آخرين: Chakraborty, S. (Co-Author)
المجلد/العدد: مج6, ع2
محكمة: نعم
الدولة: فلسطين
التاريخ الميلادي: 2016
الشهر: يونيو
الصفحات: 361 - 381
DOI: 10.12816/0033964
ISSN: 2410-874X
رقم MD: 880956
نوع المحتوى: بحوث ومقالات
اللغة: الإنجليزية
قواعد المعلومات: EduSearch, EcoLink, HumanIndex, AraBase
مواضيع:
كلمات المؤلف المفتاحية:
B-cells | T-cells | K-means | pam | calinski | silhouette | connectivity | dunn | apn | ad | adm | fom
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

9

حفظ في:
المستخلص: طرق التحليل العنقودي مهمة جدا لفهم البيانات، يعتبر أهم تحدي لإجراء التحليل العنقودي هو اختيار الطريقة المناسبة للتحليل العنقودي وكذلك تقدير عدد العناقيد في البيانات خاصة في البيانات الغير مصنفة أصلا، وفي هذا البحث قام الباحثان بالمقارنة بين احد أهم الطرق لتقسيم البيانات وهما طريقة التحليل العنقودي المجمعة حول الوسط وطريقة التحليل العنقودي المجمعة حول الوسيط، وتم استخدام مؤشرات قياسية لكل طريقة للتنبؤ بعدد العناقيد في كل طريقة وأيضا تم استخدام عدة مؤشرات لقياس التحقق الداخلي والثبات في كل طريقة لتقييم النتائج في كل منهما وكذلك لاختبار كفاءة كل مؤشر من المؤشرات. كما تم فحص الاستقرار الداخلي لكل طريقة ومن خلال هذا الفحص تبين أن طريقة التحليل العنقودي المجمعة حول الوسط كانت أكفأ باستخدام المعايير ،(Connectivity, Dunn, Silhouette, APN, ADM, FOM) بينما كانت طريقة التحليل العنقودي المجمعة حول الوسيط أكفأ باستخدام معيار (AD) عند التطبيق على خلايا بي. بينما طريقة التحليل العنقودي المجمعة حول الوسط كانت أكفأ باستخدام المعايير (Dunn, Silhouette, APN, AD, ADM, FOM) بينما طريقة التحليل العنقودي المجمعة حول الوسيط كانت أكفأ باستخدام معيار (Connectivity) عند التطبيق على خلايا تي.

Clustering methods are important tool in data mining. The main challenge of clustering is to select the suitable method to be used for a given data set and the estimation of the number of clusters in the data set, especially in case of the unsupervised data. In this paper, a comparison between two important partitioning clustering methods namely the K-means and the Partition Around Medoid (PAM) have been considered and a special index for each has been used to estimate number of clusters. Also different indices of internal validation and stability measures have been used to compare these two methods to evaluate their performance by using these indices. Internal validation and stability measures have been used to compare between K-means and PAM for B-cells and T-cells and it has been found that for B-cells the K-means performs better than PAM by Connectivity, Dunn, Silhouette, APN, ADM, FOM indexes and PAM perform better than K-means by AD index. For T-cells, PAM performs better than K-means by Connectivity index and K-means performs better than PAM by Dunn, Silhouette, APN, AD, ADM, FOM indices.

ISSN: 2410-874X

عناصر مشابهة