ارسل ملاحظاتك

ارسل ملاحظاتك لنا









Performance Evaluation of Machine Learning Algorithms for Predictive Classification of Anemia Data

العنوان بلغة أخرى: تقييم أداء خوارزميات تعلم الآلة للتصنيف التنبؤي لبيانات فقر الدم
المصدر: مجلة جامعة كركوك للعلوم الإدارية والاقتصادية
الناشر: جامعة كركوك - كلية الإدارة والاقتصاد
المؤلف الرئيسي: فرج، شاهين محمد (مؤلف)
المؤلف الرئيسي (الإنجليزية): Faraj, Shahen Mohammed
المجلد/العدد: مج14, ع3
محكمة: نعم
الدولة: العراق
التاريخ الميلادي: 2024
الشهر: سبتمبر
الصفحات: 282 - 291
DOI: 10.32894/1913-014-003-022
ISSN: 2222-2995
رقم MD: 1528163
نوع المحتوى: بحوث ومقالات
اللغة: الإنجليزية
قواعد المعلومات: EcoLink
مواضيع:
كلمات المؤلف المفتاحية:
شبكة بايز | الغابة العشوائية | تقليم الأخطاء المخفضة | شجرة النموذج اللوجستي | تقليم الأخطاء المخفضة | Bayes Net | Random Forest | Reduced Error Pruning | Logistic Model Tree | Reduced Error Pruning
رابط المحتوى:
صورة الغلاف QR قانون
حفظ في:
المستخلص: فقر الدم هو حالة شائعة بين النساء، وغالبا ما يكون بسبب نقص الحديد أو الحمل أو فقدان الدم أثناء الدورة الشهرية. الكشف المبكر أمر بالغ الأهمية للعلاج والإدارة الفعالة. والهدف هو تقييم ومقارنة خوارزميات التعلم الآلي المختلفة لتحديد أيها الأكثر فعالية لمهام التصنيف التنبؤي في سياق البيانات الطبية. تتكون مجموعة البيانات من سجلات من ۱۸۰ امرأة، تم اختيار من عشوائيا من مدينة السليمانية، للتحقيق في فقر الدم. الخوارزميات المستخدمة لمقارنة Bayes Net (BN) و Random Forest (RF) و Random Tree (RT) و Logistic Model Tree (LMT) والأشجار J48 و Reduced Error Pruning (REP) Tree هي خوارزميات تعلم خاضعة للإشراف تستخدم على نطاق واسع لأغراض التصنيف ويتم اختيارها لتنوعها. تتم مقارنة أداء هذه الخوارزميات باستخدام معايير أداء مختلفة تستند إلى مصفوفة الارتباك، مثل الدقة والتذكير/ الحساسية، والخصوصية، ومعدل الإيجابية الحقيقية (معدل TP) ومعدل الإيجابية الكاذبة (معدل FP)، والدقة، ودرجة F، ومعامل ارتباط ماثيوز (MCC)، وخاصية تشغيل المستقبل (ROC). بناء على تحليل هذه البيانات، تظهر شجرة النموذج اللوجستي (LMT) أداء تصنيف متفوقا، حيث حققت ۹۷,۷۸% في الدقة (التصنيف الصحيح)، و٩٤,٣% في MCC، و99.6% في ROC مقارنة بالمصنفات الأخرى.

Anemia is a prevalent condition in women, often due to iron deficiency, pregnancy, or menstrual blood loss. Early detection is crucial for effective treatment and management. The objective is to evaluate and compare various machine-learning algorithms to determine which ones are most effective for predictive classification tasks in the context of medical data. The dataset consists of records from 180 women, randomly selected from several hospitals and clinics in Sulaimani City, to investigate anemia. The algorithms used for comparison of Bayes Net (BN), Random Forest (RF), Random Tree (RT), Logistic Model Tree (LMT), trees J48 and Reduced Error Pruning (REP) Tree are supervised learning algorithms used extensively for classification purposes and are chosen for their variety. The performance of these algorithms is compared using various performance criteria based on the confusion matrix, such as Accuracy, Recall/Sensitivity, Specificity, True Positive Rate (TP Rate), False Positive Rate (FP Rate), Precision, F-Score, Matthews Correlation Coefficient (MCC), and the Receiver Operating Characteristic (ROC). Based on the analysis of this data, the Logistic Model Tree (LMT) demonstrates superior classification performance, achieving 97.78% in Accuracy (Correctly Classified), 94.3% in MCC, and 99.6% in ROC compared to other classifiers.

ISSN: 2222-2995

عناصر مشابهة