العنوان بلغة أخرى: |
تصنيف مجموعة بيانات مرض السكري عبر تقنيات التعلم الآلي المحتفلة |
---|---|
المصدر: | المجلة العراقية للعلوم الإحصائية |
الناشر: | جامعة الموصل - كلية علوم الحاسوب والرياضيات |
المؤلف الرئيسي: | الطلباني، دلشا محمد سعيد (مؤلف) |
المؤلف الرئيسي (الإنجليزية): | Altalabani, Dilshad |
مؤلفين آخرين: | اردوغان، فيفزي (م. مشارك) |
المجلد/العدد: | مج21, ع1 |
محكمة: | نعم |
الدولة: |
العراق |
التاريخ الميلادي: |
2024
|
الصفحات: | 170 - 189 |
ISSN: |
1680-855X |
رقم MD: | 1480080 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | الإنجليزية |
قواعد المعلومات: | EcoLink |
مواضيع: | |
كلمات المؤلف المفتاحية: |
التعلم الآلي | التصنيف | مرض السكري | Machine Learning | Classification | Diabetes
|
رابط المحتوى: |
الناشر لهذه المادة لم يسمح بإتاحتها. |
المستخلص: |
أصبح مرض السكري من أكثر الأمراض انتشارا في العراق وهو مدرج كأحد الأسباب الرئيسية للوفاة. يوفر التعلم الآلي نتائج فعالة لاستخراج المعلومات من خلال إنشاء نماذج تنبؤية من مجموعات البيانات الطبية التشخيصية التي تم جمعها من مرضى السكري في العراق. في هذه الدراسة، طبقنا تصنيف التعلم الآلي لمقارنة ومقارنة أداء أشجار التصنيف والانحدار (العربة)، وآلات ناقلات الدعم (سفم)، والغابات العشوائية (رف)، وتحليل التمييز الخطي (لدا)، وأقرب الجيران (كن). سعينا إلى تصميم نموذج يمكن أن يتنبأ بأقصى قدر من الدقة باحتمالية إصابة الشخص بمرض السكري أو أنه يتمتع بصحة جيدة أو من المتوقع أن يصاب به في المستقبل باستخدام مقياسي الدقة وكابا. واستنادا إلى النتائج التي تم الحصول عليها من الخوارزميات، أظهرت أن دقة وتسلسل الخوارزميات المتعلقة ببيانات التدريب كانت الغابات العشوائية (رف)، وتصنيف وأشجار الانحدار (العربة)، ودعم آلة ناقلات (سفم)، وتحليل التمييز الخطي (لدا)، وك- أقرب الجيران (كن). في حين أظهرت نتائج بيانات الاختبار بعض الاختلافات، وكان تسلسل الخوارزميات على النحو التالي: سفم، رف، عربة، لدا، وكن كانت أعلى، على التوالي. تشير مجموعة بيانات التدريب إلى العينات التي تم استخدامها لبناء النموذج، بينما تستخدم مجموعة بيانات الاختبار لتقييم أداء النموذج. بناء على معايير التقييم التي نوقشت أعلاه، اخترنا أفضل نهج للتعلم الآلي للتنبؤ بمرض السكري في العراق لتحقيق أداء عال. يتم تقريب جميع الاستراتيجيات المذكورة أعلاه باستخدام مجموعة بيانات اختبار مرض السكري الخاضعة للإشراف. يعتبر النهج الذي يحقق أقصى قدر من الأداء من حيث الدقة وكابا الخيار الأفضل. بناء على النتائج، يمكن ملاحظة أن خوارزميات سفم ورف تنبأت بمرض السكري بمزيد من الدقة. Diabetes has become one of the most prevalent diseases in Iraq and is listed as one of the leading causes of death. Machine learning provides effective information extraction results by creating predictive models from diagnostic medical datasets collected from diabetes patients in Iraq. In this study, we applied machine learning classification to compare and contrast the performances of classification and regression trees (CART), support vector machines (SVM), random forests (RF), linear discrimination analysis (LDA), and K-nearest neighbors (KNN). We sought to design a model that can predict with maximum accuracy the probability that a person has, is healthy, or is expected to develop diabetes in the future using the two scales of accuracy and kappa. Based on the results obtained from the algorithms, it showed that the accuracy and sequence of the algorithms concerning the training data were Random Forest (RF), Classification and Regression Trees (CART), Support Vector Machine (SVM), Linear Discrimination Analysis (LDA), and K-Nearest Neighbors (KNN). While the test data results showed some differences, the sequence of the algorithms was as follows: SVM, RF, CART, LDA, and KNN were the highest, respectively. The training data set refers to the samples that were used to construct the model, whereas the testing data set is used to evaluate the model's performance. Based on the assessment criteria discussed above, we chose the best machine learning approach to predict diabetes mellitus in Iraq to achieve high performance. All of the strategies listed above are approximated using a supervised diabetes testing dataset. The approach that achieves the maximum performance in terms of accuracy and kappa is regarded as the best option. Based on the results, it can be seen that the SVM and RF algorithms predicted diabetes with more accuracy. |
---|---|
ISSN: |
1680-855X |