العنوان بلغة أخرى: |
A Comparative Study between Discriminative Analysis and Support Vector Machine Model Applied to Diabetics in Palestine |
---|---|
المصدر: | المجلة العلمية للاقتصاد والتجارة |
الناشر: | جامعة عين شمس - كلية التجارة |
المؤلف الرئيسي: | أبو سمرة، أشرف إسماعيل محمود (مؤلف) |
المؤلف الرئيسي (الإنجليزية): | Abu Samra, Ashraf Ismail Mahmoud |
مؤلفين آخرين: | مصطفى، مصطفى جلال (م. مشارك) , الغندور، خالد محمد محمد (م. مشارك) , أبو العلا، هناء حسين على (م. مشارك) |
المجلد/العدد: | ع2 |
محكمة: | نعم |
الدولة: |
مصر |
التاريخ الميلادي: |
2023
|
الشهر: | يوليو |
الصفحات: | 343 - 372 |
ISSN: |
2636-2562 |
رقم MD: | 1395200 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | العربية |
قواعد المعلومات: | EcoLink |
مواضيع: | |
كلمات المؤلف المفتاحية: |
مرض السكر | التحليل التمييزي | آلة المتجه الداعمة | Discriminant Analysis | Support Vector Machine | Cross-Validation | Bootstrapping | Diabetic | ROC Curve
|
رابط المحتوى: |
المستخلص: |
مرض السكر من الأمراض المزمنة التي تستمر مع الفرد على مدى حياته ويعد مشكلة صحية مزمنة وعالمية. ويمتلك قطاع الصحة الفلسطيني كمية هائلة من البيانات، ولكن للأسف لم يتم تحليل معظمها لمعرفة المعلومات الخفية في البيانات لذلك يمكننا استخدام تقنيات التنقيب عن البيانات لاكتشاف الأنماط الخفية في البيانات. لتطوير نماذج ملائمة تكون مفيدة للممارسين الطبيين لاتخاذ قرارات فعالة. وتهدف هذه الدراسة لاختيار أفضل نموذج إحصائي للعوامل المؤثرة على مرض السكر في قطاع غزة (فلسطين)، من خلال المقارنة بين التحليل التمييزي واله المتجه الداعم على بيانات للمراجعين على عيادات الصحة. وفي هذه الدراسة أجريت مقارنة بين النماذج الإحصائية باستخدام أربعة أساليب مختلفة(Cross- validation with half of Bootstrapping the observations, leave-one-out cross-validation ROC curve) للوصول إلى أكثر نموذج ملائم للبيانات من خلال تقدير الدقة ومعدل الخطأ لكل نموذج. وقد بينت نتائج هذه المقارنات أن آلة المتجه الداعم هي الأفضل من حيث الدقة ومعدل الخطأ، حيث بلغت درجة الدقة 93.1% ومعدل الخطأ 6.9%. Diabetes is a chronic disease that continues with the individual throughout his life and is considered a chronic and global health problem. The Palestinian health sector has a huge amount of data, but unfortunately most of it has not been analyzed to find out the hidden information in the data. Therefore, we can use data mining techniques to discover hidden patterns in the data. To develop appropriate models that are useful for medical practitioners to make effective decisions. The aim of this study is to select the best statistical model for the factors affecting diabetes in the Gaza Strip (Palestine), through comparison between discriminant analysis and a support vector machine on data of patients attending health clinics. In this study, a comparison was made between statistical models using four different methods (Cross- validation with half of the observations, leave-one-out cross-validation, Bootstrapping, and ROC curve) to reach the most appropriate model for the data by estimating the accuracy and error rate of each model. The results of these comparisons showed that the supporting vector machine is the best in terms of accuracy and error rate, as the degree of accuracy reached 93.1% and the error rate was 9.6%. |
---|---|
ISSN: |
2636-2562 |