ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Apprentissage Statistique pour L’extraction de Connaissances a Partir de Donnees Sanitaires: Essai sur Donnees du Cancer Colorectal

العنوان بلغة أخرى: Statistical Learning for Knowledge Discovery from Health Data: Essay on Colorectal Cancer Dataset
المصدر: مجلة الاقتصاد التطبيقي والإحصاء
الناشر: المدرسة الوطنية العليا للإحصاء والاقتصاد التطبيقي
المؤلف الرئيسي: Atif, Dalia (Author)
مؤلفين آخرين: Benamirouche, Rachid (Co-Author)
المجلد/العدد: مج17, ع3
محكمة: نعم
الدولة: الجزائر
التاريخ الميلادي: 2020
الشهر: ديسمبر
الصفحات: 84 - 100
ISSN: 1112-234x
رقم MD: 1199237
نوع المحتوى: بحوث ومقالات
اللغة: الفرنسية
قواعد المعلومات: EcoLink
مواضيع:
كلمات المؤلف المفتاحية:
Data | Knowledge | CRC | Recurrence | IS
رابط المحتوى:
صورة الغلاف QR قانون
حفظ في:
المستخلص: Hospital information systems store increasingly large and heterogeneous data volumes, the one of them is the clinical information system of colorectal cancer (CRC), which is focused on the patient’s folder, we were interested in this work to the knowledge discovery from this informational environment, in the form of prognostic factors acting on the recurrence of the disease. We worked for that on a sample of patients with histologically proven CRC. Several steps were then necessary for the KDD process, according to the biomedical data characteristics: the treatment of missing values, the discretization of continuous variables, the preselecting of variables and the rebalancing of classes. The constructed model exhibited excellent validation performance, with superior sensitivity to specificity.

Les systèmes d’information hospitaliers (SIH) stockent des volumes de données de plus en plus importants et hétérogènes, parmi ces derniers figure le SI clinique du cancer colorectal (CCR) qui est centré sur le dossier du malade; nous nous sommes intéressés dans ce travail à l’extraction de connaissances (ECD) de cet environnement informationnel, sous forme de facteurs pronostiques agissant réellement sur la récidive de la maladie. Nous avons travaillé pour cela sur un échantillon de patients avec un CCR histologiquement prouvé. Plusieurs étapes furent alors nécessaires au processus ECD, selon les caractéristiques spécifiques aux données biomédicales à savoir: le traitement des valeurs manquantes, la discrétisation des variables continues, la présélection des variables et le rééquilibrage des classes. Le modèle construit a présenté d’excellentes performances en validation avec une sensibilité supérieure à la spécificité.

ISSN: 1112-234x

عناصر مشابهة