العنوان بلغة أخرى: |
Statistical Learning for Knowledge Discovery from Health Data: Essay on Colorectal Cancer Dataset |
---|---|
المصدر: | مجلة الاقتصاد التطبيقي والإحصاء |
الناشر: | المدرسة الوطنية العليا للإحصاء والاقتصاد التطبيقي |
المؤلف الرئيسي: | Atif, Dalia (Author) |
مؤلفين آخرين: | Benamirouche, Rachid (Co-Author) |
المجلد/العدد: | مج17, ع3 |
محكمة: | نعم |
الدولة: |
الجزائر |
التاريخ الميلادي: |
2020
|
الشهر: | ديسمبر |
الصفحات: | 84 - 100 |
ISSN: |
1112-234x |
رقم MD: | 1199237 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | الفرنسية |
قواعد المعلومات: | EcoLink |
مواضيع: | |
كلمات المؤلف المفتاحية: |
Data | Knowledge | CRC | Recurrence | IS
|
رابط المحتوى: |
الناشر لهذه المادة لم يسمح بإتاحتها. |
المستخلص: |
Hospital information systems store increasingly large and heterogeneous data volumes, the one of them is the clinical information system of colorectal cancer (CRC), which is focused on the patient’s folder, we were interested in this work to the knowledge discovery from this informational environment, in the form of prognostic factors acting on the recurrence of the disease. We worked for that on a sample of patients with histologically proven CRC. Several steps were then necessary for the KDD process, according to the biomedical data characteristics: the treatment of missing values, the discretization of continuous variables, the preselecting of variables and the rebalancing of classes. The constructed model exhibited excellent validation performance, with superior sensitivity to specificity. Les systèmes d’information hospitaliers (SIH) stockent des volumes de données de plus en plus importants et hétérogènes, parmi ces derniers figure le SI clinique du cancer colorectal (CCR) qui est centré sur le dossier du malade; nous nous sommes intéressés dans ce travail à l’extraction de connaissances (ECD) de cet environnement informationnel, sous forme de facteurs pronostiques agissant réellement sur la récidive de la maladie. Nous avons travaillé pour cela sur un échantillon de patients avec un CCR histologiquement prouvé. Plusieurs étapes furent alors nécessaires au processus ECD, selon les caractéristiques spécifiques aux données biomédicales à savoir: le traitement des valeurs manquantes, la discrétisation des variables continues, la présélection des variables et le rééquilibrage des classes. Le modèle construit a présenté d’excellentes performances en validation avec une sensibilité supérieure à la spécificité. |
---|---|
ISSN: |
1112-234x |