العنوان بلغة أخرى: |
التنبؤ بعدد الحالات المؤكدة لكوفيد-19 باستخدام تحليل السلاسل الزمنية |
---|---|
المصدر: | المجلة الفلسطينية للتكنولوجيا والعلوم التطبيقية |
الناشر: | جامعة القدس المفتوحة |
المؤلف الرئيسي: | رضوان، أكرم محمد (مؤلف) |
المؤلف الرئيسي (الإنجليزية): | Radwan, Akram Mohammed |
المجلد/العدد: | ع6 |
محكمة: | نعم |
الدولة: |
فلسطين |
التاريخ الميلادي: |
2023
|
الشهر: | كانون الثاني |
الصفحات: | 11 - 22 |
DOI: |
10.33977/2106-000-006-002 |
ISSN: |
2520-7431 |
رقم MD: | 1344639 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | الإنجليزية |
قواعد المعلومات: | science |
مواضيع: | |
كلمات المؤلف المفتاحية: |
كوفيد-19 | التحليل التنبؤي | التعلم الآلي | الانحدار | السلاسل الزمنية | Covid-19 | Predictive Analytics | Machine Learning | Regression | Time Series
|
رابط المحتوى: |
المستخلص: |
تعد جائحة كورونا (COVID-19) تهديدا صحيا عالميا رئيسيا انتشر بسرعة كبيرة في جميع أنحاء العالم. في الدراسة الحالية، قدمنا نموذجا للتنبؤ لتقدير عدد الحالات المؤكدة لكوفيد- 19 في الأسبوعين المقبلين بناء على أعداد الحالات المؤكدة مسبقا التي سجلت في 62 دولة حول العالم. تمثل الحالات التراكمية لتلك الدول حوالي 95 % من الإجمالي العالمي حتى تاريخ جمع البيانات. تم استخدام سبع خوارزميات انحدار لثلاث جولات من التنبؤات بناء على البيانات التي تم جمعها في الفترة ما بين 21 فبراير 2020 و29 ديسمبر 2020. تم استخراج عدد من ميزات السلاسل الزمنية باستخدام أساليب هندسة الميزات لتحويل التنبؤ بالسلاسل الزمنية إلى مسألة تعلم إلى خاضع للإشراف، ثم باستخدام الميزات الأكثر أهمية تم بناء نماذج الانحدار لعمل التنبؤ المطلوب. تم تقييم أداء النماذج باستخدام المقاييس التالية: جذر متوسط الخطأ اللوغاريتمي التربيعي، جذر متوسط الخطأ التربيعي، متوسط الخطأ المطلق، متوسط نسبة الخطأ المطلق، معامل التحديد (مربع معامل الارتباط) ووقت التنفيذ. أظهرت نتائج هذا البحث أن أداء نماذج الانحدار كانت جيدة، واستطاعت تقليل الخطأ بنسبة 72 % مع معامل تحديد عال R2 وصل لـ 990. على وجه الخصوص، أظهرت كل من خوارزميات XGB وRandom Forest كفاءة أعلى في الأداء مقارنة مع الخوارزميات الأخرى. The novel coronavirus (COVID-19) pandemic is a major global health threat that is spreading very fast around the world. In the current study, we present a new forecasting model to estimate the number of confirmed cases of COVID-19 in the next two weeks based on the previously confirmed cases recorded for 62 countries around the world. The cumulative cases of these countries represent about 95% of the total global up to the date of data gathering. Seven regression models have been used for three rounds of predictions based on the data collected between February 21, 2020 and December 29, 2020. A number of different time series features have generated using feature engineering methods to convert a time series forecast into a supervised learning problem and then build regression models. The performance of the models was evaluated using root mean squared log error, root mean squared error, mean absolute error, mean absolute percentage error, coefficient of determination and running time. The findings show a good performance and can reduce the error about 72% with a high coefficient of R2 = 0.990. In particular, XGB and Random Forest models have demonstrated their efficiency over other models. |
---|---|
ISSN: |
2520-7431 |