استخدام السلاسل الزمنية لمخرجات التحليل العنقودي مع التطبيق العملي

العنوان بلغة أخرى: Clustering of Time Series Data with Application
المصدر: مجلة تكريت للعلوم الإدارية والاقتصادية
الناشر: جامعة تكريت - كلية الإدارة والاقتصاد
المؤلف الرئيسي: حسين، سمية علي (مؤلف)
مؤلفين آخرين: هدبة، وكاع علي (م. مشارك)
المجلد/العدد: مج17, ع55
محكمة: نعم
الدولة: العراق
التاريخ الميلادي: 2021
الشهر: سبتمبر
الصفحات: 477 - 495
ISSN: 1813-1719
رقم MD: 1205629
نوع المحتوى: بحوث ومقالات
اللغة: العربية
قواعد المعلومات: EcoLink
كلمات المؤلف المفتاحية:
عنقدة السلاسل الزمنية | التنبؤ | سلاسل زمنية | مسافة القطاع "منهاتن" | Time Series Clustering | Forecasting | ARIMA | Time Series | City-Block 'Manhaten" Distance
رابط المحتوى:
المستخلص: Cluster analysis in time series data is one of the important topics in analyzing data and finding similar trends in time series, which represents a major challenge in various fields. Scientists have increased interest in studying time series data clustering, as it has proven its effectiveness in providing important information in various fields. Clustering time-series data to facilitate prediction of formed clusters and exploit time and effort. Clustering time-series data has been used in various scientific fields to discover patterns that enable data analysts to extract valuable information from a large and complex data set. Homogeneous clusters are grouped together on the basis of a specific similarity measure. The monthly data of electrical energy productivity in Kirkuk was used to study its temporal behavior. The hierarchical clustering method was used, and the method adopted in the linkage method is the hierarchical linking method, the ward's method, based on the similarity matrix, and we adopted the city block distance scale manhaten) distance to find the similarity matrix between clusters and in order to reach homogeneous groups (clusters) that have common characteristics based on their productivity, hierarchical clustering, tree diagramming and prediction of future values of cluster productivity are used. The most important findings of the research are the formation of four clusters and the construction of a time series model for each cluster, and through the analysis of the series, it was found that it is unstable and not random, and for the purpose of achieving stability and randomness, the necessary conversions were made, and the differentiation criteria (Akaik, Information Criteria: AIC) were used. (Schwartz Bayesian Criteria: SBIC), (Hanna-Quinn Criterion: H-Q), (Root Mean Sguare Error RMSE). To diagnose the significant models to choose the appropriate and efficient model, the prediction for the first cluster is in the ARIMA(0,1,1) model, the model that was used for the second cluster is SARIMA(2,0,0)x(1,1,2)12, the third cluster due to stopping the units About production since 2014 and until now the units have been idle, meaning that they do not produce electricity as a basis for leaving the rehabilitation works, the future values predicted here are zero, the fourth cluster was used ARIMA (2.1.0) model and the predictions were good and close to reality for the period from November 2020 to November 2022 for a period of two years.

يعد التحليل العنقودي في بيانات السلاسل الزمنية من الموضوعات المهمة في تحليل البيانات وإيجاد اتجاهات متشابهة في السلاسل الزمنية الذي يمثل تحديا كبيرا في مختلف المجالات ازداد الاهتمام بدراسة عنقدة بيانات السلاسل الزمنية منقبل العلماء حيث أثبتت فعالياتها في توفير معلومات مهمة في مختلف المجالات استهدف البحث بصورة أساسية عملية العنقدة لبيانات السلاسل الزمنية لتسهيل التنبؤ للعناقيد المتكونة واستغلال الوقت والجهد، تم استخدام عنقدة بيانات السلاسل الزمنية في مجالات علمية متنوعة لاكتشاف الأنماط التي تمكن محللي البيانات من استخراج معلومات قيمة من مجموعة بيانات معقدة وضخمة ويتم تجميع (عنقدة) المجموعات المتجانسة معا على أساس مقياس تشابه معين. واستخدمت البيانات الشهرية لإنتاجية الطاقة الكهربائية في كركوك لدراسة السلوكية الزمنية لها، تم استخدام طريقة العنقدة الهرمية Hierarchical Clustering Method والطريقة المعتمدة في طريقة الربط هي طريقة الربط الهرمية طريقة وورد (ward’s method) بالاعتماد على مصفوفة التشابه واعتمدنا على مقياس مسافة القطاع مسافة منهاتن City-block (manhaten) distance لإيجاد مصفوفة التشابه بين العناقيد وبغية الوصول إلى مجموعات (عناقيد) متجانسة التي تجمعها صفات مشتركة بالاعتماد على إنتاجيتها، تستخدم العنقدة الهرمية التجميعية ورسم المخطط الشجري والتنبؤ بالقيم المستقبلية لإنتاجية العناقيد. أن اهم النتائج التي توصل اليها البحث هي تكوين أربعة عناقيد وبناء نموذج سلاسل زمنية لكل عنقود، ومن خلال تحليل السلسلة تبين أنها غير مستقرة وغير عشوائية ولغرض تحقيق الاستقرارية والعشوائية تم إجراء التحويلات اللازمة، واستخدام معايير المفاضلة (Schwartz Bayesian Criteria: SBIC) (Akaik, Information Criteria: AIC) (Root Mean Sguare Error: RMSE) (Hanna-Quinn Criterion: H-Q) لتشخيص النماذج المعنوية لاختيار النموذج الملائم والكفؤ، التنبؤ للعنقود الأول بالنموذج (0.1.1) ARIMA ، النموذج الذي تم استخدامه للعنقود الثاني هو SARIMA (2,0,0)x(1,1,2)12، العنقود الثالث بسبب توقف الوحدات عن الإنتاج منذ سنة 2014 ولحد الآن الوحدات معطلة أي أنها لا تنتج الكهرباء أساسا لترك أعمال التأهيل فأن القيم المستقبلية المتنبئ بها هنا تكون صفر، العنقود الرابع تم استخدام النموذج (2,1,0)ARIMA وكانت التنبؤات جيدة وقريبة من الواقع للفترة من تشرين الثاني 2020 لغاية تشرين الثاني 2022 لمدة سنتين.

