العنوان بلغة أخرى: |
Building an Expert System for Classifying University Theses Using the Naïve Bayes Algorithm: An Empirical Study |
---|---|
المصدر: | آداب الرافدين |
الناشر: | جامعة الموصل - كلية الآداب |
المؤلف الرئيسي: | هادى، إيناس جاسم (مؤلف) |
المؤلف الرئيسي (الإنجليزية): | Hadi, Enas Jasim |
المجلد/العدد: | مج52, ملحق |
محكمة: | نعم |
الدولة: |
العراق |
التاريخ الميلادي: |
2022
|
التاريخ الهجري: | 1444 |
الشهر: | كانون الأول |
الصفحات: | 650 - 689 |
ISSN: |
0378-2867 |
رقم MD: | 1487719 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | العربية |
قواعد المعلومات: | AraBase |
مواضيع: | |
كلمات المؤلف المفتاحية: |
تصنيف النصوص العربية | النظم الخبيرة | خوارزمية Naïve Bayes | Arabic Text Classification | Expert Systems | Naïve Bayes Algorithm
|
رابط المحتوى: |
الناشر لهذه المادة لم يسمح بإتاحتها. |
المستخلص: |
صار تصنيف البيانات من الحقول المعرفية واسعة الانتشار، ولا سيما في ظل التطور الهائل لتكنولوجيا المعلومات والنظم الخبيرة، ومن بين أبرز حقول المعرفة التي تعنى بتصنيف البيانات هو تصنيف البيانات النصية، في بحثنا هذا نقدم نموذجا لنظام خبير مهمته تصنيف الرسائل الجامعية اعتمادا على عناوينها العربية وباستخدام خوارزمية (Naïve Bayes). في البحث تم استخدام قاعدة بيانات تم تجميعها باستخدام تقنية (Scrapping) وتتمثل في جمع البيانات من المستودعات المنتشرة على شبكة الإنترنت؛ إذ جرى بناء قاعدة بيانات قوامها (6100) عنوان لرسالة ماجستير وأطروحة دكتوراه، توزعت هذه العناوين على (سبعة) فئات تمثل الاختصاص العام للرسالة- الأطروحة. من بين أبرز التحديات التي واجهت البحث هو طبيعة اللغة العربية ودرجة تعقيدها. أثبتت نتائج البحث أن الأنموذج كان قادرا على تصنيف الرسائل بنسبة (86 %) وهي نسبة تعد واعدة بشكل كبير. كما جرى أيضا تقييم للنموذج المقترح عن طريق توزيع استبانة لعدد من المختصين في علم الحاسبات ونظم المعلومات، اشتمل الاستبانة على قياس أثر متغيرين مستقلين هما دقة النظام الخبير وأهميته. أثبتت النتائج أن هنالك تأثيرا ذو دلالة إحصائية للمتغيرين المستقلين على المتغير المعتمد (الفائدة المتوخاة من النظام الخبير). إن نتائج البحث تفتح أفاقا جديدة في عملية تصنيف البيانات النصية وبالأخص اللغة العربية، وتفتح المجال صوب تنفيذ خوارزميات أخرى ومقارنة النتائج. Data classification has become a widespread field of knowledge, especially in light of the tremendous development of information technology and expert systems. Among the most important fields of knowledge that are concerned with data classification is the classification of text data. In our research, we present a model for an expert system whose task is to classify university theses and theses based on their Arabic titles and using the Naïve Bayes algorithm. In the research, a database was used, which was compiled using the (Scrapping) technique, which is to collect data from repositories spread on the Internet. A database of (6100) titles for a master's thesis and a doctoral thesis was built. These titles were divided into (seven) categories representing the general specialization of the thesis- thesis. Among the most important challenges faced by the research is the nature of the Arabic language and its degree of complexity. The results of the research proved that the model was able to classify theses and theses at a rate of (86%), which is a very promising percentage. The proposed model was also evaluated by distributing a questionnaire to a number of specialists in computer science and information systems. The questionnaire included measuring the impact of two independent variables, namely, the accuracy and importance of the expert system. The results proved that there is a statistically significant effect of the independent variables on the dependent variable (the desired benefit of the expert system). The results of the research open new horizons in the process of classifying textual data, especially the Arabic language, and open the way towards implementing other algorithms and comparing the results. |
---|---|
ISSN: |
0378-2867 |