A Comparative Study for Arabic Language Stemming and Classification in Different Approaches

العمري، ربى اسماعيل; كنعان، غسان غازى

A Comparative Study for Arabic Language Stemming and Classification in Different Approaches

العنوان بلغة أخرى:	دراسة مقارنة لاستخراج جذور الكلمات وتصنيفها بمناهج مختلفة باللغة العربية
المؤلف الرئيسي:	العمري، ربى اسماعيل (مؤلف)
مؤلفين آخرين:	كنعان، غسان غازى (مشرف)
محكمة:	نعم
التاريخ الميلادي:	2018
موقع:	عمان
الصفحات:	1 - 66
رقم MD:	990679
نوع المحتوى:	رسائل جامعية
اللغة:	الإنجليزية
الدرجة العلمية:	رسالة ماجستير
الجامعة:	جامعة عمان العربية
الكلية:	كلية العلوم الحاسوبية والمعلوماتية
الدولة:	الاردن
قواعد المعلومات:	Dissertations
مواضيع:	معالجة النصوص \| اللغة العربية \| تقنيات المعالجة المسبقة للنصوص \| تصنيف المناهج \| معالجة اللغة العربية الطبيعية
رابط المحتوى:	صفحة العنوان المستخلص قائمة المحتويات 24 صفحة الأولى 1 الفصل 2 الفصل 3 الفصل 4 الفصل الخاتمة المصادر والمراجع

عدد مرات التحميل

27

المستخلص:

يدرس هذا البحث التصنيف التلقائي للنص العربي باستخدام تقنيات ومناهج مختلفة من المعالجة المسبقة للنصوص. يمكن تحليل المقالات الإخبارية إلى البيانات التي تمت معالجتها عن طريق تطبيق معالجة اللغة العربية الطبيعية (NLP) بطرق مختلفة. لتحليل المستندات، استخدمنا أربعة خوارزميات تصنيف شعبية مختلفة (RF, NB, SVM, KNN) تتضمن تقنيات المعالجة المسبقة للنصوص دراسة تأثير إزالة كلمات التوقف، وتطبيع النص معا، ثم تطبيق stemming. استخدمنا ثلاثة أنواع مختلفة من الجذوع (P-Stemmer، Snowball Stemmer، وخوجا Stemmer). كما تبحث الدراسة في دقة استخدام خطوات المعالجة المسبقة بتقنيات تصنيف مختلفة بالنسبة للفئات. عينة الدراسة تتألف من ٣٧٥٠ مقال إخباري مقسم على خمس فئات وقد تم تجميع البيانات من اثنا عشر جريدة إخبارية. أظهرت النتائج أن SVM متفوق على المصنفات الأخرى، كما أعطى p-stemmer نتائج جيده على كل من (SVM,RF and NB) في حين أظهر خوجا تقدما على KNN. تتمتع فئة الرياضة بأفضل نتيجة على جميع الفئات الأخرى وأعطت snowball أعلى النتائج على فئة الرياضة بدقة 98.3%

عناصر مشابهة

A comparative study on the Arabic subjects in the standard classification schemes
بواسطة: Swaydan, Nasser Mohamed منشور: (1974)
Building A Classification Approach for Arabic Text on Semantic Web Using Cosine - Similarity
بواسطة: السرحان، حسان نضال حسان منشور: (2018)
Automatic Arabic Text Categorization Using Efficient Classification Techniques
بواسطة: Al Awadi, Mouhammd Mahmoud منشور: (2015)
Combining Different Approaches to Improve Arabic Text Documents Classification
بواسطة: Dawoud, Hassan Mohammad منشور: (2013)
Automatic Arabic text classification
بواسطة: Al Khalilah, Mohanad Salamh منشور: (2011)

A Comparative Study for Arabic Language Stemming and Classification in Different Approaches

عدد مرات التحميل

27

عناصر مشابهة

دليل المستخدم

دليل الفيديو