ارسل ملاحظاتك

ارسل ملاحظاتك لنا







A Comparative Study for Arabic Language Stemming and Classification in Different Approaches

العنوان بلغة أخرى: دراسة مقارنة لاستخراج جذور الكلمات وتصنيفها بمناهج مختلفة باللغة العربية
المؤلف الرئيسي: العمري، ربى اسماعيل (مؤلف)
مؤلفين آخرين: كنعان، غسان غازى (مشرف)
التاريخ الميلادي: 2018
موقع: عمان
الصفحات: 1 - 66
رقم MD: 990679
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة عمان العربية
الكلية: كلية العلوم الحاسوبية والمعلوماتية
الدولة: الاردن
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

27

حفظ في:
LEADER 03266nam a22003257a 4500
001 1505466
041 |a eng 
100 |9 534406  |a العمري، ربى اسماعيل  |e مؤلف 
245 |a A Comparative Study for Arabic Language Stemming and Classification in Different Approaches 
246 |a دراسة مقارنة لاستخراج جذور الكلمات وتصنيفها بمناهج مختلفة باللغة العربية 
260 |a عمان  |c 2018 
300 |a 1 - 66 
336 |a رسائل جامعية 
502 |b رسالة ماجستير  |c جامعة عمان العربية  |f كلية العلوم الحاسوبية والمعلوماتية  |g الاردن  |o 0081 
520 |a يدرس هذا البحث التصنيف التلقائي للنص العربي باستخدام تقنيات ومناهج مختلفة من المعالجة المسبقة للنصوص. يمكن تحليل المقالات الإخبارية إلى البيانات التي تمت معالجتها عن طريق تطبيق معالجة اللغة العربية الطبيعية (NLP) بطرق مختلفة. لتحليل المستندات، استخدمنا أربعة خوارزميات تصنيف شعبية مختلفة (RF, NB, SVM, KNN) تتضمن تقنيات المعالجة المسبقة للنصوص دراسة تأثير إزالة كلمات التوقف، وتطبيع النص معا، ثم تطبيق stemming. استخدمنا ثلاثة أنواع مختلفة من الجذوع (P-Stemmer، Snowball Stemmer، وخوجا Stemmer). كما تبحث الدراسة في دقة استخدام خطوات المعالجة المسبقة بتقنيات تصنيف مختلفة بالنسبة للفئات. عينة الدراسة تتألف من ٣٧٥٠ مقال إخباري مقسم على خمس فئات وقد تم تجميع البيانات من اثنا عشر جريدة إخبارية. أظهرت النتائج أن SVM متفوق على المصنفات الأخرى، كما أعطى p-stemmer نتائج جيده على كل من (SVM,RF and NB) في حين أظهر خوجا تقدما على KNN. تتمتع فئة الرياضة بأفضل نتيجة على جميع الفئات الأخرى وأعطت snowball أعلى النتائج على فئة الرياضة بدقة 98.3% 
653 |a معالجة النصوص  |a اللغة العربية  |a تقنيات المعالجة المسبقة للنصوص  |a تصنيف المناهج  |a معالجة اللغة العربية الطبيعية 
700 |9 299776  |a كنعان، غسان غازى  |g Kanaan, Ghassan  |e مشرف 
856 |u 9802-016-013-0081-T.pdf  |y صفحة العنوان 
856 |u 9802-016-013-0081-A.pdf  |y المستخلص 
856 |u 9802-016-013-0081-C.pdf  |y قائمة المحتويات 
856 |u 9802-016-013-0081-F.pdf  |y 24 صفحة الأولى 
856 |u 9802-016-013-0081-1.pdf  |y 1 الفصل 
856 |u 9802-016-013-0081-2.pdf  |y 2 الفصل 
856 |u 9802-016-013-0081-3.pdf  |y 3 الفصل 
856 |u 9802-016-013-0081-4.pdf  |y 4 الفصل 
856 |u 9802-016-013-0081-O.pdf  |y الخاتمة 
856 |u 9802-016-013-0081-R.pdf  |y المصادر والمراجع 
930 |d y 
995 |a Dissertations 
999 |c 990679  |d 990679 

عناصر مشابهة