ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Arabic Text Classification Based on Term Distribution

العنوان بلغة أخرى: تصنيف النصوص العربية بالاعتماد على توزيع المصطلحات
المؤلف الرئيسي: الشريقي، حمزة سليمان سلام (مؤلف)
مؤلفين آخرين: البشير، محمد سعيد منصور (مشرف)
التاريخ الميلادي: 2018
موقع: المفرق
الصفحات: 1 - 47
رقم MD: 902686
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة آل البيت
الكلية: كلية تكنولوجيا المعلومات
الدولة: الاردن
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

23

حفظ في:
LEADER 03434nam a22003257a 4500
001 1488062
041 |a eng 
100 |9 483570  |a الشريقي، حمزة سليمان سلام  |e مؤلف 
245 |a Arabic Text Classification Based on Term Distribution 
246 |a تصنيف النصوص العربية بالاعتماد على توزيع المصطلحات 
260 |a المفرق  |c 2018 
300 |a 1 - 47 
336 |a رسائل جامعية 
502 |b رسالة ماجستير  |c جامعة آل البيت  |f كلية تكنولوجيا المعلومات   |g الاردن  |o 0017 
520 |a في هذا البحث، تم اقتراح نظام لتصنيف نصوص العربية يعتمد على آلة دعم المتجهات (SVM)، واثنين من طرق الاختيار المحسنة للمميزات (ITFIDF وTF-IDF-CF)، وهما عبارة عن تطوير لخوارزمية (TF-IDF). النظام يتكون من ثلاث مراحل رئيسية: المعالجة المسبقة، واختيار الكلمات المميزة، والتصنيف. في مرحلة المعالجة المسبقة، يتم تحويل سلسلة مستندات الإدخال إلى كلمات. ثم تتم إزالة كلمات التوقف ويتم حذف الأرقام والرموز الخاصة. بعد ذلك، يتم تطبيق التجذير الخفيف لإزالة اللواحق والبادئات من الأحرف. بعد ذلك، يتم تحديد الميزات باستخدام TF-IDF المحسن (ITFIDF)‏ وTF-IDF-CF، ليكون بمثابة مدخلات SVM‏ لتصنيف النص. تستخدم الخوارزميات المقترحة توزيع المصطلح لتحسين خوارزمية TF-IDF. تم تطبيق نظام تصنيف النصوص العربية والتحقق منه على مجموعة بيانات من ‎20230‏ وثيقة عربية. بالإضافة إلى ذلك، تم اختبار ومقارنة نتائج الخوارزميات المقترحة بالخوارزمية (TF-IDF) باستخدام نفس مجموعة البيانات من حيث الدقة والاستدعاء ومعايير قياس F1‏. بلغت قيم معايير الأداء هذه التي تم الحصول عليها مع نظام التصنيف المقترح ‎٨٧%‏ و ‎85%‏ و86% على التوالي. للتحقق من صحة أداء النظام وخطوات المعالجة المسبقة، تم مقارنة نتائج النظام مع أبحاث سابقة بنفس الظروف. 
653 |a تصنيف النصوص العربية  |a توزيع المصطلحات  |a علوم الحاسبات  |a مصنف SVM 
700 |a البشير، محمد سعيد منصور  |g Al-Bashir, Mohammad Said  |e مشرف  |9 483571 
856 |u 9802-005-010-0017-T.pdf  |y صفحة العنوان 
856 |u 9802-005-010-0017-A.pdf  |y المستخلص 
856 |u 9802-005-010-0017-C.pdf  |y قائمة المحتويات 
856 |u 9802-005-010-0017-F.pdf  |y 24 صفحة الأولى 
856 |u 9802-005-010-0017-1.pdf  |y 1 الفصل 
856 |u 9802-005-010-0017-2.pdf  |y 2 الفصل 
856 |u 9802-005-010-0017-3.pdf  |y 3 الفصل 
856 |u 9802-005-010-0017-4.pdf  |y 4 الفصل 
856 |u 9802-005-010-0017-O.pdf  |y الخاتمة 
856 |u 9802-005-010-0017-R.pdf  |y المصادر والمراجع 
930 |d y 
995 |a Dissertations 
999 |c 902686  |d 902686 

عناصر مشابهة