ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Large-Scale Arabic Text Classification Using MapReduce

العنوان بلغة أخرى: تصنيف حجم كبير للنص العربى ياستخدام MapReduce
المؤلف الرئيسي: Abu Shab, Maher M. (Author)
مؤلفين آخرين: Baraka, Rebhi Soliman (Advisor)
التاريخ الميلادي: 2015
موقع: غزة
التاريخ الهجري: 1436
الصفحات: 1 - 65
رقم MD: 697275
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: الجامعة الإسلامية (غزة)
الكلية: كلية تكنولوجيا المعلومات
الدولة: فلسطين
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

21

حفظ في:
المستخلص: أصبح تصنيف النصوص ذات النطاق الواسع (الحجم الكبير) واحدة من المشاكل الأساسية في مجال التنقيب في البيانات النصية. وهناك العديد من أعمال التصنيف النصية للغة الإنجليزية واللغات الأخرى حيث نتجت عن أداء عالي لعملية التصنيف. مع ذلك، فإن تصنيف النصوص في اللغة العربية بحاجة إلى مزيد من الاهتمام والبحث ويتطلب معالجة خاصة نظرا لأنها لغة غنية في التعبير والمعاني والنحو والصرف. أغلب الطرق الحالية لتصنيف النصوص العربية تستخدم تقنيات مثل: اختيار المزايا (Feature Selection) تمثيل البيانات (Data Representation) استخلاص المزايا (Feature Extraction) والخوارزميات المتسلسلة (Sequential Algorithms). القليل من المحاولات تمت لتصنيف النص العربي واسع النطاق بالحوسبة المتوازية. في هذا البحث قمنا باقتراح طريقة مصنف متوازي للنصوص العربية ذات النطاق الواسع يعتمد على خوارزمية التصنيف (Naïve Bayes) باستخدام نموذج الحوسبة المتوازية MapReduce مع تعزيز التسريع (Speedup) والأداء (Performance) والحفاظ على الدقة (Accuracy). أظهرت النتائج أن المصنف المتوازي المقترح يعالج بكفاءة النصوص العربي ذات الحجم الكبير. حيث أجريت التجارب على نموذج MapReduce وأظهرت النتائج تحسنا كبيرا على التسريع بنسبة تصل إلى 12 مرة أفضل من الطريقة التسلسلية لنفس المصنف وأيضا الاحتفاظ بنتائج دقة تصنيف (Accuracy) عالية وصلت إلى أعلى من 97 %.

عناصر مشابهة