العنوان بلغة أخرى: |
تصنيف حجم كبير للنص العربى ياستخدام MapReduce |
---|---|
المؤلف الرئيسي: | Abu Shab, Maher M. (Author) |
مؤلفين آخرين: | Baraka, Rebhi Soliman (Advisor) |
التاريخ الميلادي: |
2015
|
موقع: | غزة |
التاريخ الهجري: | 1436 |
الصفحات: | 1 - 65 |
رقم MD: | 697275 |
نوع المحتوى: | رسائل جامعية |
اللغة: | الإنجليزية |
الدرجة العلمية: | رسالة ماجستير |
الجامعة: | الجامعة الإسلامية (غزة) |
الكلية: | كلية تكنولوجيا المعلومات |
الدولة: | فلسطين |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
أصبح تصنيف النصوص ذات النطاق الواسع (الحجم الكبير) واحدة من المشاكل الأساسية في مجال التنقيب في البيانات النصية. وهناك العديد من أعمال التصنيف النصية للغة الإنجليزية واللغات الأخرى حيث نتجت عن أداء عالي لعملية التصنيف. مع ذلك، فإن تصنيف النصوص في اللغة العربية بحاجة إلى مزيد من الاهتمام والبحث ويتطلب معالجة خاصة نظرا لأنها لغة غنية في التعبير والمعاني والنحو والصرف. أغلب الطرق الحالية لتصنيف النصوص العربية تستخدم تقنيات مثل: اختيار المزايا (Feature Selection) تمثيل البيانات (Data Representation) استخلاص المزايا (Feature Extraction) والخوارزميات المتسلسلة (Sequential Algorithms). القليل من المحاولات تمت لتصنيف النص العربي واسع النطاق بالحوسبة المتوازية. في هذا البحث قمنا باقتراح طريقة مصنف متوازي للنصوص العربية ذات النطاق الواسع يعتمد على خوارزمية التصنيف (Naïve Bayes) باستخدام نموذج الحوسبة المتوازية MapReduce مع تعزيز التسريع (Speedup) والأداء (Performance) والحفاظ على الدقة (Accuracy). أظهرت النتائج أن المصنف المتوازي المقترح يعالج بكفاءة النصوص العربي ذات الحجم الكبير. حيث أجريت التجارب على نموذج MapReduce وأظهرت النتائج تحسنا كبيرا على التسريع بنسبة تصل إلى 12 مرة أفضل من الطريقة التسلسلية لنفس المصنف وأيضا الاحتفاظ بنتائج دقة تصنيف (Accuracy) عالية وصلت إلى أعلى من 97 %. |
---|