ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Large-Scale Arabic Text Classification Using MapReduce

العنوان بلغة أخرى: تصنيف حجم كبير للنص العربى ياستخدام MapReduce
المؤلف الرئيسي: Abu Shab, Maher M. (Author)
مؤلفين آخرين: Baraka, Rebhi Soliman (Advisor)
التاريخ الميلادي: 2015
موقع: غزة
التاريخ الهجري: 1436
الصفحات: 1 - 65
رقم MD: 697275
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: الجامعة الإسلامية (غزة)
الكلية: كلية تكنولوجيا المعلومات
الدولة: فلسطين
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

21

حفظ في:
LEADER 03519nam a22003377a 4500
001 0291192
041 |a eng 
100 |9 363699  |a Abu Shab, Maher M.  |e Author 
245 |a Large-Scale Arabic Text Classification Using MapReduce 
246 |a تصنيف حجم كبير للنص العربى ياستخدام MapReduce 
260 |a غزة  |c 2015  |m 1436 
300 |a 1 - 65 
336 |a رسائل جامعية 
502 |b رسالة ماجستير  |c الجامعة الإسلامية (غزة)  |f كلية تكنولوجيا المعلومات  |g فلسطين  |o 0027 
520 |a أصبح تصنيف النصوص ذات النطاق الواسع (الحجم الكبير) واحدة من المشاكل الأساسية في مجال التنقيب في البيانات النصية. وهناك العديد من أعمال التصنيف النصية للغة الإنجليزية واللغات الأخرى حيث نتجت عن أداء عالي لعملية التصنيف. مع ذلك، فإن تصنيف النصوص في اللغة العربية بحاجة إلى مزيد من الاهتمام والبحث ويتطلب معالجة خاصة نظرا لأنها لغة غنية في التعبير والمعاني والنحو والصرف. أغلب الطرق الحالية لتصنيف النصوص العربية تستخدم تقنيات مثل: اختيار المزايا (Feature Selection) تمثيل البيانات (Data Representation) استخلاص المزايا (Feature Extraction) والخوارزميات المتسلسلة (Sequential Algorithms). القليل من المحاولات تمت لتصنيف النص العربي واسع النطاق بالحوسبة المتوازية. في هذا البحث قمنا باقتراح طريقة مصنف متوازي للنصوص العربية ذات النطاق الواسع يعتمد على خوارزمية التصنيف (Naïve Bayes) باستخدام نموذج الحوسبة المتوازية MapReduce مع تعزيز التسريع (Speedup) والأداء (Performance) والحفاظ على الدقة (Accuracy). أظهرت النتائج أن المصنف المتوازي المقترح يعالج بكفاءة النصوص العربي ذات الحجم الكبير. حيث أجريت التجارب على نموذج MapReduce وأظهرت النتائج تحسنا كبيرا على التسريع بنسبة تصل إلى 12 مرة أفضل من الطريقة التسلسلية لنفس المصنف وأيضا الاحتفاظ بنتائج دقة تصنيف (Accuracy) عالية وصلت إلى أعلى من 97 %. 
653 |a تكنولوجيا المعلومات  |a النصوص العربية  |a المصنف المتوازى  |a الخوارزمية 
700 |9 386560  |a Baraka, Rebhi Soliman  |e Advisor 
856 |u 9808-001-010-0027-T.pdf  |y صفحة العنوان 
856 |u 9808-001-010-0027-A.pdf  |y المستخلص 
856 |u 9808-001-010-0027-C.pdf  |y قائمة المحتويات 
856 |u 9808-001-010-0027-F.pdf  |y 24 صفحة الأولى 
856 |u 9808-001-010-0027-1.pdf  |y 1 الفصل 
856 |u 9808-001-010-0027-2.pdf  |y 2 الفصل 
856 |u 9808-001-010-0027-3.pdf  |y 3 الفصل 
856 |u 9808-001-010-0027-4.pdf  |y 4 الفصل 
856 |u 9808-001-010-0027-5.pdf  |y 5 الفصل 
856 |u 9808-001-010-0027-6.pdf  |y 6 الفصل 
856 |u 9808-001-010-0027-R.pdf  |y المصادر والمراجع 
930 |d y 
995 |a Dissertations 
999 |c 697275  |d 697275 

عناصر مشابهة