ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Automatic Arabic Text Categorization Using Efficient Classification Techniques

العنوان بلغة أخرى: التصنيف التلقائي للنصوص العربية باستخدام تقنيات التصنيف ذات الكفاءة
المؤلف الرئيسي: Al Awadi, Mouhammd Mahmoud (Author)
مؤلفين آخرين: Hammad, Mustfa (Advisor)
التاريخ الميلادي: 2015
موقع: الكرك
الصفحات: 1 - 110
رقم MD: 786006
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة مؤتة
الكلية: عمادة الدراسات العليا
الدولة: الاردن
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

49

حفظ في:
المستخلص: اللغة العربية هي لغة معقدة وتحتاج إلى معاملة خاصة. لهذا، فإن معظم الدراسات السابقة استخدمت الأساليب الإحصائية في تصنيف النصوص العربية، وهذه الأساليب تهمل معنى المصطلح. أولا، قمنا ببناء قاعدة بيانات تماثلية للغة العربية، بحيث تكون متاحة مجان الأغراض البحث العلمي في اللغة العربية، ثم صممنا برنامج المعالجة النص العربي، والذي يتكون من مجموعة من الخطوات وتقنيات النمذجة، مثل إزالة كلمة التوقف وتقليم الجذور لتحسين نتائج تصنيف النصوص العربية. وتركز هذه الأطروحة على تقنية دلالات الكلمات، وتقترح طريقة مهجنة لتقليم كلمات اللغة العربية. وتستخدم العديد من تقنيات لأغراض تصنيف النص العربي، وعرض نتائج الطريقة المهجنة. وتشمل هذه التقنيات على التحليل الدلالي الكامن (LSA) بالإضافة إلى خمسة من مناهج تعلم الآلة. حيث يستخدم LSA للحد من التشتت الذي من شانه تحسين دقة أنظمة التصنيف. وأظهرت نتائج التجربة فعالية طريقة تقليم الجذور المقترحة من حيث دقة التصنيف والسرعة. وقد تحقق أفضل أداء من خلال استخدام طريقة تحليل القيمة المنفردة (SVD) مع مقياس جيب التمام ومسافة مانهاتن. وأخيرا، فإننا أجرينا مقارنة تجريبية على مسافة الحسنات، والمسافة الإقليدية، ومسافة مانهاتن ومسافة جيب التمام، لاختيار أفضل طريقة لحساب التشابه بين ناقلات مع خمسة من طرق تمثيل النص.

عناصر مشابهة