ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Statistical Arabic Grammar Analyzer Based on Rules Mining Approach Using Naïve Bayesian Algorithm

العنوان بلغة أخرى: محلل نحوي عربي إحصائي مبني على منهج التنقيب عن القواعد باستخدام خوارزمية الناييف بييزين
المؤلف الرئيسي: الفارس، أحمد واصف (مؤلف)
مؤلفين آخرين: أبو شريحة، أحمد عادل (مشرف)
التاريخ الميلادي: 2017
موقع: عمان
الصفحات: 1 - 112
رقم MD: 857171
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة الشرق الأوسط
الكلية: كلية تكنولوجيا المعلومات
الدولة: الاردن
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

24

حفظ في:
المستخلص: تواجه جمل اللغة العربية تحديا وذلك لأنها كثيرا ما تحمل أكثر من معنى واحد. والذي يحدد المعنى المطلوب هو التحليل النحوي (الإعراب). ويعرف التحليل النحوي على أنه عملية تحديد قسم الكلام النحوي / الإعرابي والحالة الإعرابية والحركة الإعرابية (على أخر حرف بالكلمة) لكل كلمة في الجملة. وهناك منهجين رئيسين يستخدمان في التعامل مع التحليل النحوي في اللغة العربية وهما المنهج القاعدي والمنهج الإحصائي. ومن ناحية أخرى فإن المنهج القاعدي يعاني من العديد من السلبيات ومنها محدودية مقدراته في التعامل مع الجمل حيث يتعامل مع القصيرة منها حصرا، وكذلك احتياجه لجهد كبير للحصول على المعرفة والموارد اللغوية واستهلاكه للوقت كذلك. أضف إلى ذلك فإن طبيعة حرية ترتيب الكلمات في الجملة العربية من جهة وحذف الضمير الشخصي من جهة أخرى يزيد الصعوبة ليس فقط في المنهج القاعدي ولكن أيضا في بناء قاعدة متحررة من السياق (CFG) وكفؤة. وفي هذه الرسالة تم اقتراح منهج لحوسبة التحليل النحوي العربي في محاولة للتغلب على المشاكل والعقبات التي تنشأ من استخدام المنهج القاعدي. ويتضمن المنهج المقترح أربعة مراحل وهي: مرحلة المدخلات ومرحلة استخراج الخصائص وبناء البيانات المهيكلة ومرحلة التعليم ومرحلة الاكتشاف/ الالتقاط. ففي المرحلة الأولى فإن كل كلمة يتم عنونتها بتحليلها النحوي الخاص بها يدويا. وفي المرحلة الثانية يتم استخراج 14 خاصية لكل كلمة من جمل الكوربس. وفي المرحلة الثالثة والتي تسمى مرحلة التعليم، يتم إدخال كوربس الجمل المعنونة للنظام والذي بدوره يرسله لمصنف نموذج خوارزمية الناييف بييز المنشأ. وفي المرحلة الرابعة والتي تسمى الاكتشاف / الالتقاط يتم إرسال كوربس الجمل غير المعنونة لعملية استخراج الخصائص بالمرحلة الثانية وباستخدام النموذج المنشأ بالمرحلة الثالثة وذلك لاختيار التحليل النحوي الأكثر صحة للكلمة. ومن بعض الخصائص التي استخدمت: التعريف، الزمن، الصيغة، الحالة الإعرابية، قسم الكلام. وعلى الرغم من وجود بعض المحددات (مثل: الطول المحدود للجمل المستخدمة، محدودية مجموعة الخصائص المستخدمة، ليس كل الكلمات يمكن تجذيرها بوضوح). كانت النتائج مرضية مع دقة كافية 75.38% وفي الختام، فإن الطريقة المقترحة هي محاولة لحل غموض الجمل العربية عن طريق جعل التحليل النحوي عملية أكثر سهولة.

عناصر مشابهة