العنوان بلغة أخرى: |
Part-of-Speech Tagging for Arabic Text using Bee Colony Algorithm |
---|---|
المؤلف الرئيسي: | الحسن، أحمد محمد (مؤلف) |
مؤلفين آخرين: | الطعاني، أحمد توفيق (مشرف) |
التاريخ الميلادي: |
2017
|
موقع: | إربد |
الصفحات: | 1 - 70 |
رقم MD: | 870511 |
نوع المحتوى: | رسائل جامعية |
اللغة: | الإنجليزية |
الدرجة العلمية: | رسالة ماجستير |
الجامعة: | جامعة اليرموك |
الكلية: | كلية تكنولوجيا المعلومات وعلوم الحاسوب |
الدولة: | الاردن |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
معالجة اللغات الطبيعية هو أحد مجالات الذكاء الاصطناعي، التي تهتم بتحليل وفهم وتوليد النصوص والكلام للغات الطبيعية بهدف حل المشاكل الهندسية. تحديد أو تصنيف أقسام الكلام خطوة أساسية في معظم تطبيقات معالجة اللغات الطبيعية مثل استرجاع المعلومات وتلخيص النصوص والإجابة على الأسئلة واستخراج المعلومات. هي عملية تحديد أو تعليم أو تدليل العلامة النحوية الصحيحة (الفئة النحوية) لكلمة معينة تبعا لتعريف الكلمة وسياقها. في هذه الرسالة، تم اقتراح نظام جديد لتحديد وتدليل العلامات النحوية الصحيحة للغة العربية المبنية على طريقة التقنية التطورية، وتحديدا باستخدام خوارزمية مستعمرة النحل. تم تمثيل المشكلة كرسم بياني مرجح. إضافة إلى اقتراح تقنية جديدة لتعيين قيم للعلامات المحتملة لكلمات الجملة، في حين تعتمد معظم تقنيات تعيين القيم على الاحتمالات الشرطية. ومن ثم، فإن النحل يقوم باستكشاف حيز البحث للعثور على أفضل مسار يمثل الحل. تم تقييم النظام باستخدام بيانات معيارية (KALIMAT) الذي يتكون من أكثر من 18 مليون كلمة. وأظهرت النتائج أن المنهج المقترح يحقق 98.2% من الدقة مقارنة بنسبة 98% و97.4% و94.6% للنموذج الهجين و(Hidden Markov Model) والمنهج القائم على القواعد على التوالي. وعلاوة على ذلك، فإن النهج المقترح يحدد جميع العلامات الموجودة في البيانات المعيارية. من ناحية أخرى، فإن المناهج التي تمت المقارنة معها يمكنها تحديد ثلاث أقسام فقط. |
---|