ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Enhancing Arabic Named Entity Recognition Using Parallel Techniques

العنوان بلغة أخرى: تحسين التعرف على الكيانات الأسمية العربية باستخدام تقنيات متوازية
المؤلف الرئيسي: عطيوى، زيدون عبدالله (مؤلف)
مؤلفين آخرين: عطير، محمد عبدالله عارف (مشرف)
التاريخ الميلادي: 2018
موقع: عمان
الصفحات: 1 - 99
رقم MD: 916698
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة عمان العربية
الكلية: كلية العلوم الحاسوبية والمعلوماتية
الدولة: الاردن
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

12

حفظ في:
المستخلص: تستخدم أنظمة التعرف على الكيانات الاسمية (أسماء الأعلام) في تطوير العديد من تطبيقات نماذج معالجة اللغات الطبيعية الأخرى مثل استرجاع المعلومات، وإجابة الاستفسارات، والترجمة الآلية، وغيرها. وذلك لأنها تقدم معلومات هامة عن النص والتي يتم استخدامها كميزات دلالية لتحسين أداء هذه التطبيقات عند إجراء مهامها. هناك العديد من الأعمال البحثية التي قامت ببناء نماذج للتعرف على أسماء الأعلام في معظم اللغات المستخدمة في مختلف أنحاء العالم. وبالرغم من ذلك، فهناك ندرة في عدد الأبحاث المنشورة في مجال التعرف على أسماء الأعلام من النصوص المكتوبة باللغة العربية وذلك بسبب أن اللغة العربية لديها خصوصية فيما يتعلق بتعقيد الإملاء والمورفولوجيا، الأمر الذي يشكل عقبة أمام تطوير نماذج للتعرف على أسماء الكيانات العربية أو ما يعرف باسم: "(ANER)Arabic Named Entities Recognition system " هذه الرسالة تقدم العديد من التجارب التي أجريت من أجل تحديد النموذج المناسب لبناء نظام قوي وموثوق به للتعرف على أسماء الأعلام العربية. وسيكون لهذا النظام القدرة على تحديد أسماء الكيانات وتصنيفها ضمن نصوص عربية متفاوتة في أحجامها. لهذا الغرض، وتم دراسة أحدث ما توصلت إليه التكنولوجيا في مجال تحديد الأسماء العربية. ثم أجريت مقارنة بين خمسة من أكثر الأدوات شهرة واهتماما بالتعرف على أسماء الأعلام العربية، وبعد ذلك قمنا بعملية دمج على مستوى كل أداتين معا للحصول على 10 تقنيات متوازية مختلفة. وأثبتت نتائج المقارنة بين الأدوات أن Rosette حققت أفضل نتائج تليها Madamira بينما كانت أسوء نتائج عند الأداة Gate. وبالنسبة للأنظمة المتوازية فقد حقق R-F (الذي يجمع بين Rosette وFarasa) أفضل أداء بنسبة تحسين في الدقة إذا ما قورنت بنتائج كل أداة على حدة. أيضا عند مقارنة قيم مقياس ال Recall، حيث حققت بعض الأنظمة المتوازية تفوق كبير مقارنة بأفضل نتيجة ظهرت على مستوى كل أداة لوحدها، فكانت النتائج حوالي 0.985%، 0.979% و0.975%، للنصوص القصيرة والمتوسطة والطويلة على التوالي.

عناصر مشابهة