المؤلف الرئيسي: | Harazin, Karim S. (Author) |
---|---|
مؤلفين آخرين: | Ashour, Wesam M. Z. (Advisor) |
التاريخ الميلادي: |
2015
|
موقع: | غزة |
الصفحات: | 1 - 71 |
رقم MD: | 734949 |
نوع المحتوى: | رسائل جامعية |
اللغة: | الإنجليزية |
الدرجة العلمية: | رسالة ماجستير |
الجامعة: | الجامعة الإسلامية (غزة) |
الكلية: | كلية الهندسة |
الدولة: | فلسطين |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
مع النمو السريع للبيانات على شبكة الأنترنت، أصبح هناك حاجة ملحة لأنظمة التلخيص الآلي للنصوص. الكثير من الأبحاث أجريت على اللغة الإنجليزية وغيرها من اللغات الأوروبية. على الرغم من التطور في الأبحاث، إلا أنه لا يوجد دعم كبير للغة العربية. هذا البحث يعنى بإنشاء نظام تلخيص آلي للنصوص المتعددة المصادر المكتوبة باللغة العربية. إن أكبر التحديات التي تواجه تلخيص النصوص متعددة المصادر هي: إزالة البيانات الزائدة عن الحاجة وإعادة ترتيب الجمل بشكل مقروء. في هذا البحث أيضا، ناقشنا إمكانية استخدام طرق التلخيص الآلي للنصوص من مصدر واحد لتلخيص النصوص متعددة المصادر. بالإضافة إلى ذلك قمنا بعرض نظام تلخيص إلى يعتمد على نظرية البنية البلاغية للمستندات CST. استخدام ال CST يساعد على تحديد العلاقات البلاغية بين الجمل من مختلف المصادر. إن الاختلاف الرئيسي بين النظام المقترح وباقي الأنظمة العريبة المستخدمة للتلخيص الآلي هو استخدام البنية البلاغية للمستندات في استخرج الأجزاء المهمة من النصوص. في عملية تقييم أداء النظام، تم استخدام معيار ROUGE الذي يقيس مدى تشابه نتيجة التلخيص الآلي بالتلخيص اليدوي. تم مقارنة النظام المقترح بعشرة أنظمة أخرى، النظام المقترح الذي يعتمد على البنية البلاغية للمستندات كان من بين أول ثلاثة أنظمة أعطت نتائج جيدة. |
---|