ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Multi-document Arabic Tex Summarization

المؤلف الرئيسي: Harazin, Karim S. (Author)
مؤلفين آخرين: Ashour, Wesam M. Z. (Advisor)
التاريخ الميلادي: 2015
موقع: غزة
الصفحات: 1 - 71
رقم MD: 734949
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: الجامعة الإسلامية (غزة)
الكلية: كلية الهندسة
الدولة: فلسطين
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

6

حفظ في:
المستخلص: مع النمو السريع للبيانات على شبكة الأنترنت، أصبح هناك حاجة ملحة لأنظمة التلخيص الآلي للنصوص. الكثير من الأبحاث أجريت على اللغة الإنجليزية وغيرها من اللغات الأوروبية. على الرغم من التطور في الأبحاث، إلا أنه لا يوجد دعم كبير للغة العربية. هذا البحث يعنى بإنشاء نظام تلخيص آلي للنصوص المتعددة المصادر المكتوبة باللغة العربية. إن أكبر التحديات التي تواجه تلخيص النصوص متعددة المصادر هي: إزالة البيانات الزائدة عن الحاجة وإعادة ترتيب الجمل بشكل مقروء. في هذا البحث أيضا، ناقشنا إمكانية استخدام طرق التلخيص الآلي للنصوص من مصدر واحد لتلخيص النصوص متعددة المصادر. بالإضافة إلى ذلك قمنا بعرض نظام تلخيص إلى يعتمد على نظرية البنية البلاغية للمستندات CST. استخدام ال CST يساعد على تحديد العلاقات البلاغية بين الجمل من مختلف المصادر. إن الاختلاف الرئيسي بين النظام المقترح وباقي الأنظمة العريبة المستخدمة للتلخيص الآلي هو استخدام البنية البلاغية للمستندات في استخرج الأجزاء المهمة من النصوص. في عملية تقييم أداء النظام، تم استخدام معيار ROUGE الذي يقيس مدى تشابه نتيجة التلخيص الآلي بالتلخيص اليدوي. تم مقارنة النظام المقترح بعشرة أنظمة أخرى، النظام المقترح الذي يعتمد على البنية البلاغية للمستندات كان من بين أول ثلاثة أنظمة أعطت نتائج جيدة.

عناصر مشابهة