المؤلف الرئيسي: | Bataineh, Dareen Qasem (Author) |
---|---|
مؤلفين آخرين: | Al Radaideh, Qasem (Advisor) |
التاريخ الميلادي: |
2015
|
موقع: | إربد |
الصفحات: | 1 - 115 |
رقم MD: | 745141 |
نوع المحتوى: | رسائل جامعية |
اللغة: | الإنجليزية |
الدرجة العلمية: | رسالة ماجستير |
الجامعة: | جامعة اليرموك |
الكلية: | كلية تكنولوجيا المعلومات وعلوم الحاسوب |
الدولة: | الاردن |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
تلخيص النص هو عملية إنتاج نسخة أقصر من نص معين مع الحفاظ على المعلومات الهامة. التلخيص التلقائي للنص أصبح مهما جدا نظرا للعدد الهائل من مصادر المعلومات المتاحة في كل مجال. لقد تم تطبيق تقنيات التلخيص التلقائي في مختلف المجالات مثل الطب والسياسة والأخبار والمجالات القانونية مثبتا أن استخدام الخصائص المرتبطة بالمجال يمكن أن يحسن أداء التلخيص. على الرغم من وجود الكثير من العمل البحثي في التلخيص المعتمد على المجال في اللغة الإنجليزية وغيرها من اللغات، إلا أن هذا العمل البحثي قليل جدا بالنسبة للغة العربية نظرا للنقص في قواعد المعرفة الحالية. في هذا البحث تم تقديم أسلوب هجين لتلخيص وثيقة واحدة، تم تسميته اختصارا (ASDKGA) وهو يستخدم معرفة المجال والخصائص الإحصائية والخوارزميات الجينية لاستخراج النقاط الهامة من الوثائق السياسية العربية. تم اختبار الأسلوب المقترح على اثنين من المجاميع النصية (KALIMAT Corpus) و (Essex Arabic Summaries Corpus). وقد تم استخدام نظام (ROUGE) لمقارنة الملخصات الناتجة باستخدام الأسلوب المقترح ASDKGA)) مع الملخصات التي تم تلخيصها بواسطة الإنسان. أيضا تم مقارنة الأسلوب المقترح (ASDKGA) مع ثلاثة أساليب آلية أخرى لتلخيص النصوص العربية وهي: أسلوب (Al-Omour) وأسلوب (Ofaida) وأسلوب (-Al Khawaldeh & Samawi). بينت النتائج أن الأسلوب المقترح حقق نتائج واعدة عند تلخيص الوثائق السياسية العربية حيث أن قيمة المعيار (F-measure) كانت 0.605 عند نسبة ضغط 40%. |
---|