العنوان بلغة أخرى: |
تلخيص النصوص العربية متعددة الوثائق اعتمادا على خوارزمية التجميع k-means |
---|---|
المؤلف الرئيسي: | Al Rousan, Suhaib Khaled (Author) |
مؤلفين آخرين: | Al Taani, Ahmad T. (Advisor) |
التاريخ الميلادي: |
2015
|
موقع: | اربد |
الصفحات: | 1 - 89 |
رقم MD: | 726398 |
نوع المحتوى: | رسائل جامعية |
اللغة: | الإنجليزية |
الدرجة العلمية: | رسالة ماجستير |
الجامعة: | جامعة اليرموك |
الكلية: | كلية تكنولوجيا المعلومات وعلوم الحاسوب |
الدولة: | الاردن |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
التلخيص التلقائي لنصوص متعددة الوثائق هو عملية استخراج ملخص من مجموعة وثائق ذات الصلة. تحتاج هذه الطريقة لوقت طويل لإنجازها فيما لو طبقت من قبل البشر، وبما أن الإنترنت أصبح يحتوي على كميات هائلة من النصوص والمقالات المكتوبة باللغة العربية، واللغة الإنجليزية، واللغات الأخرى، فإنه ليس من السهل إيجاد المعلومات ذات الصلة. بالإضافة إلى انه يوجد القليل من التطبيقات التي طبقت في حقل تلخيص النصوص العربية متعددة الوثائق. ونتيجة لذلك، فإنه من الضروري إيجاد نظام تلقائي يقوم باستخراج تلخيص من مجموعة وثائق ذات الصلة مكتوبة باللغة العربية من أجل مواجهة هذا التحدي. في هذا البحث تم استخدام طريقة تلخيص النصوص العربية متعددة الوثائق المبنية على طريقة الاستخراج، وتحديدا طريقة خوارزمية التجميع (K-mean) والتي تم تناولها في هذا البحث. إضافة إلى اقتراح نهج تقديري للتنبؤ بالقيمة المثلى لل (K). إضافة لذلك، قمنا بدراسة تأثير استخدام طرق اختيار التلخيص. تم اقتراح طريقة الاختيار الاسي والطريقة المعتمدة على نسبة حجم المجموعة لإسناد قيمة احتمالية إلى المجموعات. لتقييم المناهج المقترحة، فإنه تم استخدام مقاييس الدقة والاسترجاع. وأظهرت النتائج بأن اختيار الجمل المشابهة لمركز مجموعة كل الجمل لمجموعة الوثائق ذات الصلة، التنبؤ بالعدد الأمثل للمجموعات، واستخدام نسبة حجم المجموعة كطرق لإسناد احتمالية لكل مجموعة، تحقق أعلى نتيجة لل (ROUGE). |
---|