ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Arabic Multi-Document Text Summarization Based on Fuzzy C-Means and Latent Dirichlet Allocation Algorithms

العنوان بلغة أخرى: تلخيص النصوص العربية متعددة الوثائق إعتماداً على خوارزمية التجميع الضبابية وخوارزمية ديريتشليت للتوزيع
المؤلف الرئيسي: الصيادي، سامي حسن (مؤلف)
مؤلفين آخرين: الطعاني، أحمد توفيق (مشرف)
التاريخ الميلادي: 2019
موقع: إربد
الصفحات: 1 - 73
رقم MD: 1016418
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة اليرموك
الكلية: كلية تكنولوجيا المعلومات وعلوم الحاسوب
الدولة: الاردن
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

38

حفظ في:
المستخلص: التلخيص الآلي للنصوص هي عملية إنتاج نسخة مختصره من مجموعة النصوص المرتبطة بموضوع واحد. ويعتبر أسلوب الاستخراج طريقة لاستخراج الجمل الأكثر أهمية من مجموعة من المستندات النصية. في هذا البحث، دققنا في أداء الدمج بين خوارزمية التجميع الضبابية وخوارزمية ديريتشليت للتوزيع لاستخراج ملخص للنصوص العربية متعددة الوثائق. أجرينا التجارب على مجموعة النصوص (TAC-2011)، حيث تم اختيار هذه المجموعة لإجراء المقارنة بين النظام المقترح ومجموعة من الدراسات السابقة المعروفة في تلخيص النصوص العربية متعددة الوثائق والتي أجريت تجاربها على نفس المجموعة (TAC-2011)، منها الأنظمة المستخدمة لمجموعة المؤتمر العام لتحليل النصوص (MulitLing-2011)، والأنظمة الحديثة التي استخدمت خوارزمية مستعمرات النمل وخوارزمية التحليل التمييزي. دقة النتائج للنظام المقترح الذي دمج بين خوارزمية التجميع الضبابية وخوارزمية ديريتشليت للتوزيع كانت نتائج أفضل من نتائج الخوارزميات التي تم المقارنة معها حيث كانت النتائج كما يلي: 0.313486 و 0.1286 و 0.286123 و 0.149613 لكل من ROUGE-1 و ROUGE-2 و ROUGE-L و ROUGE-SU4 على التوالي.