المستخلص: |
التلخيص الآلي للنصوص هي عملية إنتاج نسخة مختصره من مجموعة النصوص المرتبطة بموضوع واحد. ويعتبر أسلوب الاستخراج طريقة لاستخراج الجمل الأكثر أهمية من مجموعة من المستندات النصية. في هذا البحث، دققنا في أداء الدمج بين خوارزمية التجميع الضبابية وخوارزمية ديريتشليت للتوزيع لاستخراج ملخص للنصوص العربية متعددة الوثائق. أجرينا التجارب على مجموعة النصوص (TAC-2011)، حيث تم اختيار هذه المجموعة لإجراء المقارنة بين النظام المقترح ومجموعة من الدراسات السابقة المعروفة في تلخيص النصوص العربية متعددة الوثائق والتي أجريت تجاربها على نفس المجموعة (TAC-2011)، منها الأنظمة المستخدمة لمجموعة المؤتمر العام لتحليل النصوص (MulitLing-2011)، والأنظمة الحديثة التي استخدمت خوارزمية مستعمرات النمل وخوارزمية التحليل التمييزي. دقة النتائج للنظام المقترح الذي دمج بين خوارزمية التجميع الضبابية وخوارزمية ديريتشليت للتوزيع كانت نتائج أفضل من نتائج الخوارزميات التي تم المقارنة معها حيث كانت النتائج كما يلي: 0.313486 و 0.1286 و 0.286123 و 0.149613 لكل من ROUGE-1 و ROUGE-2 و ROUGE-L و ROUGE-SU4 على التوالي.
|