Tag Recommendation for Short Arabic Text by Using Latent Semantic Analysis of Wikipedia

أبو سمرة، يوسف خميس; Alagha, Iyad M.

Tag Recommendation for Short Arabic Text by Using Latent Semantic Analysis of Wikipedia

العنوان بلغة أخرى:	اقتراح أوسمة للنصوص العربية القصيرة باستخدام تحليل الدلالات الكامنة على الويكيبيديا العربية
المؤلف الرئيسي:	أبو سمرة، يوسف خميس (مؤلف)
مؤلفين آخرين:	Alagha, Iyad M. (Advisor)
محكمة:	نعم
التاريخ الميلادي:	2017
موقع:	غزة
الصفحات:	1 - 85
رقم MD:	875369
نوع المحتوى:	رسائل جامعية
اللغة:	الإنجليزية
الدرجة العلمية:	رسالة ماجستير
الجامعة:	الجامعة الإسلامية (غزة)
الكلية:	كلية تكنولوجيا المعلومات
الدولة:	فلسطين
قواعد المعلومات:	Dissertations
مواضيع:	النصوص العربية \| الويكيبيديا العربية \| الدلالات الكامنة \| تحليل النصوص
رابط المحتوى:	صفحة العنوان المستخلص قائمة المحتويات 24 صفحة الأولى 1 الفصل 2 الفصل 3 الفصل 4 الفصل الخاتمة المصادر والمراجع

عدد مرات التحميل

8

المستخلص:

تتيح المواقع الاجتماعية للمستخدمين مشاركة المواد كالنصوص والصور، وتتيح حرية إضافة كلمات رئيسية لها تسمى أوسمة. ولكن الحرية لها مساوئ منها: التكرار الناتج عن عدم ضبط الكلمات، الغموض، التشتت، الأخطاء الإملائية، والتفرد، مما يعيق عمليات تنظيم واسترجاع البيانات في هذه الأنظمة. نهدف في هذا العمل إلى عرض نظام اقتراح أوسمة للنصوص العربية القصيرة بالاستفادة من الويكيبيديا العربية كمصدر للمعلومات، بحيث يتم توظيف تحليل الدلالات الكامنة لاكتشاف التشابه بين النص القصير ومقالات الويكيبيديا. وقد استخدم "أباتشي سبارك" للتعامل مع الحجم الضخم لمحتويات الويكيبيديا والعمليات الحسابية المعقدة لتحليل الدلالات الكامنة المستخدم لتحليل محتوى مقالات الويكيبيديا إلى ثلاث مصفوفات، وعند إدخال نص عربي قصير، يقوم النظام بمقارنته مع محتوى المقالات ويعطي كل مقالة وزنا حسب علاقتها وتشابهها مع النص المدخل، ثم يتم اختيار الأوسمة المرشحة من عناوين وتصنيفات المقالات الأكثر شبهاً بالنص. تم تقييم النظام المقترح اعتماداً على مجموعة من 100 نص قصير تم جمعها من موقع تويتر في ثلاثة مجالات مختلفة وقام خبيران في كل مجال بتقييم الأوسمة التي أنتجها النظام. وقد حقق النظام المقترح mean average precision 84.39%، و mean reciprocal rank 96.53%، مما يظهر مناسبة النظام ودقته لتوسيم النصوص العربية في حين أنه يواجه صعوبات تتعلق باللغة العربية وبتكرارات الكلمات النادرة. كما تم عرض تحليل دقيق ومناقشة لنتائج التقييم تتناول نقاط القوة والقصور في النظام إضافة إلى توصيات لتطوير العمل مستقبلا.

عناصر مشابهة

Automatic Linking of Short Arabic Text to Wikipedia Articles
بواسطة: Fayad, Fatoom M. A منشور: (2016)
Automatically Extending NE Coverage of Arabic Wordnet Using Wikipedia
بواسطة: Al Khalifa, Musa منشور: (2009)
Detecting Named Entities in the Arabic Wikipedia
بواسطة: Lee, Mark منشور: (2014)
Exploiting Semantic and Statistical Features to Summarize Arabic Wikipedia Articles
بواسطة: سمارة، شادى فايز محمود منشور: (2018)
Measuring Semantic Relatedness between Arabic Terms by Exploiting Wikipedia Graph
بواسطة: الفيومي، ابراهيم سعيد محمد منشور: (2019)

Tag Recommendation for Short Arabic Text by Using Latent Semantic Analysis of Wikipedia

عدد مرات التحميل

8

عناصر مشابهة

دليل المستخدم

دليل الفيديو