ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Exploiting Wikipedia to Measure Semantic Relatedness between Arabic Terms

العنوان بلغة أخرى: استغلال موسوعة "ويكيبيديا" لقياس العلاقة الدلالية بين المصطلحات العربية
المؤلف الرئيسي: الحاج، باسل عبدالعظيم محمد (مؤلف)
مؤلفين آخرين: الأغا، إياد محمد (مشرف)
التاريخ الميلادي: 2019
موقع: غزة
التاريخ الهجري: 1440
الصفحات: 1 - 76
رقم MD: 1031402
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: الجامعة الإسلامية (غزة)
الكلية: كلية تكنولوجيا المعلومات
الدولة: فلسطين
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

5

حفظ في:
المستخلص: تلعب مقاييس الارتباط الدلالي دورا مهما في العديد من تطبيقات معالجة اللغة الطبيعية مثل استخراج المعلومات واسترجاعها، تلخيص النص وتعليمه، تصنيف المستندات وتجميعها، الإجابة على الأسئلة. بعض هذه المقاييس تحسب العلاقة الدلالية بين المصطلحات باستخدام ويكيبيديا لأنها تمثل واحدة من أكبر مصادر المعرفة التي تحتوي على عدد كبير من المصطلحات بلغات مختلفة وفي مجالات متعددة. ومع ذلك، أبحاث محدودة استكشفت العلاقة الدلالية بين المصطلحات العربية. يقترح هذا العمل طريقة لقياس الترابط الدلالي بين المصطلحات العربية اعتماد على هيكل ويكيبيديا. يستغل النهج نوعين من العلاقات لقياس العلاقة بين المصطلحات العربية: العلاقة القائمة على السياق والعلاقة القائمة على الفئة. تقاس العلاقة القائمة على السياق اعتمادا على التقاطع بين الروابط الواردة لمقالات ويكيبيديا، في حين يتم قياس العلاقة القائمة على التصنيف باستخدام مقياسين لقيمة المعلومات يعتمد كل منهما على تصنيفات المقالة والترتيب الهرمي لتصنيفات ويكيبيديا. لإنجاز هذا العمل، تمت مواجهة ومناقشة بعض التحديات المتعلقة بالتصميم والتنفيذ ومن ضمنها إعداد ويكيبيديا العربية وتكوينها، مطابقة المصطلحات مع مقالات ويكيبيديا ذات الصلة، إنشاء رسم بياني لتصنيفات ويكيبيديا، إنشاء خرائط عمق التصنيف وأحفاد التصنيف. لتقييم النهج المقترح، استخدمنا مجموعة بيانات من مجموعة اختبار WordSimilarity-353 والتي تحتوي على 120 زوجا من المصطلحات مع درجة الترابط المعينة لها من قبل الإنسان. تمت مقارنة النتائج التي أنتجها نهجنا بنتائج الحكم البشري وكذلك نتائج المناهج الأخرى التي استخدمت ويكيبيديا الإنجليزية كمصدر للمعرفة. العلاقة بين نتائج نهجنا والأحكام البشرية المقابلة كانت 0.66. لقد تفوقت نتائجنا على نتائج بعض الطرق السابقة التي استخدمت نفس مجموعة البيانات باللغة الإنجليزية. ومع ذلك، فإن ضعف بنية ومحتوى النسخة العربية من ويكيبيديا قد نتج عنه بعض نتائج التشابه الغير الصحيحة.

عناصر مشابهة