العنوان بلغة أخرى: |
استغلال موسوعة "ويكيبيديا" لقياس العلاقة الدلالية بين المصطلحات العربية |
---|---|
المؤلف الرئيسي: | الحاج، باسل عبدالعظيم محمد (مؤلف) |
مؤلفين آخرين: | الأغا، إياد محمد (مشرف) |
التاريخ الميلادي: |
2019
|
موقع: | غزة |
التاريخ الهجري: | 1440 |
الصفحات: | 1 - 76 |
رقم MD: | 1031402 |
نوع المحتوى: | رسائل جامعية |
اللغة: | الإنجليزية |
الدرجة العلمية: | رسالة ماجستير |
الجامعة: | الجامعة الإسلامية (غزة) |
الكلية: | كلية تكنولوجيا المعلومات |
الدولة: | فلسطين |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
تلعب مقاييس الارتباط الدلالي دورا مهما في العديد من تطبيقات معالجة اللغة الطبيعية مثل استخراج المعلومات واسترجاعها، تلخيص النص وتعليمه، تصنيف المستندات وتجميعها، الإجابة على الأسئلة. بعض هذه المقاييس تحسب العلاقة الدلالية بين المصطلحات باستخدام ويكيبيديا لأنها تمثل واحدة من أكبر مصادر المعرفة التي تحتوي على عدد كبير من المصطلحات بلغات مختلفة وفي مجالات متعددة. ومع ذلك، أبحاث محدودة استكشفت العلاقة الدلالية بين المصطلحات العربية. يقترح هذا العمل طريقة لقياس الترابط الدلالي بين المصطلحات العربية اعتماد على هيكل ويكيبيديا. يستغل النهج نوعين من العلاقات لقياس العلاقة بين المصطلحات العربية: العلاقة القائمة على السياق والعلاقة القائمة على الفئة. تقاس العلاقة القائمة على السياق اعتمادا على التقاطع بين الروابط الواردة لمقالات ويكيبيديا، في حين يتم قياس العلاقة القائمة على التصنيف باستخدام مقياسين لقيمة المعلومات يعتمد كل منهما على تصنيفات المقالة والترتيب الهرمي لتصنيفات ويكيبيديا. لإنجاز هذا العمل، تمت مواجهة ومناقشة بعض التحديات المتعلقة بالتصميم والتنفيذ ومن ضمنها إعداد ويكيبيديا العربية وتكوينها، مطابقة المصطلحات مع مقالات ويكيبيديا ذات الصلة، إنشاء رسم بياني لتصنيفات ويكيبيديا، إنشاء خرائط عمق التصنيف وأحفاد التصنيف. لتقييم النهج المقترح، استخدمنا مجموعة بيانات من مجموعة اختبار WordSimilarity-353 والتي تحتوي على 120 زوجا من المصطلحات مع درجة الترابط المعينة لها من قبل الإنسان. تمت مقارنة النتائج التي أنتجها نهجنا بنتائج الحكم البشري وكذلك نتائج المناهج الأخرى التي استخدمت ويكيبيديا الإنجليزية كمصدر للمعرفة. العلاقة بين نتائج نهجنا والأحكام البشرية المقابلة كانت 0.66. لقد تفوقت نتائجنا على نتائج بعض الطرق السابقة التي استخدمت نفس مجموعة البيانات باللغة الإنجليزية. ومع ذلك، فإن ضعف بنية ومحتوى النسخة العربية من ويكيبيديا قد نتج عنه بعض نتائج التشابه الغير الصحيحة. |
---|