العنوان بلغة أخرى: |
قياس العلاقات الدلالية للمصطلحات العربية من خلال استغلال الرسم الهيكلي لويكيبيديا |
---|---|
المؤلف الرئيسي: | الفيومي، ابراهيم سعيد محمد (مؤلف) |
مؤلفين آخرين: | الأغا، إياد محمد (مشرف) |
التاريخ الميلادي: |
2019
|
موقع: | غزة |
التاريخ الهجري: | 1441 |
الصفحات: | 1 - 77 |
رقم MD: | 1031391 |
نوع المحتوى: | رسائل جامعية |
اللغة: | الإنجليزية |
الدرجة العلمية: | رسالة ماجستير |
الجامعة: | الجامعة الإسلامية (غزة) |
الكلية: | كلية تكنولوجيا المعلومات |
الدولة: | فلسطين |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
يلعب قياس العلاقة الدلالية بين العناصردوراً هاماً في مجالات عدة مثل أنظمة استرجاع المعلومات ومجال معالجة اللغات. حاولت كثير من الأعمال والأبحاث استغلال مصادر المعرفة على شبكة الإنترنت مثل ويكيبيديا ووردنت والانطولوجيا (دراسة الموجودات أو ما نفترض أنه موجود من أجل الوصول المقنع أو القاطع إلى الحقيقة) لتحديد العلاقة بين العناصر سواء كانت مصطلحات أو مستندات أو تصنيفات. إلا أن القليل من الأبحاث والدراسات اهتمت بجانب قياس العلاقة الدلالية لمصطلحات اللغة العربية. إضافةً إلى ذلك وعلى حد علمنا، لم تستخدم ويكيبيديا في دراسة العلاقة الدلالية لمصطلحات اللغة العربية على الرغم من كونها واحدة من أكبر موسوعات المعرفة على الإنترنت. يقترح هذا العمل نهج لدراسة العلاقة الدلالية لمصطحات اللغة العربية من خلال استغلال الرسم الهيكلي لويكيبيديا كموسوعة معرفية. من خلال اختيار مصطلحين واعتماداً على بنية الارتباط التشعبي في ويكيبيديا وتحديد المصطلحات المتجاورة سيتم بناء رسم هيكلي لكل مصطلح، وسنقوم بقياس التوافق بين المصطلحين من خلال فحص مدى التقارب بين الرسمين. ولهذا الغرض سيتم تحويل الرسم الهيكلي لقوائم بيانات مرتبة باستخدام خوارزمية ترتيب لتسهيل عملية القياس. لتقييم النهج المقترح، استخدمنا قاعدة بيانات تستخدم كمجموعة اختبار تسمى WordSimilarity-353 ، وحيث أنها متوفرة باللغة الإنجليزية فقد قمنا بترجمتها للغة العربية، تحتوي المجموعة على أزواج من المصطلحات التي تم قياس مدى التقارب والعلاقة بينها من خلال خبراء لغة وقاموا بتحديد درجة التشابه لكل زوج، طبقنا النهج المقدم على هذه المجموعة وقمنا بمقارنة نتائج نهجنا مع متوسط درجة التشابه الخاص بالخبراء، أظهرت النتائج أن مقدار الارتباط الدلالي يصل إلى 0.65 ، ولكن واجهنا بعض النتائج غير الدقيقة بسبب ضعف المحتوى وندرة العديد من مقالات ويكيبيديا العربية. |
---|