ارسل ملاحظاتك

ارسل ملاحظاتك لنا







The Semantic Similarity Measures Using Arabic Ontology

العنوان بلغة أخرى: مقاييس التشابه الدلالى بإستخدام الانتولوجى العربى
المؤلف الرئيسي: الديري، محمد غاندي (مؤلف)
مؤلفين آخرين: الكايد، أحمد (مشرف)
التاريخ الميلادي: 2017
موقع: عمان
الصفحات: 1 - 87
رقم MD: 857184
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة الشرق الأوسط
الكلية: كلية تكنولوجيا المعلومات
الدولة: الاردن
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

38

حفظ في:
المستخلص: تم استخدام مقاييس التشابه الدلالي بين الكلمات في عدة تطبيقات، منها استرجاع المعلومات ومعالجة اللغات الطبيعية. هنالك العديد من هذه المقاييس التي تستخدم المعجم الإلكتروني (WordNet) لحساب نسبة التشابه بين المفاهيم باللغة الإنكليزية. أبحاث قليلة جدا قامت بدراسة مقاييس التشابه الدلالي باستخدام المعجم الإلكتروني العربي (Arabic WordNet). صنفت مقاييس التشابه الدلالي التقليدية إلى أربعة فئات: المقاييس المبنية على المسار، المقاييس المبنية على محتوى المعلومات، المقاييس المبنية على الخصائص وأخيرا المقاييس الهجينة. قامت هذه الرسالة بدراسة تطبيق هذه المقاييس على المعجم الإلكتروني العربي (Arabic WordNet). عدد من المقاييس من فئات مختلفة تم تطبيقها على (Arabic WordNet) وذلك لتقييم فعاليتها. تم استخدام معيار بشري لتقييم فعالية هذه المقاييس التي تستخدم (Arabic WordNet). أظهرت نتائج التجارب أن المقياس (WuP) حقق أقل نسبة متوسط مربع الخطأ (MSE) بقيمة (1.64%) وأعلى قيمة ارتباط مع التقييم البشري (0.92). هذا يدل على أن المقياس (WuP) حصل على أفضل فعالية عند تطبيقه باستخدام الوردنت العربي مقارنة بالمقاييس الأخرى. كما وأظهرت النتائج أن المقياس (PATH) حصل على أسوأ فعالية. اقترحت هذه الرسالة مقياس تشابه دلالي جديد باستخدام (Arabic WordNet). المقياس الجديد يأخذ بعين الاعتبار ثلاثة عوامل: عمق المفاهيم في الشجرة الدلالية، طول المسافة بين المفهومين المقارن بينهما والمحتوى المعلوماتي لأقرب مفهوم مشترك يندرج تحته المفهومين المقارن بينهما. الوزن النسبي لهذه العوامل يعدل يدويا للحصول على الوزن النسبي المناسب. عدة تجارب أجريت لإيجاد أفضل وزن نسبي ليحقق أقل نسبة خطأ. من أجل تقييم المقياس الجديد تم استخدام نفس المعيار البشري المستخدم سابقا لتقييم المقاييس الأخرى. تمت مقارنة نتائج تطبيق المقياس الجديد باستخدام عينة الكلمات العربية على الوردنت العربي مع النتائج التي حققتها المقاييس الأخرى. أظهرت نتائج التجارب أن المقياس الجديد حقق أعلى معامل ارتباط مع التقييم البشري بقيمة (0.96) وحصل على نسبة متوسط مربع خطأ قريبة جدا من المقياس (Wup) بقيمة (1.89%).

عناصر مشابهة