المستخلص: |
تحليل المشاعر العربية هي عملية محوسبة تهدف إلى استخلاص الآراء الشخصية لمختلف المستخدمين حول موضوعات مختلفة، حيث إن هذه الآراء والمشاعر تستخدم للتعرف على وجهات نظرهم وأحكامهم في مجال معين. هناك عدد قليل من الأبحاث التي تهدف إلى معالجة تحليل المعنويات القائمة على التوجه الدلالي بالنسبة للغة العربية وباستخدام علم الانتولوجي وأهمية الميزات على وجه التحديد. في هذه الأطروحة، قمنا ببناء منهج توجه دلالي لحساب الأقطاب الشاملة من النصوص العربية الشخصية قائم على الانتولوجيا الممثلة للمجال وقاموس المعنويات المتاح. يتم استخدام مفاهيم الانتولوجيا لاستخراج ميزات المجال الدلالية مع الأخذ بعين الاعتبار مستوياتها في شجرة الانتولوجيا وتردداتها في مجموعة البيانات لحساب الاستقطاب الكلي لمراجعة نصية معينة بناء على أهمية كل ميزة في هذا المجال. لغايات التقييم، تم اختيار مجموعة بيانات عربية من مجال الفنادق لبناء علم النطاق )الانتولوجيا( ولاختبار النهج المقترح. تم تصنيف التجارب التي تم إجراؤها إلى مجموعتين، تجارب التعلم الآلي التي هي: Naïve Bayes, Support Vector Machines, Decision Tree, K-Nearest Neighbors، وكذلك تجارب لتقييم التوجيه الدلالي وهي: نهج المعجم الأساسي، والنهج الأساسي للانتولوجيا، ونهج الانتولوجيا مع أهمية المستوى. أظهرت النتائج أن هذا النهج تفوق على بعض أساليب التعلم الآلي، وأنه تفوق على مناهج التوجيه الدلالية الأخرى بدقة شاملة تصل إلى 79.20% وبمقياس F-measure يصل إلى 78.75%.
|