المستخلص: |
تحليل المشاعر أو تحليل الآراء هو إجراء يستخدم لتحديد ما إذا كانت مجموعة النص إيجابية، سلبية أم محايدة، حيث يتم الجمع بين تقنيات معالجة اللغة الطبيعية (NLP) وتقنيات تعلم الاله (ML) لتعيين درجات المشاعر. توفر منصات وسائل التواصل الاجتماعي كمية من البيانات يعبر فيها الناس عن آرائهم ومشاعرهم مما جعل هذه المواقع مصدرا شائعا لجمع هذه الآراء وتحليها ودراستها. تحليل المشاعر العربية لم يحظ بالكثير من الاهتمام، مثل اللغة الإنجليزية، ويرجع ذلك في الأساس إلى الافتقار إلى الأدوات والموارد المتاحة لاستخراج المشاعر العربية من النص وإلى التحديات التي تواجه صياغة اللغة العربية المعقدة. 59% تقريبا من مستخدمين الإنترنت في الشرق الأوسط، يستخدمون مواقع التواصل الاجتماعي غير أنهم يعبرون عن آرائهم ومشاعرهم بلهجاتهم المحلية التي تحتوي على العديد من الاختصارات، والأخطاء متجاهلة بذلك قواعد اللغة العربية. تتفاقم هذه التحديات عند التعامل مع اللهجة العامية السودانية التي لا تلتزم بالبنية النحوية الشكلية للغة العربية الفصحى الحديثة. حيث يمكن أن توجد الكلمة العربية في عدة أشكال ويمكن أن يكون لها عدة معان كذلك يمكن أن يتبعها لواحق (بداية أو نهايات) تغير من شكل الكلمة، مما دفع الباحث لدراسة المشاعر لهذه اللهجة التي هدفت إلى بناء نموذج لتحليل المشاعر لخدمة الإنترنت في السودان المكتوبة باللغة العربية باستخدام العربية الفصحى واللهجة العامية السودانية لتطبيق تحليل المشاعر للنصوص العربية السودانية، والتي أجريت على 1048 تعليقا لخدمة الإنترنت من وسيلة التواصل الاجتماعي فيس بوك. وأيضا إنشاء معجم للكلمات الإيجابية والسلبية الخاصة بتحليل المشاعر. استخدم الباحث تقنيات معالجة اللغة الطبيعية لمعالجة البيانات. استخدم مكتبات خاصة بالبايثون وهي الدالة (re.sub) في الوحدة (Regular Expression) لتوحيد أشكال الكلمات المتميزة وذلك لربط كل الكلمات بالكلمة الأساسية كما في المعجم بالإضافة إلى خطوات المعالجة المسبقة للنص مما أدى إلى زيادة دقة النموذج، طبق أيضا مصنفين مختلفين: هما (SVM وBayes NB) لتصنيف التعليقات بناء على قطبيتها. تم تقييم العمل من خلال أربع مقاييس (Precision, Recall, f-Score, Accuracy) وأظهرت النتائج أن خطوات المعالجة زادت دقة تصنيف المشاعر وإن SVM حقق أفضل دقة- قياس بلغت 86.5% بينما حقق NB دقة تعادل 80%.
|