ارسل ملاحظاتك

ارسل ملاحظاتك لنا







بناء نموذج لتحليل المشاعر للهجة العامية السودانية عن خدمة الانترنت: شركة سوداني للاتصالات

العنوان بلغة أخرى: Build Sentiment Analysis Model for the Sudanese Dialect for the Internet Service: Sudani - Case Study
المؤلف الرئيسي: حميده، إسلام سيف الدين مختار (مؤلف)
مؤلفين آخرين: أحمد، السماني عبدالمطلب (مشرف)
التاريخ الميلادي: 2021
موقع: الخرطوم
الصفحات: 1 - 125
رقم MD: 1204043
نوع المحتوى: رسائل جامعية
اللغة: العربية
الدرجة العلمية: رسالة دكتوراه
الجامعة: جامعة النيلين
الكلية: كلية الدراسات العليا
الدولة: السودان
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

141

حفظ في:
المستخلص: تحليل المشاعر أو تحليل الآراء هو إجراء يستخدم لتحديد ما إذا كانت مجموعة النص إيجابية، سلبية أم محايدة، حيث يتم الجمع بين تقنيات معالجة اللغة الطبيعية (NLP) وتقنيات تعلم الاله (ML) لتعيين درجات المشاعر. توفر منصات وسائل التواصل الاجتماعي كمية من البيانات يعبر فيها الناس عن آرائهم ومشاعرهم مما جعل هذه المواقع مصدرا شائعا لجمع هذه الآراء وتحليها ودراستها. تحليل المشاعر العربية لم يحظ بالكثير من الاهتمام، مثل اللغة الإنجليزية، ويرجع ذلك في الأساس إلى الافتقار إلى الأدوات والموارد المتاحة لاستخراج المشاعر العربية من النص وإلى التحديات التي تواجه صياغة اللغة العربية المعقدة. 59% تقريبا من مستخدمين الإنترنت في الشرق الأوسط، يستخدمون مواقع التواصل الاجتماعي غير أنهم يعبرون عن آرائهم ومشاعرهم بلهجاتهم المحلية التي تحتوي على العديد من الاختصارات، والأخطاء متجاهلة بذلك قواعد اللغة العربية. تتفاقم هذه التحديات عند التعامل مع اللهجة العامية السودانية التي لا تلتزم بالبنية النحوية الشكلية للغة العربية الفصحى الحديثة. حيث يمكن أن توجد الكلمة العربية في عدة أشكال ويمكن أن يكون لها عدة معان كذلك يمكن أن يتبعها لواحق (بداية أو نهايات) تغير من شكل الكلمة، مما دفع الباحث لدراسة المشاعر لهذه اللهجة التي هدفت إلى بناء نموذج لتحليل المشاعر لخدمة الإنترنت في السودان المكتوبة باللغة العربية باستخدام العربية الفصحى واللهجة العامية السودانية لتطبيق تحليل المشاعر للنصوص العربية السودانية، والتي أجريت على 1048 تعليقا لخدمة الإنترنت من وسيلة التواصل الاجتماعي فيس بوك. وأيضا إنشاء معجم للكلمات الإيجابية والسلبية الخاصة بتحليل المشاعر. استخدم الباحث تقنيات معالجة اللغة الطبيعية لمعالجة البيانات. استخدم مكتبات خاصة بالبايثون وهي الدالة (re.sub) في الوحدة (Regular Expression) لتوحيد أشكال الكلمات المتميزة وذلك لربط كل الكلمات بالكلمة الأساسية كما في المعجم بالإضافة إلى خطوات المعالجة المسبقة للنص مما أدى إلى زيادة دقة النموذج، طبق أيضا مصنفين مختلفين: هما (SVM وBayes NB) لتصنيف التعليقات بناء على قطبيتها. تم تقييم العمل من خلال أربع مقاييس (Precision, Recall, f-Score, Accuracy) وأظهرت النتائج أن خطوات المعالجة زادت دقة تصنيف المشاعر وإن SVM حقق أفضل دقة- قياس بلغت 86.5% بينما حقق NB دقة تعادل 80%.

عناصر مشابهة