العنوان بلغة أخرى: |
أسلوب قائم على مستوى العبارات لتحليل المشاعر المضمنة في التغريدات العربية |
---|---|
المؤلف الرئيسي: | نوفل، حنان خالد (مؤلف) |
مؤلفين آخرين: | شواقفة، عماد محمود (مشرف) |
التاريخ الميلادي: |
2019
|
موقع: | إربد |
الصفحات: | 1 - 47 |
رقم MD: | 1125322 |
نوع المحتوى: | رسائل جامعية |
اللغة: | الإنجليزية |
الدرجة العلمية: | رسالة ماجستير |
الجامعة: | جامعة اليرموك |
الكلية: | كلية تكنولوجيا المعلومات وعلوم الحاسوب |
الدولة: | الاردن |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
نظرا لنمو تواجد المعلومات بحجم كبير على الأنترنت والازدياد المضطرد لاستخدام وسائل التواصل الاجتماعي، بدأ المستخدمون بالتعبير عن آرائهم بحرية باستخدام المدونات وشبكات التواصل الاجتماعي. يتوافر لدى المستخدمين العديد من الأدوات القوية والتي يمكن استخدامها للتعبير عن الآراء، لكن عملية تحليل هذه الآراء والمشاعر حول بعض المنتجات والأحداث والخدمات وأية أمور أخرى تتطلب مزيدا من الوقت والجهد. لذلك، أصبح من الضرورة تواجد أنظمة ذكية يمكن استخدامها لتحليل وتنقيب وتصنيف هذه المعلومات الضخمة. في هذه الرسالة، نقدم إطار لتحليل المشاعر العربية باستخدام العديد من الميزات من خلال النصوص العامية والمستخدمة بكثرة على المدونات. تمت دراسة أثر استخدام تحليل المشاعر المبني على استخدام العبارات (كلمات سلبية، كلمات إيجابية، كلمات مزدوجة، والكلمات المنفية) في التغريدات العربية على دقة وأداء النتائج. تم استخدام مجموعة بيانات مكونة من (1954) تغريدة تم جمعها من موقع تويتر وتطبيق تصنيف المشاعر المكون من مرحلتين باستخدام خوارزميات تصنيف الآله: SVM, NB, RF باستخدام برمجية Weka تم إجراء ثلاثة تجارب رئيسة تحوي (7) تجربة فرعية على البيانات. أشارت النتائج المحصلة بان استخدام خوارزمية NB كانت الأفضل وخاصة باستخدام طريقة التقييم (fold-10) بدقة وصلت إلى (0.685). تم ملاحظة وجود تحسن في النتائج عند استخدام العبارات وخاصة عند استخدام عملية الفصل (80%) لعملية دمج العبارات مع ميزات المشاعر بدقة (0.707). |
---|