ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Tweetsentkw: A Corpus of Multi-Label Emotion Analysis for Kuwaiti Arabic Tweets

العنوان بلغة أخرى: مدونة لغوية متعددة الأوسمة لتحليل المشاعر في التغريدات الكويتية
المصدر: مجلة دراسات الخليج والجزيرة العربية
الناشر: جامعة الكويت - مجلس النشر العلمي
المؤلف الرئيسي: الشرهان، إيمان توفيق (مؤلف)
المؤلف الرئيسي (الإنجليزية): Alsharhan, Eiman
مؤلفين آخرين: النشمي، عيسى نشمي (م. مشارك) , رامزي، آلان مكغريغور (م. مشارك)
المجلد/العدد: س50, ع193
محكمة: نعم
الدولة: الكويت
التاريخ الميلادي: 2024
التاريخ الهجري: 1445
الشهر: يونيو
الصفحات: 357 - 391
ISSN: 0254-4288
رقم MD: 1486540
نوع المحتوى: بحوث ومقالات
اللغة: الإنجليزية
قواعد المعلومات: EcoLink, HumanIndex
مواضيع:
كلمات المؤلف المفتاحية:
المعالجة الآلية للغة | قياس الرأي العام | اللهجة الكويتية | وسائل التواصل الاجتماعي | التعرف الآلي على المشاعر | Natural Language Processing | Sentiment Analysis | Emotion Classification | Deep Learning | Communication
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

3

حفظ في:
المستخلص: الأهداف: هدفت الدراسة لبناء مدونة لغوية للتغريدات المكتوبة باللهجة الكويتية، إذ تشكل الكتابة باللهجة المحلية تحديا لتطوير أنظمة حاسوبية لتحليل اللغة المستخدمة في مواقع التواصل الاجتماعي ومساعدة الحكومات والمؤسسات في التعرف على التوجه العام حول القضايا المختلفة ورسم السياسات المستقبلية؛ وذلك بسبب نقص الموارد اللغوية الخاصة بهذه اللهجات. المنهج: اتبعت الدراسة المنهج الوصفي الإحصائي وذلك في تقديم وصف تفصيلي للمعلومات والإحصائيات المتعلقة بالمدونة التي تم بناؤها، وقياس مدى الاتفاق بين المرمزين، ونوع المشاعر المرصودة، كل تغريدة تم ترميزها من قبل 3 مرمزين، وبمشاركة إجمالية من 468 مرمز مدرب في إنجاز هذه المهمة. النتائج: نتج عن الدراسة بناء مدونة لغوية خاصة بالتغريدات المكتوبة باللهجة الكويتية تحتوي على نوع المشاعر التي تحملها كل تغريدة، مثل: حب، غضب، تأييد، اعتراض، تفاؤل، تشاؤم....، إضافة إلى بناء المدونة، قدمت الدراسة دراسة لمصداقية المرمزين كما بحث عن مدى التوافق بينهم، باستخدام نموذج جاكارد المعدل، وعلى أساسها تم استبعاد المرمزين غير الموثوقين، والوصول إلى فهم أفضل لأسباب ضعف الاتفاق في بعض المواضع. الخاتمة: ستكون المدونة اللغوية متوفرة بشكل كامل للباحثين المهتمين في مجال التصنيف الآلي للمشاعر للقيام بأبحاثهم المهتمة باللهجة الكويتية.

Objectives: Arabic language is primarily represented in two varieties: Modern Standard Arabic (MSA) and Dialectal Arabic (DA). With the advent of social media, there has been a shift from the predominant use of MSA in writing to the incorporation of DA, thereby generating extensive resources for dialectal text studies. Kuwaiti Arabic (KA), a sub-variety of the Gulf dialect and one of the five principal Arabic dialects, differs significantly from MSA in all linguistic aspects. KA is an under- resourced language with a notable deficiency in language resources. The development of emotion classification tools relies heavily on the availability of resources such as annotated corpora. This study introduces TweetSentKW, a multi-label emotion annotated corpus for KA. Method: TweetSentKW was developed by collecting tweets and selecting relevant emotional classes for the annotation process. Each tweet was annotated by three independent annotators. Results: The TweetSentKW corpus comprises 40,000 manually labeled tweets across various topics. Besides constructing the corpus, this study provides a comprehensive analysis of annotator behavior and the co-occurrences of emotions. The corpus is anticipated to significantly contribute to sentiment analysis research, a crucial method for gauging public opinion. Conclusion: The widespread use of social media platforms, such as Twitter, has led to continuous and uninhibited public expression of opinions on diverse issues. The public and archived nature of these opinions presents a rich opportunity for researchers to analyze and understand public sentiment and perspectives.

ISSN: 0254-4288

عناصر مشابهة