ارسل ملاحظاتك

ارسل ملاحظاتك لنا







تصميم نظام لتحليل المزاج العام للغة العربية الفصحى باستخدام معجم حاسوبي

المصدر: مجلة كلية دار العلوم
الناشر: جامعة القاهرة - كلية دار العلوم
المؤلف الرئيسي: الناجم، صلاح راشد (مؤلف)
المجلد/العدد: ع138
محكمة: نعم
الدولة: مصر
التاريخ الميلادي: 2022
الشهر: يناير
الصفحات: 327 - 353
ISSN: 1110-581X
رقم MD: 1292313
نوع المحتوى: بحوث ومقالات
اللغة: العربية
قواعد المعلومات: AraBase
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

9

حفظ في:
المستخلص: يقدم هذا البحث نظاما لتحليل المزاج العام للغة العربية الفصحى قمنا بتصميمه باستخدام نظام Repustate Sentiment Analysis Engine المستخدم في تصميم أنظمة تحليل المزاج العام لعدة لغات في العالم. لتصميم هذا النظام، قمنا ببناء قاعدة بيانات معجمية للمزاج العام (Sentiment Analysis Lexical Database) للصيغ الصرفية الأساسية (Lemmas) للأسماء والأفعال في اللغة العربية الفصحى عن طريق تطوير وتعديل قاعدة بيانات معجمية صرفية مفتوحة المصدر (Open Source) مخصصة للتحليل الصرفي للأسماء والأفعال العربية صممت سابقا باستخدام تقنية الآلات منتهية الحالات (Finite State Automata) وبنيت من مدونة نصية حاسوبية (Corpus) ضخمة مكونة من أكثر من مليار كلمة. بعد ذلك استخدمنا نظام Xerox Finite-State Tools لتوليد الكلمات المصرفة (Inflected Words) المصاغة باستخدام الصيغ الصرفية الأساسية للأسماء والأفعال من قاعدة البيانات المعجمية المذكورة مع بيانات المزاج العام (Sentiment Polarity) والسمات الصرف-نحوية (Morpho-syntactic Features) لهذه الكلمات المصرفة. ثم استخدمنا لغة Python للبرمجة للقيام ببرمجة نظام Repustate Sentiment Analysis Engine وذلك ببرمجة قانون حاسوبي للمزاج العام (Sentiment Rule) لكل كلمة مصرفة مع تحديد المزاج العام لهذه الكلمة بناء على معلومات المزاج العام التي حددناها في قاعدة البيانات المعجمية المذكورة. باستخدام هذه التعليمات البرمجية، استطعنا تكوين معجم حاسوبي للمزاج العام (Sentiment Analysis Lexicon) للغة العربية الفصحى خاص بنظام Repustate Sentiment Analysis Engine بناء على بيانات قاعدتنا المعجمية، وذلك لاستخدامه في التعرف الآلي على المزاج العام للنصوص كما هو متبع في أنظمة المزاج العام المبنية على القوانين (Rule-based) والتي تعرف أيضا بالأنظمة المبنية على المعجم (Lexicon-based)، وهي أنظمة تعتمد في عملها على معاجم حاسوبية.

ISSN: 1110-581X

عناصر مشابهة