ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Identifying Palestinian Political Content from Arabic Tweets

العنوان بلغة أخرى: تعريف المحتوى الفلسطيني السياسي من التغريدات العربية
المؤلف الرئيسي: El Kurd, Hussam (Author)
مؤلفين آخرين: Baraka, Rebhi Soliman (Advisor)
التاريخ الميلادي: 2015
موقع: غزة
الصفحات: 1 - 67
رقم MD: 768660
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: الجامعة الإسلامية (غزة)
الكلية: كلية تكنولوجيا المعلومات
الدولة: فلسطين
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون
حفظ في:
المستخلص: أصبح تويتر شائع الاستخدام خصوصا في وكالات الأنباء والإعلام. وذلك بسبب أن التغريدات تعكس نظرة المجتمع في العالم والأحداث الحقيقة، كما أن هناك أعداد كبيرة تتواجد وتتابع كل جديد على تويتر، مما يجذب جميع الوكالات الإخبارية إلى تحليل ومعرفة ما يحدث في هذه الشبكة. الوكالات والصحافة تبحث دائما على الأدوات التي تساعدها في تحليل التغريدات، نظرا لصعوبة وتكلفة الأمر من خلال المتابعة اليدوية، بحيث تستطيع من خلال هذه الأدوات معرفة ما يحدث في قضايا وأحداث أو مناطق محددة. هناك أعمال كثيرة ناقشت وقدمت حلول لتحليل التغريدات بلغات لصيغة تستطيع الآلة تصنيفها وتحليلها. ولكن هذه الأعمال والأبحاث تعتني في مناطق ولغات محددة، على عكس اللغات الأخرى مثل العربية والتي ليس هناك اهتمام بحثي كافي يرقى لمستوى أهمية تويتر في الوطن العربي والقضايا والأحداث الكثيرة والكبيرة وعلى رأسها القضية الفلسطينية. في هذه الرسالة قدمنا منهجية باستخدام التعلم الآلي يمكن من خلالها تصنيف التغريدات العربية إلى تغريدات سياسية فلسطينية أم لا بشكل آلي. ويرجع السبب إلى اختيارنا للتصنيف للقضايا الفلسطينية السياسية كونها واحدة من أهم القضايا والتي تهتم فيها أغلب وسائل الإعلام العربي وكذلك وسائل التواصل الاجتماعي. منهجيتنا تقوم على جمع التغريدات حيث قمنا بتطوير تطبيق TwitterPalPol يقوم بجمع التغريدات من خلال منافذ تويتر المختلفة عبر محددات معينة مثل الكلمات المتعلقة بالقضية الفلسطينية والمنطقة واللغة ومن ثم نقوم بمعالجة التغريدات وتصنيف جزء منها بشكل يدوي إلى تغريدات متعلقة بالقضية الفلسطينية من الناحية السياسية وتغريدات لا تتبع، بحيث يتم استخدام هذه البيانات لتغذي خوارزمية التعلم الآلي بحيث يمكنها تصنيف تغريدات جديدة بشكل آلي. وفيما يتعلق بالبيانات قمنا بتجهيز قاعدتين من البيانات، حيث تحوي قاعدة البيانات الأولى جميع التغريدات التي قمنا بجمعها، بينما تحوي القاعدة الأخرى بيانات للتغريدات التي تم تصفيتها من خلال مصفي القيمة والذي يقوم على مجموعة من المحددات يتم فيها استثناء التغريدات الوهمية أو الأقل أهمية، لنقارن النتائج فيما بعد ونعرف أهمية وجود مرحلة تصفية أم لا، حيث كانت النتائج مرضية وعالية حيث كانت تتراوح بين الممتاز والجيد جدا في وحدات القياس الأساسية للتصنيف مثل ال (Recall) وال (Precision).

عناصر مشابهة