المستخلص: |
في الوقت الحاضر، يفضل معظم الناس استخدام الإنترنت كمصدر رئيسي للأخبار، حيث أن الوصول إليها سهلا ويعد تقريبا رخيص التكلفة. في السنوات الأخيرة، كانت هناك مشكلة مقلقة للغاية في مصداقية الكثير من الأخبار المنتشرة بسبب انتشار الأخبار المزيفة في وسائل التواصل الاجتماعي لأن لغة الأخبار المزيفة تتغير باستمرار ومن الصعب تحديد مصادر الأخبار الموثوق بها. تعد القدرة على اكتشاف وتقييم وتصحيح الأخبار المزيفة مهمة صعبة. إذا لم يتم التعامل مع هذه المشكلة بشكل صحيح، فقد يؤدي ذلك إلى تأثير كبير على العديد من المجالات التي يمكن أن تتأثر بسهولة بالأخبار المزيفة، ومعظمها في المجالات الاقتصادية والسياسية، لأن الأخبار المزيفة لها دور مؤثر بشكل كبير في تشكيل الرأي العام وتناشد أيضا العاطفة والمعتقدات الشخصية. في هذه الرسالة، نقترح طريقة جديدة للكشف عن الأخبار الزائفة، للتنبؤ ما إذا كان الخبر المنشور حقيقي أو زائف. يستخدم الأسلوب المقترح مفهوم التكتل المشترك الطيفي Spectral co-clustering لتحديد العلاقات بين الكائنات في الشبكات الاجتماعية وأيضا يستخدم مفهوم توسعة البيانات data augmentation بإضافة المصطلحات الناتجة عن Spectral co-clustering على مجموعة البيانات الأصلية، مما أدى إلى إنشاء مجموعة بيانات جديدة من المجموعات الناتجة. لغايات التنبئ تم استخدام ستة من خوارزميات التصنيف(Logistic Regression, Naive Bayes Classifier, Nearest Neighbor, Support Vector Machine, Decision Trees, and Random Forest) لتقييم قدرة مفهوم التكتل المشترك الطيفي في التجمع لتعزيز دقة نتيجة التصنيف. نتيجة لتطبيق زيادة البيانات، نتج أربعة مجموعات بيانات جديدة. تم تطبيق خوارزميات التصنيف على مجموعات البيانات الجديدة وعلى المجموعة الأصلية. نتائج الدقة كانت عالية حيث إنها وصلت إلى 98% في بعض خوارزميات التصنيف، وهي نتائج أعلى من البحث الذي أجري في مجال الأخبار المزيفة دون استخدام المفاهيم المذكورة.
|