العنوان بلغة أخرى: |
تحليل مجموعة البيانات "البريد الإلكتروني" باستخدام نهج التصنيف لتحديد الكتاب |
---|---|
المصدر: | مجلة شمال إفريقيا للنشر العلمي |
الناشر: | الأكاديمية الأفريقية للدراسات المتقدمة |
المؤلف الرئيسي: | الدبيب، خالد أحمد (مؤلف) |
المؤلف الرئيسي (الإنجليزية): | Adbeib, Khaled Ahmed |
المجلد/العدد: | مج1, ع4 |
محكمة: | نعم |
الدولة: |
ليبيا |
التاريخ الميلادي: |
2023
|
الشهر: | ديسمبر |
الصفحات: | 100 - 108 |
ISSN: |
2959-4820 |
رقم MD: | 1467088 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | الإنجليزية |
قواعد المعلومات: | EduSearch, HumanIndex |
مواضيع: | |
كلمات المؤلف المفتاحية: |
تحليل الكتابة | ميزات الأسلوب | تحليل التصنيف | تصنيف الكتابة | Rapidminer | K-Nearest Neighbor | Authorship Analysis | Stylometric Features | Classification Analysis | Authorship Categorization
|
رابط المحتوى: |
المستخلص: |
مع انتشار تقنيات الإنترنت والتطبيقات، ظهور سوء استخدام البريد الإلكتروني عبر الإنترنت لأغراض غير قانونية أصبح مصدر قلق كبير. تحديد الكاتب هو مهمة تحليل نصي حاسمة تنطوي على تحديد الكاتب المحتمل لوثيقة معينة. في سياق الرسائل الإلكترونية، يمكن استخدام هذه الطريقة لتحديد الشخص الذي يقف وراء رسالة بريد إلكتروني معينة استنادا إلى أسلوب الكتابة، واختيار الكلمات، وميزات اللغة الأخرى. يعتبر تحليل التصنيف نهجا شائعا لتحديد الكتاب، حيث يتم تدريب نماذج التعلم الآلي على مجموعة بيانات تحتوي على أسماء كتاب معروفين لتوقع الكتابة لنصوص غير معروفة. طابع الهوية المجهولة للبريد الإلكتروني عبر الإنترنت يشكل تحديات في تتبع الهويات، مما يجعلها مشكلة رئيسية. الإنترنت يشكل ملعبا للمجرمين الإلكترونيين الذين يشاركون في أنشطة تتراوح بين الرسائل المزعجة البسيطة إلى هجمات الاحتيال المعقدة. يبرز تحليل الكتابة كإجراء رئيسي المواجهة مثل هذه الأنشطة الإلكترونية غير القانونية. يستكشف هذا البحث تحديد هوية الكتاب، مركزا على مجموعة بيانات من رسائل البريد الإلكتروني للتحقق مما إذا كان البريد الإلكتروني المجهول قد تم إنشاؤه بواسطة مشتبه به. الهدف الرئيسي من هذا المشروع هو تحديد الكتابة للرسائل الإلكترونية المجهولة باستخدام ميزات الأسلوب. تتضمن هذه الميزات غنى المفردات، وطول الجمل، وأسلوب الكتابة من خلال فحص مجموعة بيانات تضم رسائل بريد إلكتروني معروفة، يهدف البحث إلى التمييز والتحقق من الكتابة للرسائل الإلكترونية المجهولة. أثبت تحليل الكتابة فعاليته ليس فقط في مواجهة الأنشطة الإلكترونية غير القانونية ولكن أيضا في تحديد الكاتب الحقيقي للبريد الإلكتروني المجهول. يساهم هذا البحث في الجهود المستمرة لتعزيز التدابير الأمنية عبر الإنترنت ومواجهة التحديات الناجمة عن سوء استخدام الاتصالات عبر الإنترنت. With the widespread adoption of internet technologies and applications, the misuse of online emails for illicit purposes has become a significant concern. Authorship identification, a crucial text analysis task, involves determining the likely author of a given document. In the context of emails, this methodology proves valuable in attributing a particular email to its originator based on factors such as writing style, word choice, and other linguistic features. Classification analysis emerges as a prevalent approach for authorship identification, employing machine learning models trained on a dataset of known authors to predict the authorship of unknown texts. The anonymous nature of online emails presents challenges in tracing identities, escalating the gravity of the issue. The internet has unfortunately become a playground for cybercriminals engaging in activities ranging from simple spamming to sophisticated phishing attacks. Authorship analysis stands out as a pivotal measure to counter such illicit cyber activities. This study delves into authorship identification, focusing on a dataset of emails to ascertain whether an anonymous email is created by a suspect. The primary objective of this project is to discern the authorship of anonymous emails by leveraging stylometric features. These features encompass vocabulary richness, sentence length, and writing style. Through an examination of a dataset comprising known emails, the study aims to distinguish and confirm the authorship of anonymous emails. Authorship analysis has demonstrated effectiveness not only in countering illegal cyber activities but also in revealing the true authorship of anonymous emails. This research contributes to the ongoing efforts to bolster cybersecurity measures and address the challenges posed by the misuse of online communication |
---|---|
ISSN: |
2959-4820 |