LEADER |
04210nam a22002417a 4500 |
001 |
2123707 |
041 |
|
|
|a ara
|
044 |
|
|
|b فلسطين
|
100 |
|
|
|9 726707
|a عثمان، أحمد حامد
|e مؤلف
|g Osman, Ahmed Hamed
|
245 |
|
|
|a قياس فعالية نموذج اكتشاف الرسائل غبر المرغوب فيها في خدمة الرسائل القصيرة استنادا على تقنيات التعلم الآلي
|
246 |
|
|
|a Measure Effectiveness of SMS Spam Detection Model Based on Machine Learning Techniques
|
260 |
|
|
|b المركز القومي للبحوث
|c 2023
|g مارس
|
300 |
|
|
|a 58 - 68
|
336 |
|
|
|a بحوث ومقالات
|b Article
|
520 |
|
|
|a مع زيادة استخدام الهواتف المحمولة، زاد استخدام خدمة الرسائل القصيرة بشكل هائل أدى إلى انخفاض تكلفة الرسائل النصية. بدأ الناس في استخدامها لأغراض ترويجية وأنشطة غير أخلاقية. مما أدى ذلك أيضا إل زيادة هائلة في الرسائل العشوائية (Spam) وبالتالي يحصل فقدان البيانات الشخصية والمالية. ولمنع فقدان البيانات من الضروري اكتشاف الرسائل العشوائية في أسرع وقت ممكن. تهدف هذه الورقة إلى تصنيف الرسائل العشوائية ليس فقط بشكل فعال، ولكن أيضا في وقت قصير، كما إنه يعد هذا البحث قابل للتطبيق في الدول الناطقة باللغة الإنجليزية أو يتم إرسال الرسائل النصية فيها للمستخدمين باللغة الإنجليزية حتى يومنا هذا. تم استخدام مجموعة بيانات تحتوي على آلاف الرسائل النصية التي تحتوي على رسائل نصية (Ham) ورسائل نصية عشوائية (Spam). تم استخدام تقنيات معالجة اللغة الطبيعية وخوارزميات تعلم الآلة (مصنف بايز الساذج (Naive Bayes) وشجرة القرار Decision Tre)) والغابة العشوائية (Random Forest) التي يمكننا من خلالها تصنيف نوع الرسالة. بعد تطبيق هذه الخوارزميات، حصلت خوارزمية Random Forest على أفضل دقة %0.99 في 0.15 ثواني.
|b With the increase in the use of mobile phones, the use of Short Message Service has increased exponentially. With the cost of text messages dropping, people started using them for promotional purposes and unethical activities. This led to a massive increase in spam and consequently the loss of personal and financial data. To prevent data loss, it is essential that spam is detected as quickly as possible. Thus, this paper aims to classify spam not only effectively but also in a short time using python. A dataset containing thousands of text messages containing natural messages (ham) and spam messages was used. Natural language processing techniques were used Multiomail Naive Bayes, Decision Tree and Random Forest are used through which we can classify the message type. After applying these algorithms, Random Forest algorithm got the best accuracy 0.99% in 0.15 second.
|
653 |
|
|
|a الرسائل القصيرة
|a اللغة الطبيعية
|a التعلم الآلي
|
692 |
|
|
|a الدقة
|a التصنيف
|a تعلم الآلة
|a مجموعات البيانات
|a عشوائية
|a معالجة اللغة الطبيعية
|b Accuracy
|b Classification
|b Confusion Matrix
|b Dataset
|b Ham
|b Natural Language Processing
|
700 |
|
|
|9 726708
|a الخليفة، محمد بدوي
|e م. مشارك
|g Al-Khalifa, Muhammad Badawi
|
773 |
|
|
|4 العلوم الإنسانية ، متعددة التخصصات
|6 Humanities, Multidisciplinary
|c 003
|f Mağallaẗ al-ʿulūm al-handasiyyaẗ wa-al-tiknūlūğiyā al-maʿlūmāt
|l 001
|m مج7, ع1
|o 1746
|s مجلة العلوم الهندسية وتكنولوجيا المعلومات
|t Journal of Engineering Sciences and Information Technology
|v 007
|x 2522-3321
|
856 |
|
|
|u 1746-007-001-003.pdf
|
930 |
|
|
|d y
|p y
|q n
|
995 |
|
|
|a HumanIndex
|
999 |
|
|
|c 1372257
|d 1372257
|