ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Analytical Study of Traditional and Intelligent Textual Plagiarism Detection Approaches

العنوان بلغة أخرى: دراسة تحليلية للأساليب التقليدية والذكية المستخدمة في كشف السرقة الأكاديمية
المصدر: مجلة التربية والعلم
الناشر: جامعة الموصل - كلية التربية
المؤلف الرئيسي: سعيد، أيوب على محمد (مؤلف)
مؤلفين آخرين: طاقة، آلاء ياسين طه (م. مشارك)
المجلد/العدد: مج31, ع1
محكمة: نعم
الدولة: العراق
التاريخ الميلادي: 2022
الصفحات: 8 - 25
ISSN: 1812-125X
رقم MD: 1265189
نوع المحتوى: بحوث ومقالات
اللغة: الإنجليزية
قواعد المعلومات: EduSearch
مواضيع:
كلمات المؤلف المفتاحية:
السرقة الأكاديمية | كشف السرقة الأكاديمية | مطابقة السلاسل النصية | التعلم العميق | تشابه النصوص | Plagiarism | Plagiarism Detection | String Matching | Deep Learning | Text Similarity
رابط المحتوى:
صورة الغلاف QR قانون
حفظ في:
المستخلص: توفر شبكة الويب أنواعا مختلفة من البيانات والتطبيقات المتاحة بسهولة للاستكشاف والاستخدام من قبل للمستخدمين. يحدث انتهاك حقوق النشر في مستندات الويب عند وجود نسخة غير مصرح بها من المعلومات أو النص من المستند الأصلي على الويب؛ يعرف هذا الانتهاك بالانتحال. يمكن تعريف اكتشاف الانتحال (PD) على أنه الإجراء الذي يجد أوجه التشابه بين مستند معين والمستندات الأخرى بناء على الميزات النصية المعجمية والدلالية والنحوية. تعتبر مناهج التمثيل الرقمي (تحويل النص) مثل Vector Space Model (VSM) ودمج الكلمات Word Embedding جنبا إلى جنب مع مقاييس تشابه النص مثل مقياس جيب التمام ضرورية للغاية لاكتشاف الانتحال النصي. تتناول هذه الورقة البحثية مفاهيم الانتحال، أنواع الانتحال، خصائص النصوص أو المستندات النصية، مقاييس تشابه النصوص، وطرائق الكشف عن الانتحال التي تستخدم تقنيات ذكية أو تقليدية. إذ تم مناقشة أنواع مختلفة من التقنيات التقليدية وخوارزميات التعلم العميق، الشبكة العصبية التلافيفية (CNN) والذاكرة طويلة المدى (LSTM) في كشف النصوص الأدبية. إلى جانب ذلك، يستعرض هذا العمل العديد من الأوراق الأخرى التي تهتم بموضوع الانتحال النصي وكشفه.

The Web provides various kinds of data and applications that are readily available to explore and are considered a powerful tool for humans. Copyright violation in web documents occurs when there is an unauthorized copy of the information or text from the original document on the web; this violation is known as Plagiarism. Plagiarism Detection (PD)can be defined as the procedure that finds similarities between a document and other documents based on lexical, semantic, and syntactic textual features. The approaches for numeric representation (vectorization) of text like Vector Space Model (VSM) and word embedding along with text similarity measures such as cosine and jaccard are very necessary for plagiarism detection. This paper deals with the concepts of plagiarism, kinds of plagiarism, textual features, text similarity measures, and plagiarism detection methods, which are based on intelligent or traditional techniques. Furthermore, different types of traditional and algorithms of deep learning for instance, Convolutional Neural Network (CNN) and Long Short-Term Memory (LSTM) are discussed as a plagiarism detector. Besides that, this work reviews many other papers that give attention to the topic of Plagiarism and its detection.

ISSN: 1812-125X

عناصر مشابهة