Hybrid Arabic Text Plagiarism Detection System

Ghanem, Bilal; Arafeh, Labib

Hybrid Arabic Text Plagiarism Detection System

المؤلف الرئيسي:	Ghanem, Bilal (Author)
مؤلفين آخرين:	Arafeh, Labib (Advisor)
محكمة:	نعم
التاريخ الميلادي:	2017
موقع:	جنين
الصفحات:	1 - 83
رقم MD:	1019770
نوع المحتوى:	رسائل جامعية
اللغة:	الإنجليزية
الدرجة العلمية:	رسالة ماجستير
الجامعة:	الجامعة العربية الأمريكية - جنين
الكلية:	كلية الدراسات العليا
الدولة:	فلسطين
قواعد المعلومات:	Dissertations
مواضيع:	النص الهجين \| السرقات الأدبية \| الانتحال النصي
رابط المحتوى:	صفحة العنوان المستخلص قائمة المحتويات 24 صفحة الأولى 1 الفصل 2 الفصل 3 الفصل 4 الفصل 5 الفصل الخاتمة المصادر والمراجع الملاحق

عدد مرات التحميل

40

المستخلص:

تعد اللغة العربية لغة صرفية معقدة تختلف عن باقي اللغات اللاتينية، وكونها من اللغات الأكثر استخداما وتحدثا في وقتنا الحالي فإنها بحاجة إلى مزيد من الجهود من قبل الباحثين لزيادة أعداد الأنظمة والبرامج المصممة خصيصا لها. تكثر الأبحاث التي تكتب بالعربية حيث أنها تستهدف مواضيع ومجالات عربية وإسلامية مختلفة، ومع ذلك فإن التوجه في تحسين الأدوات التي تستهدف اللغة العربية قليل مقارنة مع اللغات الأخرى. لذلك هذه الأطروحة تعرض نظام هجين لكشف السرقة الأدبية في النصوص العربية HYPLAG وهو نهج يستهدف النصوص العربية لكشف السرقات الأدبية بدمج آلياتان أحداهما تعتمد على المجموعات البيانية وأخرى تعتمد على مصادر المعرفة باستخدام مصدر دلالي عربي. يتسم النهج المعروض بقابليته على كشف النصوص المنتحلة بطرق معقدة تستخدم مرادفات ومصادر الكلمات لإخفاء المصادر الأصلية للنصوص، حيث أن الأنظمة المعروضة سابقا تعتمد في عمليات كشف الانتحالات على الكلمات نفسها بدون التوجه للمرادفات وقياس التشابه الدلالي للمصطلحات. وهكذا فإن الهدف الرئيسي من هذا البحث هو كشف تأثير عملية دمج الآليتين على أداء عملية كشف النصوص المسروقة في اللغة العربية. أجريت دراسة أولية على طلاب جامعيين لفهم سلوكهم في عملية السرقة الأدبية، وأظهرت نتائج هذه الدراسة أن الطلاب يقومون بتطبيق طرق متعددة لسرقة النصوص في عمليات الانتحال. وأيضا أوضحت الدراسة أن من هذه الطرق هي تعديلات في أنواع الكلمات مثل الأفعال، الأسماء والصفات. بناء على نتائج هذه الدراسة تم بناء نظام HYPLAG آخذين بعين الإعتبار كل الأنماط التي تستخدم في عمليات السرقات الأدبية. HYPLAG يقوم بمقارنة الملفات المدخلة المشبوهة مع مجموعة كبيرة من الملفات الأخرى بطريقة فعالة حيث أنه يستغل هيكلية محركات البحث في عملية استرجاع المصادر الأصلية للملفات المشبوهة. وللتأكد من صحة النصوص المدخلة، يقوم النظام بتطبيق مجموعة من العمليات الأولية التي تقوم بتجهيز النص وإزالة كل مصادر التشويش على عملية الكشف. ومن أهم هذه العمليات هي استخراج مصادر الكلمات (Stemming). ولاستخدام أكثر أداة فعالية في عملية استخراج مصادر الكلمات من الأدوات المطروحة حاليا للغة العربية، قمنا باقتراح نهج جديد يستخدم مصدر لغوي لمقارنة فعالية هذه الأدوات. تمت مقارنة HYPLAG مع عدة أنظمة أخرى وأظهر دقة عالية وسرعة في المعالجة باستخدام نفس البيانات التي استخدمت في الأنظمة الأخرى، حيث أن هذه البيانات طرحت سابقا في مسابقة لكشف السرقة الأدبية للنصوص العربية (ExAraPlagDet-2015)، وأظهر النظام المعروض نتائج أفضل من الأنظمة الأخرى.

عناصر مشابهة

Teacher's and Student's Perception of Plagiarism
بواسطة: Aliouchouche, Fadhila منشور: (2024)
Talking About Plagiarism as an Ethical Dilemma among Algerian Students of English
بواسطة: Hamzaoui, Chahrazed منشور: (2022)
Duplicate Publication, Divided Publication, Text Recycling, and Copyright Infringement: What Do’s and What Don’ts to Avoid Self-Plagiarism
بواسطة: Ahmad, Mohammad Ibraheem منشور: (2018)
استخدام برامج كشف الانتحال Plagiarism Dictation لتحقيق النزاهة العلمية: رؤية تدريبية في ضوء مهارات التعلم الذاتي
بواسطة: عطية، جمال سليمان منشور: (2017)
Plagiarism Detection Technology in an EFL Setting: An Examination of Faculty’s Awareness
بواسطة: Ali, Holi Ibrahim Holi منشور: (2015)

Hybrid Arabic Text Plagiarism Detection System

عدد مرات التحميل

40

عناصر مشابهة

دليل المستخدم

دليل الفيديو