ارسل ملاحظاتك

ارسل ملاحظاتك لنا







طريقة مقترحة للكشف عن تشابه النصوص في الوثائق الإنجليزية باستخدام الشبكات الدلالية

المصدر: المجلة العراقية للعلوم الإحصائية
الناشر: جامعة الموصل - كلية علوم الحاسوب والرياضيات
المؤلف الرئيسي: ذنون، باسل يونس (مؤلف)
مؤلفين آخرين: إبراهيم، ربي طلال (م. مشارك)
المجلد/العدد: ع25
محكمة: نعم
الدولة: العراق
التاريخ الميلادي: 2013
الصفحات: 456 - 473
ISSN: 1680-855X
رقم MD: 636650
نوع المحتوى: بحوث ومقالات
قواعد المعلومات: EcoLink
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون
حفظ في:
المستخلص: إن الزيادة الهائلة للوثائق المتوفرة في شبكة الإنترنت العالمية وسهولة الوصول إليها أدى إلى مشكلة خطيرة تتمثل في استخدام أعمال الآخرين من دون إ عطاءهم أي ائتمانات. وعلى الرغم من تطوير العديد من الأساليب للكشف عن بعض حالات الانتحال مثل تغيير بنية الجمل أو استبدال الكلمات بمرادفاتها، إلا انه من الصعب كشف الانتحال عند التعديل على الجمل المنسوخة بشكل متعمد. يقترح في هذا البحث نظام يستخدم خوارزمية التشابه الدلالي للكشف عن الانتحال. لقد تم عمل قاعدة بيانات تتضمن النصوص الأصلية من مختلف المجالات، وتم اختيار عدد منها لتكون مصدرا لعشرة نصوص منتحلة يدويا. وتعتمد خوارزمية التشابه الدلالي لحساب التشابه بين الوثائق الأصلية والوثيقة المدخلة اعتمادا على اشتراكهما بأكبر عدد من الكلمات المتشابهة. وقد تم إجراء تحسين عليها بإيجاد التشابه بين الوثائق المنتحلة والكتب المصدرية الكبيرة الحجم وكذلك الإنكليزية المتعددة المعاني. ويقوم النظام بمطابقة الوثيقة المنتحلة المدخلة ونصوص قاعدة البيانات واسترجاع نسب التشابه للنصوص التي تزيد عن 50%. كما يقوم النظام بالمطابقة بين النصين الأصلي والمنتحل واسترجاع النسبة المئوية للتشابه بينهما وعدد الكلمات والأسماء والأفعال والصفات والظروف المتشابه كتابة ومعنى.

The massive increase in documents on the world-wide web and the ease to reach them have led to a dangerous problem which is using others' works without giving them credits. Although a number of methods have been developed to discover some cases of plagiarism, as changing sentence structure or replacing words with their synonyms, it is still difficult to diagnose plagiarism when modifying deliberately quoted sentences. In this paper a Semantic Similarity Algorithm System is proposed for discovering plagiarism in texts using semantic networks. A data base is formed to accommodate the original texts belonging to different fields. The system depends on determining the degree of similarity between original documents and inserted documents on the basis of sharing the largest number of similar words. It has been improved by determining the similarity between the plagiarized documents and the big source books in addition to words of multiple meanings. It compares the plagiarized document to the data base text, and recalls the text percentage of similarity over 50%. It also compares the original text with the plagiarized one and recall the percentage of similarity between them as well as the number of nouns, verbs, adjective and adverbs which are similar in both writing and meaning.

ISSN: 1680-855X