العنوان بلغة أخرى: |
تلخيص تلقائى للنصوص العربية |
---|---|
المؤلف الرئيسي: | Al Farra, Eyad (Author) |
مؤلفين آخرين: | Mikki, Mohammad A. (Advisor) |
التاريخ الميلادي: |
2015
|
موقع: | غزة |
التاريخ الهجري: | 1437 |
الصفحات: | 1 - 108 |
رقم MD: | 768515 |
نوع المحتوى: | رسائل جامعية |
اللغة: | الإنجليزية |
الدرجة العلمية: | رسالة ماجستير |
الجامعة: | الجامعة الإسلامية (غزة) |
الكلية: | كلية الهندسة |
الدولة: | فلسطين |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
اللغة العربية تعتبر من اللغات الأكثر شهرة على مستوى العالم، تنبع أهميتها من كونها اللغة الخامسة حول العالم من حيث عدد المتحدثين بها. إنشاء تلخيص جيد للمستند النصي يعتبر واحد من أهم الفروع في علم اللغويات. التلخيص الجيد للنص يعطي القارئ الأجزاء المهمة مما يوفر عليه الوقت والجهد المبذول في عملية القراءة. هناك بعض التقنيات المستخدمة في عملية تلخيص النصوص العربية ولكنها قليلة العدد وتحتاج لبعض التحسينات. أحد الطرق المستخدمة هي الطريقة المبنية على القاعدة الرسومية، ولكنها ما زالت بحاجة لبعض التحسينات. في هذه الأطروحة تم بناء خوارزمية جديدة مبنية على أساس رسومي بياني حيث يتم تمثيل كل جملة في النص بعد معالجتها بنقطة ثم توصيل النقاط مع بعضها وحساب وزن العلاقات بين جميع النقاط الموجودة في الرسم. معالجة النصوص تتم بناءا على قواعد معالجة اللغات الطبيعية ومن ثم يتم ترتيب الجمل طبقا لخوارزمية ترتيب الصفحات التابعة لشركة جوجل. الوحدات الأساسية المستخدمة في المعالجة في هذه الرسالة هي ثلاث وحدات: وحدة التجذير الكلي، التجذير الخفيف، وعدم استخدام التجذير. بعد المعالجة تم اختيار 40% من جمل النص الأساسي كجمل في الملخص. عملية التلخيص تتم هنا عبر 12 خطوة تبدأ بعملية جمع البيانات؛ المعالجة القبلية؛ تقسيم النص لوحدات أساسية؛ التجذير، إزالة الكلمات الشائعة، بناء النص على شكل رسم، حساب قيمة العلاقات بين الجمل، تطبيق خوارزمية الترتيب وأخيرا عملية استخلاص وأنشاء الملخص. تم فحص النظام باستخدام مجموعة من البيانات المجمعة تسمى (EASC) ومن ثم تم استخدام معايير التقييم التالية (Recall, Precision, F-measure) في عملية تقييم النظام. النتائج أظهرت أن استخدام الوحدة الناتجة عن التجذير الكلي أعطت نتائج أفضل من باقي الوحدات تلتها الوحدة الناتجة عن استخدام التجذير وفي النهاية الوحدة المبنية على استخدام التجذير الخفيف. |
---|