المؤلف الرئيسي: | بابكر، عبدالحفيظ حامد محمد (مؤلف) |
---|---|
مؤلفين آخرين: | أحمد، عوض حاج علي (مشرف) |
التاريخ الميلادي: |
2020
|
موقع: | الخرطوم |
الصفحات: | 1 - 290 |
رقم MD: | 1136985 |
نوع المحتوى: | رسائل جامعية |
اللغة: | العربية |
الدرجة العلمية: | رسالة دكتوراه |
الجامعة: | جامعة النيلين |
الكلية: | كلية الدراسات العليا |
الدولة: | السودان |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
عند عمل مسح ضوئي لأي مستند نصي سواء مكتوب باليد أو مطبوع، فإن الحاسب يتعرف على هذا النص كصورة ولا يمكن للمستخدم معالجة هذا النص المخزن في الصورة أو البحث فيه أو تحريره فمن هذا المنطلق ظهرت الحاجة لحل هذه المشكلة وإيجاد برامج تقوم بتحويل المستند الصوري إلى مستند قابل للتعديل والبحث وهو ما أدى إلى ظهور تقنية التعرف الضوئي على الحروف. وهذا المجال له تاريخ بعيد نسبيا حيث نجد أنه بدأت خدمة البريد الأمريكي في استعمال ماكينات القارئ الآلي في عام 1965م لفرز الرسائل البريدية، وله عدة تطبيقات أخرى مثل التعرف على الأرقام المكتوبة على الشيكات يدويا، وكذلك التعرف على العناوين البريدية، كقاعدة بيانات تحوي أسماء مدن وأرقام وكلمات تظهر في العناوين. ولكن بالرغم من أهمية هذا المجال لم يجد الاهتمام الكافي من الباحثين في مجال اللغة العربية مقارنة باللغات الأخرى كالإنجليزية والصينية وغيرها. لذلك هدف هذا البحث إلى تكوين قاعدة بيانات جديدة تحوي كلمات عربية مختلفة شائعة لمساعدة الباحثين في المجال ومن ثم تطبيق خوارزمية الشبكات العصبية ذات الانتشار الأمامي للتعرف على الكلمات العربية المتصلة. وبحمد الله تم تصميم النظام بنجاح حيث يتم أولا تدريب الشبكة العصبية وذلك بإدخال الصورة المراد تدريب الشبكة عليها ويجب أن يكون النص في الصورة مكتوب أربع مرات لتدخل إلى مرحلة المعالجة الأولية حيث يتم تحويل الصورة الملونة إلى صورة ذات التدرج الرمادي والتي تتكون من مصفوفة ذات بعدين ومن ثم يتم تنقية الصورة وإزالة الشوائب السوداء المحيطة بالصورة ثم بعد ذلك تأتي مرحلة تدريب الشبكة العصبية الاصطناعية وذلك بتحديد القيم الابتدائية للأوزان لتصبح الشبكة جاهزة للتدريب، وخلال التدريب تتغير هذه الأوزان بشكل تكراري لغاية الوصول إلى القيمة الصغرى لتابع الكلفة أو ما يسمى تابع الأداء. وبعد عملية التدريب تأتي مرحلة التعرف وهي المرحلة النهائية والتي من خلالها يتم إدخال صورة بها كلمات مختلفة لتقوم الشبكة بتصنيفها والتعرف عليها وإخراجها في شكل ملف قابل للتعديل وقد تم عمل برنامج للخوارزمية باستخدام برنامج MATLAB R2015a كأداة للبحث وتمكن من التعرف على عدد من الصور التي تحوي كلمات عربية بدقة بلغت 82% وهي نسبة مقبولة مقارنة ببعض النتائج التي توصل إليها باحثون أخرون على سبيل المثال بلغت نسبة التعرف ل 76% Ashish وبالنسبة ل Manal فقد بلغت نسبة التعرف 81%. |
---|