ارسل ملاحظاتك

ارسل ملاحظاتك لنا







تصميم خوارزمية للتعرف على الكتابة العربية المتصلة باستخدام الشبكات العصبية الاصطناعية

المؤلف الرئيسي: بابكر، عبدالحفيظ حامد محمد (مؤلف)
مؤلفين آخرين: أحمد، عوض حاج علي (مشرف)
التاريخ الميلادي: 2020
موقع: الخرطوم
الصفحات: 1 - 290
رقم MD: 1136985
نوع المحتوى: رسائل جامعية
اللغة: العربية
الدرجة العلمية: رسالة دكتوراه
الجامعة: جامعة النيلين
الكلية: كلية الدراسات العليا
الدولة: السودان
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

136

حفظ في:
المستخلص: عند عمل مسح ضوئي لأي مستند نصي سواء مكتوب باليد أو مطبوع، فإن الحاسب يتعرف على هذا النص كصورة ولا يمكن للمستخدم معالجة هذا النص المخزن في الصورة أو البحث فيه أو تحريره فمن هذا المنطلق ظهرت الحاجة لحل هذه المشكلة وإيجاد برامج تقوم بتحويل المستند الصوري إلى مستند قابل للتعديل والبحث وهو ما أدى إلى ظهور تقنية التعرف الضوئي على الحروف. وهذا المجال له تاريخ بعيد نسبيا حيث نجد أنه بدأت خدمة البريد الأمريكي في استعمال ماكينات القارئ الآلي في عام 1965م لفرز الرسائل البريدية، وله عدة تطبيقات أخرى مثل التعرف على الأرقام المكتوبة على الشيكات يدويا، وكذلك التعرف على العناوين البريدية، كقاعدة بيانات تحوي أسماء مدن وأرقام وكلمات تظهر في العناوين. ولكن بالرغم من أهمية هذا المجال لم يجد الاهتمام الكافي من الباحثين في مجال اللغة العربية مقارنة باللغات الأخرى كالإنجليزية والصينية وغيرها. لذلك هدف هذا البحث إلى تكوين قاعدة بيانات جديدة تحوي كلمات عربية مختلفة شائعة لمساعدة الباحثين في المجال ومن ثم تطبيق خوارزمية الشبكات العصبية ذات الانتشار الأمامي للتعرف على الكلمات العربية المتصلة. وبحمد الله تم تصميم النظام بنجاح حيث يتم أولا تدريب الشبكة العصبية وذلك بإدخال الصورة المراد تدريب الشبكة عليها ويجب أن يكون النص في الصورة مكتوب أربع مرات لتدخل إلى مرحلة المعالجة الأولية حيث يتم تحويل الصورة الملونة إلى صورة ذات التدرج الرمادي والتي تتكون من مصفوفة ذات بعدين ومن ثم يتم تنقية الصورة وإزالة الشوائب السوداء المحيطة بالصورة ثم بعد ذلك تأتي مرحلة تدريب الشبكة العصبية الاصطناعية وذلك بتحديد القيم الابتدائية للأوزان لتصبح الشبكة جاهزة للتدريب، وخلال التدريب تتغير هذه الأوزان بشكل تكراري لغاية الوصول إلى القيمة الصغرى لتابع الكلفة أو ما يسمى تابع الأداء. وبعد عملية التدريب تأتي مرحلة التعرف وهي المرحلة النهائية والتي من خلالها يتم إدخال صورة بها كلمات مختلفة لتقوم الشبكة بتصنيفها والتعرف عليها وإخراجها في شكل ملف قابل للتعديل وقد تم عمل برنامج للخوارزمية باستخدام برنامج MATLAB R2015a كأداة للبحث وتمكن من التعرف على عدد من الصور التي تحوي كلمات عربية بدقة بلغت 82% وهي نسبة مقبولة مقارنة ببعض النتائج التي توصل إليها باحثون أخرون على سبيل المثال بلغت نسبة التعرف ل 76% Ashish وبالنسبة ل Manal فقد بلغت نسبة التعرف 81%.