المستخلص: |
نظرا لقلة الأبحاث المستخدمة في التعرف على اللغة العربية المكتوبة بخط اليد في وضع عدم الاتصال مقارنة باللغات الأخرى، أصبح الاتجاه نحو التعرف على الكتابة اليدوية باللغة العربية مجالا مهما، حيث تعامل الباحثون مع النص المكتوب بطريقتين، بتقسيم الكلمات إلى أحرف/ رموز وهي النهج التحليلي، من ناحية أخرى، التعرف على الكلمة ككل دون تجزئة تسمى النهج الشامل. يركز هذا البحث على منهج كلي. تم اقتراح وتطوير نظام التعرف على الكلمات المكتوب بخط اليد باللغة العربية على أساس النمط الثنائي المحلي (LBP) في مرحلة استخراج الميزات والشبكات العصبية الاصطناعية كمصنف لمرحلة التصنيف. يتكون اقتراحنا من ثلاث مراحل رئيسية، هي المعالجة المسبقة واستخراج المعالم والتصنيف. يتم تطبيق المعالجة المسبقة على البيانات مثل إزالة الضجيج وإزالة علامات التشكيل والهيكل العظمي وعملية تطبيع صورة الكلمة، وبعد ذلك باستخدام طريقة LBP لأغراض تحليل الملمس وكاستخراج ميزة إحصائية عالمية، ثم تدريب مجموعات البيانات واختبارها على مصنف ANN للتصنيف الشامل. تم اختبار النظام المقترح على الإصدار 2.0 من قاعدة بيانات IFN/ ENIT باستخدام أحجام مختلفة لتطبيع الكلمات. كان الحجم (160*160) هو أفضل أداء في دقة التصنيف، وبالتالي كانت نتائج دقة التصنيف التي حققتها هي 99.33% و93.00% للمجموعات d وe من قاعدة بيانات IFN/ ENIT على التوالي. تم تحقيق نتائج دقة التصنيف التي كانت أفضل من أنظمة القياس التي قمنا بمقارنتها. أخيرا، كانت النتائج واعدة مقارنة بالأنظمة العربية الأخرى للتعرف على الكلمات المكتوبة بخط اليد والمذكورة في الأدب.
|