المستخلص: |
كانت الكتابة اليدوية ولا تزال الطريقة المفضلة للغالبية العظمى من الناس للتعبير عن أفكارهم وآرائهم ولتبادل المعلومات. إن أتمتة التمييز لمثل هذا النوع من الكتابة المكتوبة بخط اليد ليست مهمة سهلة، خصوصا إذا كانت هذه الكتابة باللغة العربية، فإنها تزداد صعوبة؛ ويذكر أن الكثير من الباحثين قد بذلوا جهودا فعالة في هذا المجال. إن تمييز الكتابة اليدوية المخطوطة هو وسيلة لتحويل كميات كبيرة من المستندات الممسوحة ضوئيا إلى صيغ قابلة للقراءة أو للبحث لمساعدة الباحثين، والمؤرخين وأمناء المكتبات لاستخراج واسترجاع المعلومات التي تساعدهم في عمليات التحرير، والفهرسة، والأرشفة. هدفت هذه الدراسة إلى تصميم وتنفيذ نظام قادر على أتمتة وتمييز النصوص العربية المكتوبة بخط اليد بنسبة تمييز جيدة؛ حيث اعتمدت هذه الدراسة على النظام المقترح من قبل (العبودي ولي) كنقطة انطلاق وقاعدة عمل. يتكون النظام المقترح من سبع مراحل: أولا، تحويل صورة النص إلى صورة ثنائية. ثانيا، ينفذ النظام مرحلة التقسيم والتجزئة، والتي تعتبر من أصعب مراحل عملية التمييز للكتابة العربية اليدوية، بحيث أن الصورة تمر بعدة خطوات ليتم تحضيرها لتكون مدخلات لعملية استخراج المزايا، حيث يتم تجزئتها أفقيا، فتقسم إلى عدة أسطر، ومن ثم يتم تقسيم كل سطر إلى العديد من الكلمات اعتمادا على قيمة معينة (قيمة العتبة)، والتي تم تحديدها باستخدام أساليب إحصائية. أما في الخطوة الثالثة، فقد تم تطبيق خوارزمية (العبودي ولي)، حيث وللحفاظ على خصائص الكتابة الأساسية، فإنه يتم تقليل عرض جميع الحروف إلى بكسل واحد. وفي الخطوة الرابعة، تم توحيد أشكال الحروف وأساليب كتابتها وذلك بتطبيق التمثيل الأفقي والعمودي للكتابة العربية المخطوطة. وفي الخطوة الخامسة، يتم فصل كل كلمة إلى حروفها عند نقاط الاتصال. وفي الخطوة السادسة، تم استخدام العديد من المزايا لتمييز الحروف التي تشكل الكلمة الواحدة. وأخيرا تم استخدام شجرة القرار باعتبارها مصنف جيد لتنفيذ مهمة التمييز. تم اختبار النظام على قاعدة بيانات (IFN/ ENIT) بالإضافة إلى استخدام (MATLAB) كبيئة تطوير لكتابة وتنفيذ الخوارزميات. وقد أظهرت النتائج أن النظام المقترح باستخدام شجرة القرار أعطى نسبة تمييز مقدارها 85%، والتي تعتبر جيدة، وتشكل تطويرا واضحا مقارنة بالأنظمة التي استخدمت مصنف شجرة القرار في عملية التصنيف.
|