العنوان بلغة أخرى: |
ANovel Algorithm for Slant Detection and Correction of the Arabic HandwrittenText Based on Horizontal Segmentation |
---|---|
المؤلف الرئيسي: | المصري، أحمد مصطفى علي (مؤلف) |
مؤلفين آخرين: | Alshatnawi, Atallah (Advisor) , El Bashir, Mohammad (Advisor) |
التاريخ الميلادي: |
2017
|
موقع: | المفرق |
الصفحات: | 1 - 83 |
رقم MD: | 855616 |
نوع المحتوى: | رسائل جامعية |
اللغة: | الإنجليزية |
الدرجة العلمية: | رسالة ماجستير |
الجامعة: | جامعة آل البيت |
الكلية: | كلية الأمير الحسين بن عبد الله لتكنولوجيا المعلومات |
الدولة: | الاردن |
قواعد المعلومات: | Dissertations |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
التعرف إلى النصوص هو عملية محاكاة لعدد من الطرق الإحصائية والرياضية لتحقيق أداء مشابه لأداء الإنسان، وهو مهم في عدة تطبيقات مثل معالجة الوثائق، ورؤية الإنسان الآلي، وقراءة النصوص في الرسوم والصور. ولكن في حقل التعرف إلى النصوص فإن التعرف إلى حروف اللغة، الذي يطبق على النصوص المطبوعة والمكتوبة بخط اليد سواء بسواء، هو واحدة من أكثر المشاكل تعقيدا في علم الذكاء الاصطناعي. وبعيدا عن مآزق عملية التعرف إلى النصوص بشكل عام فإن التعرف إلى النص المكتوب باليد يعتبر عملية أكثر تحديا تعقدها قضايا مثل تنوع أنماط الكتابة، ما يؤدي إلى اختلافات في أشكال الحروف وإلى تداخل مصاحب. في الواقع إن التعرف البصري إلى الحروف العربية أكثر صعوبة من التعرف إلى حروف اللغات الأخرى، فمثلا كشف وتصحيح ميل الأحرف هو مشكلة شائعة وحرجة جدا في نظم التعرف إلى النصوص العربية المطبوعة والمكتوبة باليد. إن عدم تصحيح الأحرف والنصوص المائلة ينتج تشوهات في صورة النص، وستكون له آثار سلبية على العمليات اللاحقة كتمييز النصوص واستخلاص المعالم. لذا فإن خوارزمية قوية لكشف وتصحيح الميل مهمة جدا وحاجة ملحة من أجل تقليل احتمال التصنيف الخاطئ للحروف والنصوص. وبناء على ذلك كان الهدف الرئيس للدراسة الحالية هو تطوير طريقة مبتكرة لكشف وتصحيح الميل لإعادة إنشاء النص العربي المكتوب باليد استنادا إلى التقطيع الأفقي والخصائص البنائية (التركيبية) للحروف العربية. بمقتضى ذلك اتبعت الدراسة الحالية منهجية تتكون من ثلاث مراحل وخمس عمليات رئيسة. بعد إدخال النص المكتوب باليد إلى الحاسب الآلي تبدأ مرحلة المعالجة الأولى. تتكون هذه المرحلة من عمليات إزالة التشوه، والتنحيف، وتحديد الخط الأساسي. وتستحث هذه العمليات المرحلة الثانية التي تتكون من عملية التقطيع الأفقي للصورة. وبعد ذلك تبدأ المرحلة الثالثة التي تتضمن عملية كشف وتصحيح الميل. بتنفيذ ذلك تكون قد تمت إعادة بناء النص المدخل. هذه الطريقة المقترحة تم فحصها والتحقق من صحتها باستخدام منظومة بيانات (IFN/ENIT). وتمت مقارنة أداء هذه الطريقة بأداء طريقة خطوط فوروني البيانية (Voronoi Diagrams (VDs)) باستخدام نفس منظومة البيانات. في هذه المقارنة استخدم الباحث المقياسين الإحصائيين الوسط الحسابي والانحراف المعياري كمؤشرات على دقة تصحيح الميلان العمودي للنص. هذا وقد قيم الباحث مناسبة الطريقة المقترحة لتصحيح الميول في نصوص مطبوعة بخطوط مختلفة. نتائج هذه الدراسة تشير إلى أن الطريقة المقترحة لكشف وتصحيح الميل تستطيع إعادة بناء الحروف وتصنيف حركات القلم ضمن مجموعات بناء على خصائص الحروف العربية. وبينت المقارنات في هذه الدراسة أن الطريقة المقترحة تعطي نتائج أفضل من طريقة خطوط فوروني البيانية (VDs) من ناحية تقريب الصورة المدخلة إلى صورة النص المطبوع، حيث قربت الخوارزمية المقترحة الصورة الأصلية إلى المطبوعة بنسبة (0.098) بناء على الانحراف المعياري وبنسبة (0.049) بناء على المتوسط الحسابي، في حين قربت طريقة خطوط فوروني المدخلة إلى صورة النص المطبوع بنسبة (0.056) بناء على الانحراف المعياري و (0.045) بناء على المتوسط الحسابي. إضافة إلى ذلك تستطيع الطريقة المقترحة وبفعالية معالجة الميل في صور النصوص المطبوعة بعدة خطوط في الكلمة الواحدة وفي السطر الواحد. طريقة كشف وتصحيح الميل المقترحة من قبل الدراسة الحالية مهمة لتحسين تمييز الحروف -وبالتالي النصوص -العربية المكتوبة باليد، ويمكن أن تستخدم كنواة لبناء طريقة شاملة لاستخلاص المعالم ونظام متقدم للتمييز البصري للحروف العربية. |
---|