ارسل ملاحظاتك

ارسل ملاحظاتك لنا







برنامج التعرف الضوئي على الحروف العربية: دراسة تقييمية مقارنة لأغراض استرجاع المعلومات

العنوان بلغة أخرى: Optical Character Recognition Softare: A Comparative Evaluation Study For Information Retieval
المصدر: المجلة الدولية لعلوم المكتبات والمعلومات
الناشر: الجمعية المصرية للمكتبات والمعلومات والأرشيف
المؤلف الرئيسي: علي، عادل نبيل شحات (مؤلف)
المؤلف الرئيسي (الإنجليزية): Ali, Adel Nabil Shahat
المجلد/العدد: مج6, ع4
محكمة: نعم
الدولة: مصر
التاريخ الميلادي: 2019
الشهر: ديسمبر
الصفحات: 142 - 170
DOI: 10.21608/IJLIS.2019.74320
ISSN: 2356-8003
رقم MD: 1038996
نوع المحتوى: بحوث ومقالات
اللغة: العربية
قواعد المعلومات: HumanIndex
مواضيع:
كلمات المؤلف المفتاحية:
برنامج التعرف الضوئي على الحروف | رقمنة مصدر المعلومات | التعرف الضوئي على الحروف العربية | استرجاع المعلومات | Arabic Character Recognition (AOCR) | Digitization | OCR | Information Retieval
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

74

حفظ في:
المستخلص: كثرت في الأونة الأخيرة مشروعات رقمنة مصادر المعلومات العربية، ونشرها مثل: المستودع الرقمي للرسائل الجامعية المصرية، ومشروع رقمنة مصادر المعلومات بدار الكتب المصرية وغيرها من المشروعات العربية، ولكن تم رقمنة هذه المصادر في شكل صور، ولا يمكن البحث في النص الكامل واسترجاعه إلا من خلال الكلمات الكشفية التي تعد محدودة جدا، وبالتالي ظل النص العربي حبيس هذه الصور، ولا يمكن الاستفادة من نصوصه في علميات البحث والاسترجاع، وحجبت كثير من المعلومات التي يمكن الاستفادة منها. ومن هنا تحاول هذه الدراسة التعرف على برمجيات التعرف الضوئي على الحروف العربية، خصائصها، ومدى دقتها التي يمكن أن تحل هذه المشكلة. وتعد أهم مشكلات برمجيات التعرف الضوئي مع الحروف العربية هي: سمات وخصائص هذه الحروف المعقدة سواء في بنيتها، أو في طريقة كتابتها. واعتمدت الدارسة المنهج التقييمي بالاعتماد على أداة من أدوات جمع البيانات وهي: قائمة مراجعة. وتوصلت الدراسة إلى قلة برمجيات التعرف الضوئي على الحروف العربية التي انقسمت إلى تجارية، ومفتوحة المصدر، ومتاحة على الإنترنت، ونجد أن برنامجا واحدا فقط وصل نسبة دقته (100%) في التعرف على النصوص العربية وهو برنامج (Google Drive OCR)، وأن عدد (4) برامج وصلت نسبة دقتها (90%) في التعرف على النصوص العربية. وأوصت الدراسة مؤسسات المعلومات العربية بتطوير برمجيات التعرف على الحروف العربية بدقة عالية، وأن توفر هيئات البحث العلمي ومراكز البحوث ميزانيات لتطوير تقنيات التعرف الضوئي على الحروف العربية.

In recent times, There were many Arab digitization projects for their information resources, such as: digital repository of Egyptian university theses, and the digitization of information resources at Dar A-Kutub in Egypt and another Arabic projects. But these resources have been digitized in the images formats and we cannot search in the full text and retrieved only though keywords that are very limited so, the Arabic text remained locked in these images, and cannot take advantage of its texts in the search and retrieval and Blocking a lot of information that can be used This study aims to identify Arabic OCR software, its characteristics and its accuracy that can solve this problem. The most important problems of OCR software with Arabic characters are characteristics of these complex characters, both in structure and in the way of writing. The study depended on the evaluation methodology using a data collection tool: a checklist The study found that there is a rar of Arabic OCR software which is divided into commercial, open source and free on the Internet. and the study show that only one program reached the accuracy rate ( 100% ) in the recognition of Arabic texts, ((Google Drive OCR)J and the number of (4) programs reached a rate of accuracy (90%) in the recognition of Arabic texts The study recommended that Arab information institutions should develop software to recognize Arabic characters with high accuracy, and that scientific research bodies and research centers provide budgets for the development of OCR techniques and scientific research provide budgets for the development of Arabic OCR techniques

ISSN: 2356-8003

عناصر مشابهة