ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Classification and Retrieving Printed Arabic Document Images Based on Bagged Decision Tree Classifier

العنوان بلغة أخرى: تصنيف واسترجاع الوثائق العربية المطبوعة بالاعتماد على المصنف شجرة القرار Bagged
المصدر: مجلة المنصور
الناشر: كلية المنصور الجامعة
المؤلف الرئيسي: عبدالمنعم، مثيل عماد الدين (مؤلف)
مؤلفين آخرين: عباس، هيثم كريم (م. مشارك)
المجلد/العدد: ع32
محكمة: نعم
الدولة: العراق
التاريخ الميلادي: 2019
الصفحات: 14 - 33
DOI: 10.36541/0231-000-032-004
ISSN: 1819-6489
رقم MD: 1084191
نوع المحتوى: بحوث ومقالات
اللغة: الإنجليزية
قواعد المعلومات: EcoLink, HumanIndex
مواضيع:
كلمات المؤلف المفتاحية:
رأس الكلمات | ميزات الاستخراج | التعبئة | شجرة القرار المعبأة | DIR | Header-Words | Features Extraction | Bagging | Bagged Decision Tree
رابط المحتوى:
صورة الغلاف QR قانون
حفظ في:
المستخلص: إن استرجاع صورة الوثائق العربية المطبوعة هو نظام مهم جدا ومطلوب للعديد من التطبيقات بما في ذلك الأرشفة الإلكترونية ومحركات البحث وأنظمة إدارة الوثائق. في هذه البحث تم اقتراح نظام متكيف لتصنيف واسترجاع الوثائق العربية المطبوعة استنادا إلى الكلمات الرأسية بالاعتماد على طريقة شجرة القرار (Decision Tree) التي تم تحسينها بواسطة تقنية Bagging. يقوم النظام المقترح بتطبيق تقنيات المعالجة المسبقة والتجزئة الفعالة لإعداد الوثيقة وكشف الكلمات الرأسية من وثيقة الاستعلام وبالإضافة إلى ذلك، تم استخراج مجموعة من الميزات التمييزية من الكلمات الرأس المستخرجة لتصنيفها بشكل صحيح إلى الصنف الصحيح. في النظام المقترح، تم تكييف تقنية Bagging مع المصنف شجرة القرار لتعزيز أداء التصنيف وبالتالي تحسين دقة استرجاع الوثائق. اثبتت التجارب أن النظام المقترح حقق نتائج مقنعة جدا في الدقة وكانت 97.35%.

Printed Arabic document image retrieval is a very important and needed system for many applications including electronic archiving, search engines, and document management systems. In this paper, an adaptive header- words based printed Arabic document images classification and retrieval system has been proposed that based on decision tree classifier improved by bagging technique. The proposed system implements effective preprocessing and segmentation techniques to prepare the document and correctly detect a specific Arabic header words form query document. Besides that, a collection of discriminative features has been extracted from detected header words to correctly classify them to a right class. In the proposed system, bagging technique has been adapted with decision tree classifier to enhance the performance of classification and hence improve the precision of retrieving documents. The experimental tests confirmed that the proposed system achieved very satisfied results of 97.35% for precision.

ISSN: 1819-6489

عناصر مشابهة