المصدر: | مجلة جامعة الملك سعود - علوم الحاسب والمعلومات |
---|---|
الناشر: | جامعة الملك سعود |
المؤلف الرئيسي: | Boukharouba, Abdelhak (Author) |
المجلد/العدد: | مج29, ع1 |
محكمة: | نعم |
الدولة: |
السعودية |
التاريخ الميلادي: |
2017
|
الصفحات: | 29 - 38 |
DOI: |
10.33948/0584-029-001-002 |
ISSN: |
1319-1578 |
رقم MD: | 974031 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | الإنجليزية |
قواعد المعلومات: | science |
مواضيع: | |
كلمات المؤلف المفتاحية: |
Document Lower Edge Extraction | Labeling Algorithm | Randomized Hough Transform | Skew Correction | Baseline Detection
|
رابط المحتوى: |
المستخلص: |
The proposed technique is based on the detection of the lower baselines of the text lines of Arabic documents. As the lower baseline pixels belong to the lower edge of the word images, we first locate vertically the black white transitions at the black pixels where the resulting image would emphasize the baselines of the text. Once the skew angle is determined using a randomized Hough transform, the baselines are extracted using y intercept histogram. This algorithm can also contribute significantly for text line extraction from skewed document images for many languages. |
---|---|
ISSN: |
1319-1578 |