المستخلص: |
تعد دراسة الكبس بأنواعه كافة موضوعا مهما في جميع المجالات، إذ أن تقليل المساحة الخزنية في الذاكرة المستخدمة لخزن البيانات فضلا عن الوقت الذي تتطلبه تلك البيانات في النقل دفع العديد من الباحثين إلى عمل خوارزميات لكبس البيانات ومن ثم إعادة فك كبسها. ونظرا لذلك فقد تمت في هذا البحث دراسة صور الوثائق النصية العربية ومحتوياتها لغرض إمكانية كبسها من خلال اقتراح خوارزمية خاصة بصور الوثائق النصية العربية اعتمدا على استخلاص المعاملات الخاصة بصفات الوثيقة. وقد تضمنت أفكار الخوارزمية المقترحة العمل على استئصال الأسطر ثم استئصال الأعمدة غير المستخدمة من الوثيقة النصية لغرض اختزال حجم الوثيقة النصية إلى اقل ما يمكن وذلك لاختزال فترة تنفيذ عملية الكبس وتسهيلها، ومن خلال تطبيق مفاهيم خوارزميات التقسيم الشجري الرباعي على محتويات الوثيقة المختزلة ليتم الحصول على وصف كامل لنسيجها ومن ثم إنشاء ملف جديد يحوي على المعلومات الخاصة بوصف الصورة النصية. وجدت انه عند تطبيق تلك الخوارزمية على ملفات نصية بهيئات مختلفة كانت نتائج الكبس مشجعة لغرض اعتمادها من قبل برامجيات الكبس، فقد تم الحصول على نسبة كبس جيدة، فضلا عن ذلك تم الحصول على وضوحية جيدة وعالية عند فتح كبس صور تلك الوثائق النصية. علما أن نسبة الكبس تراوحت من 1: 5.
The study of compression types is regarded as an important subject in all fields. Minimizing the storage area in the memory used in storing data and the time required by the data on transferring have urged many researchers to prepare algorithms to compress data and then to repeat untying compression. In the current research, the pictures of Arabic textual documents together with their contents have been studied in an attempt to compress them through the suggestion of an algorithm specific to the pictures of Arabic textual documents based on the deduction of coefficients of the features of the document. The ideas of the algorithm suggested subsume working to uproot the lines and then the columns of the textual document so as to minimize the size of the textual document to its minimum degree by minimizing the period of executing and by facilitating the process of compression. All that is done by applying the concepts of the algorithms of the four-fold tree division to the contents of the minimized document so as to get a full description of the texture of that minimized document, then building up a new file that contains the data limited to the description of the textual picture. We have also found that, on applying that algorithm to the textual files in different shapes, the outcomes have been very encouraging so as to be adopted by compression programes. We have also obtained a good compression ratio and also a better and higher vividness on opening the compression of those textual documents. The compression ratio ranged between 1:5.
|