المصدر: | مجلة التواصل اللساني |
---|---|
الناشر: | مؤسسة العرفان للإستشارات التربوية والتطوير المهني |
المؤلف الرئيسي: | Daoud, Amjad Mustafa (Author) |
المجلد/العدد: | مج15, ع1,2 |
محكمة: | نعم |
الدولة: |
المغرب |
التاريخ الميلادي: |
2013
|
الصفحات: | 113 - 121 |
ISSN: |
0851-6774 |
رقم MD: | 596896 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | العربية |
قواعد المعلومات: | AraBase |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
We present a compression algorithm based on the affix morphological analysis that takes advantage of the statistical studies of the diacritical Arabic morphological features. The most frequently occurring diacritical bigrams (biliterals) and trigrams (triliterals) are coded with unused code-words in ASCII, ASMO- 449, and Unicode standard codes. Using combined methods of root and affix dictionaries and the proposed coding scheme, compression ratios of proper Arabic text compare favorably with other unigram non-diacritical methods |
---|---|
ISSN: |
0851-6774 |