المصدر: | مجلة التواصل اللساني |
---|---|
الناشر: | مؤسسة العرفان للإستشارات التربوية والتطوير المهني |
المؤلف الرئيسي: | Lee, Mark (Author) |
مؤلفين آخرين: | Al Meman, Khalid (Advisor) |
المجلد/العدد: | مج16, ملحق |
محكمة: | نعم |
الدولة: |
المغرب |
التاريخ الميلادي: |
2014
|
الصفحات: | 95 - 108 |
ISSN: |
0851-6774 |
رقم MD: | 597022 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | الإنجليزية |
قواعد المعلومات: | AraBase |
مواضيع: | |
رابط المحتوى: |
المستخلص: |
In this paper we address the problem of the analysis of multi-dialect Arabic morphology. Our method involves the synthesis of two methods. The first method is linguistic, using an adopted Modern Standard Arabic (MSA) Morphology Analyser to first deal with dialect prefixes and suffixes and then analyse remaining word fragment. This method improves accuracy of dialect words by 69%. The second method involves segmenting the word and using ‘the web as corpus' to estimate the frequency of different segment combinations which then are used to guess the correct base form. The overall synthesis is shown to have 94% accuracy on a corpus of Arabic dialects. |
---|---|
ISSN: |
0851-6774 |