ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Arabic Text Correction Using Dynamic Categorized Dietionaries: A Statistical Approach

العنوان بلغة أخرى: تدقيق النصوص العربية باستخدام القواميس التفاعلية المصنفة: مقاربة إحصائية
المصدر: مجلة التواصل اللساني
الناشر: مؤسسة العرفان للإستشارات التربوية والتطوير المهني
المؤلف الرئيسي: Yahya, Adnan H. (Author)
مؤلفين آخرين: Salhi, Ali Y. (Advisor)
المجلد/العدد: مج16, ملحق
محكمة: نعم
الدولة: المغرب
التاريخ الميلادي: 2014
الصفحات: 37 - 56
ISSN: 0851-6774
رقم MD: 597116
نوع المحتوى: بحوث ومقالات
اللغة: الإنجليزية
قواعد المعلومات: AraBase
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

20

حفظ في:
LEADER 02117nam a22002297a 4500
001 0231827
041 |a eng 
044 |b المغرب 
100 |9 51509  |a Yahya, Adnan H.  |e Author 
245 |a Arabic Text Correction Using Dynamic Categorized Dietionaries:  |b  A Statistical Approach 
246 |a تدقيق النصوص العربية باستخدام القواميس التفاعلية المصنفة:  |b مقاربة إحصائية  
260 |b مؤسسة العرفان للإستشارات التربوية والتطوير المهني  |c 2014 
300 |a 37 - 56 
336 |a بحوث ومقالات  |b Article 
520 |b This paper describes a technique for spelling and correcting Arabic text that provides different variables that can be controlled to give customized results based on the properties of the processed text. The proposed technique depends on dynamic dictionaries controlled and customized based on the input text categorization. In the research reported here we employ a statistical/corpus-based approach with data obtained from the Arabic Wikipedia and local Palestinian newspapers. Based on corpus statistics we constructed databases of words and their frequencies as single, double and triple expressions and used that as the infrastructure for our spelling and text correction technique. Our spelling technique builds on earlier work[7], but using new spelling variables and dynamic dictionaries based on categorized texts. We briefly report on the results of preliminary testing and analysis. While the results reported here are promising, they must be viewed as work in progress, still in need of more testing, refining, integration and deployment in real life settings. 
653 |a اللغة العربية  |a النصوص المكتوبة  |a التدقيق اللغوي 
700 |9 360336  |a Salhi, Ali Y.  |e Advisor 
773 |4 علم اللغة  |6 Linguistics  |c 006  |l 990  |m مج16, ملحق  |o 1361  |s مجلة التواصل اللساني  |t Journal of linguistic communication  |v 016  |x 0851-6774 
856 |u 1361-016-990-006.pdf 
930 |d y  |p y  |q y 
995 |a AraBase 
999 |c 597116  |d 597116 

عناصر مشابهة