ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Towards Measure for Arabic Corpora Quality

المصدر: الندوة الدولية: المعالجة الآلية للغة العربية CITALA'07
الناشر: معهد الدراسات والأبحاث للتعريب
المؤلف الرئيسي: Benajibe, Yassine (Author)
محكمة: نعم
الدولة: المغرب
التاريخ الميلادي: 2007
مكان انعقاد المؤتمر: الرباط
الهيئة المسؤولة: منشورات معهد الدراسات والأبحاث للتعريب جامعة محمد الخامس
الشهر: يونيو
الصفحات: 213 - 221
رقم MD: 600096
نوع المحتوى: بحوث المؤتمرات
اللغة: الإنجليزية
قواعد المعلومات: AraBase
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

6

حفظ في:
المستخلص: In this paper we present a statistical measure which for the first time is used to evaluate the quality of Arabic corpora. This measure is entirely based on statistical data and language-independent. However, the values which might be obtained in the experiments could be very different for corpora written in different languages. Our experiments were conducted using Arabic corpora. We have chosen four corpora of different types in order to determine the corpus charcteristics reflected by our quality measure. The preliminary results show that the measure is significantly correlated with the writing style and the nature of the text.

عناصر مشابهة