LEADER |
01505nam a22002177a 4500 |
001 |
0013325 |
041 |
|
|
|a ara
|
044 |
|
|
|b المغرب
|
100 |
|
|
|9 38044
|a Laskri, Mohamed Tayeb
|e Author
|
245 |
|
|
|a Constitution D'un Corpus de la Langue Arabe A Partir du Web
|
260 |
|
|
|b معهد الدراسات والأبحاث للتعريب
|c 2007
|g يونيو
|
300 |
|
|
|a 105 - 112
|
336 |
|
|
|a بحوث المؤتمرات
|b Article
|
520 |
|
|
|b The internet is a natural source of linguistic data providing an abundance of texts of various types in a large number of languages. Language scientists and technologists are increasingly turning to it to take benefit of this impressive mass of data. This paper describe a tool that build Arabic corpora using automated search engine queries, retrieving and post-processing the pages found in this way. The constructed corpus represents Arabic in general and will be used to compute statistical language models.
|
653 |
|
|
|a المؤتمرات والندوات
|a مستخلصات الأبحاث
|a اللغة العربية
|a تكنولوجيا المعلومات
|a الإنترنت
|
700 |
|
|
|9 40082
|a Meftouh, K.
|e co-auth
|
773 |
|
|
|c 015
|d الرباط
|i منشورات معهد الدراسات والأبحاث للتعريب جامعة محمد الخامس
|l 000
|o 6904
|s الندوة الدولية : المعالجة الآلية للغة العربية CITALA'07
|v 000
|
856 |
|
|
|u 6904-000-000-015.pdf
|
930 |
|
|
|d y
|p y
|
995 |
|
|
|a AraBase
|
999 |
|
|
|c 600868
|d 600868
|