Extraction des formes derivees des mots arabes par des automates deterministes

Jait, Jamal; Abou Taj Aldine, Driss; AI Qadi, Abd Alrahim

Extraction des formes derivees des mots arabes par des automates deterministes

المصدر:	وقائع الندوة الثالثة الدولية حول المعالجة الآلية للغة العربية CITALA'09
الناشر:	معهد الدراسات والأبحاث للتعريب
المؤلف الرئيسي:	Jait, Jamal (مؤلف)
مؤلفين آخرين:	Abou Taj Aldine, Driss (م. مشارك) , AI Qadi, Abd Alrahim (م. مشارك)
محكمة:	نعم
الدولة:	المغرب
التاريخ الميلادي:	2009
مكان انعقاد المؤتمر:	الرباط
رقم المؤتمر:	3
الهيئة المسؤولة:	المدرسة المحمدية للمهندسين . معهد الدراسات والأبحاث للتعريب
الشهر:	مايو
الصفحات:	103 - 110
رقم MD:	587094
نوع المحتوى:	بحوث المؤتمرات
اللغة:	الفرنسية
قواعد المعلومات:	AraBase
مواضيع:	المؤتمرات و الندوات \| مستخلصات الأبحاث \| اللغة العربية \| تكنولوجيا المعلومات \| المغرب
رابط المحتوى:	PDF (صورة) PDF (نص) HTML

عدد مرات التحميل

3

المستخلص:

Being very complex and very fluctuate, the Arabic language requires a robust tool stemming, for better performance in terms of indexing and information retrieval. Most studies of indexing and searching using, for recognizing the roots of words, a transcript and add a truncation longer suffixes and prefixes. This leads to pseudo-roots, in most cases do not match their backgrounds and words can not be found. . In this work we present the morphological analyzer that we developed based on deterministic automata finite State recognition of the Arabic language. This system can extract derived forms of Arabic words and to recognize the words correctly written, and their labels.

Etant très complexe et très fluctuée, la langue arabe nécessite un outil de Raeinisation robuste, pour une meilleure performance en terme d’indexation et de recherche d’information. La plupart des études d’indexation et de recherche utilisent, pour la reconnaissance des racines des mots, une transcription plus une troncature de plus longs suffixes et préfixes. Ceci, conduit aux pseudo-racines, dans la majorité des cas, ne correspondent pas à leurs mots d’origines et ne permettent pas de les retrouvés, l’analyseur morphologique que nous avons élaboré, basé sur des automates déterministes à états finis reconnaissant la langue arabe. Ce système permet d’extraire des formes dérivées des mots arabes, et de reconnaître les mots correctement écrits, ainsi que leurs étiquettes.

عناصر مشابهة

La Racinisation de la Langue Arabe Par les Automates A Etats Finis AEF
بواسطة: Yacine, Alyounoussi منشور: (2007)
Reconnaissance des expressions elliptiques arabes avee NOOJ
بواسطة: Hasni, Elyes منشور: (2009)
Une application de recherche par racines sur le Web développée sur la plate forme PHARAS
بواسطة: Loukam, Mourad منشور: (2009)
Le Conseil Economique et Social : Le Mot le Contexte et la Chose
بواسطة: Hattabi, Jamal منشور: (2009)
The Effect of Full and Partial Diacritization on Arabic Root Extraction
بواسطة: T, Rachid منشور: (2007)

Extraction des formes derivees des mots arabes par des automates deterministes

عدد مرات التحميل

3

عناصر مشابهة

دليل المستخدم

دليل الفيديو