ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Vers un Système D'extraction D'informations Pour Les Textes de la Presse Arabophone en Ligne ArIExtract

المصدر: وقائع الندوة الثالثة الدولية حول المعالجة الآلية للغة العربية CITALA'09
الناشر: معهد الدراسات والأبحاث للتعريب
المؤلف الرئيسي: Abd Almadjid, Achit (Author)
مؤلفين آخرين: Azzoune, Hamid (Co-Author)
محكمة: نعم
الدولة: المغرب
التاريخ الميلادي: 2009
مكان انعقاد المؤتمر: الرباط
الهيئة المسؤولة: معهد الدراسات والأبحاث للتعريب
الشهر: مايو
الصفحات: 13 - 22
رقم MD: 589825
نوع المحتوى: بحوث المؤتمرات
قواعد المعلومات: AraBase
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

2

حفظ في:
المستخلص: De nos jours, l’extraction d’informations suscite un intérêt grandissant auprès de la communauté des chercheurs activant dans le domaine de l’ingénierie des langues. En effet, elle est d’un intérêt capital pour de nombreux domaines connexes relevant du TALN. Cet article vise à donner un aperçu sur un travail qui est en cours de réalisation et qui concerne le développement d’un système d’extraction d’informations pour les textes de la presse arabophone en ligne. Généralement, toute solution d’extraction d’informations englobe les tâches suivantes: reconnaissance des entités nommées, reconnaissance des relations entre ces entités avec la résolution des co-références dans certains cas. Pour l’élaboration de notre système, nous nous sommes intéresser, dans une première étape, à l’identification des entités nommées arabes: noms propres (personnes, organisations, lieux), expressions temporelles et expressions de mesure, en s’inspirant de la catégorisation des entités nommées, issue des conférences MUC. Et ce, avec une certaine adaptation pour le cas de la langue arabe. La seconde étape, a concerné l’extraction des relations entretenues entre les actants/acteurs. Pour notre cas, nous nous intéressons aux relations liées à la notion de «Rencontre»,