ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Extraction d’information à partir des sites Web en arabe basée sur une méthode à base des règles

العنوان المترجم: Extraction of Information from Arabic Websites according to a Rule-Based Method
المصدر: الجنان
الناشر: جامعة الجنان - مركز البحث العلمي
المؤلف الرئيسي: Al-Hajj, Moustafa (Author)
مؤلفين آخرين: Sabra, Amani (Co-Author)
المجلد/العدد: ع10
محكمة: نعم
الدولة: لبنان
التاريخ الميلادي: 2018
الصفحات: 371 - 394
DOI: 10.33986/0522-000-010-015
ISSN: 2308-0671
رقم MD: 891674
نوع المحتوى: بحوث ومقالات
اللغة: الفرنسية
قواعد المعلومات: IslamicInfo
مواضيع:
كلمات المؤلف المفتاحية:
Exploration Contextuelle | Fouille de données textuelles | Extraction d’information, XML
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

7

حفظ في:
المستخلص: This article describes a tool that uses language engineering to extract information from Arabic web sites. This information will be used by web archivists to create archival records for sites. The proposed archiving sheet aims to fill this form automatically. For the recognition and classification of textual segments, the contextual exploration method proposed by Descles is used, the markers and linguistic rules are defined based on a synthetic study of the specificities of the Arabic language. A group of more than 1300 Arabic-language websites has been compiled, the results obtained show an interest in the followed approach in building archives of websites in Arabic
This abstract translated by Dar AlMandumah Inc. 2018

Cet article décrit un outil qui se sert de l'ingénierie de la langue pour l'extraction d'information à partir des sites web en arabe, Ces informations serviront aux documentalistes du Web poue créer des fiches d'archivage pour les sites. Une fiche d'archivage est proposée, l'objectif étant de remplir cette fiche automatiquement. Pour la reconnaissance et la classification des segments textuels, la méthode d'exploration contextuelle proposée par Descles est utilisée, les marqueurs et règles linguistiques sont définis en se basant sur une étude synthétique des spécificités de la langue arabe. Un corpus de plus de 1300 sites Web en langue arabe a été construit, les résultats obtenus montrent l'intérêt de l'approche pour constituer des fiches d'archivage des sites Web en langue arabe

ISSN: 2308-0671

عناصر مشابهة