ارسل ملاحظاتك

ارسل ملاحظاتك لنا







I-Arabic: Computational Attempts and Corpus Issues in Modern Arabic

العنوان بلغة أخرى: العربية في عصر التكنولوجيا: مقاربات حاسوبية وإشكاليات المتون في اللغة العربية الحديثة
المصدر: مجلة جامعة مصر للدراسات الإنسانية
الناشر: جامعة مصر للعلوم والتكنولوجيا
المؤلف الرئيسي: Younis, Nagwa Ibrahim (Author)
المجلد/العدد: مج3, ع3
محكمة: نعم
الدولة: مصر
التاريخ الميلادي: 2023
الشهر: يوليو
الصفحات: 301 - 325
ISSN: 2735-5861
رقم MD: 1391355
نوع المحتوى: بحوث ومقالات
اللغة: الإنجليزية
قواعد المعلومات: HumanIndex
مواضيع:
كلمات المؤلف المفتاحية:
اللغة العربية الحديثة | محاولات حاسوبية | المتون العربية | Modern Arabic | Computational Attempts | Arabic Corpus | I-Arabic
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

5

حفظ في:
المستخلص: تواجه اللغة العربية الحديثة العديد من التحديات المتعلقة باستخدام الأساليب القائمة على الكمبيوتر لتحليل البيانات العربية. تشمل هذه الأساليب معالجة اللغة الطبيعية، والتعلم الآلي، ولغويات المتن، من بين أمور أخرى. تتناول هذه الورقة البحثية التحديات والمحاولات الحاسوبية والنموذج المقترح: I-Arabic... أحد التحديات الرئيسية في استخدام الأساليب الحاسوبية للغة العربية هو الافتقار إلى موارد لغوية كبيرة وعالية الجودة، مثل: متن النصوص، والبيانات المشروحة والموارد المعجمية. ويرجع ذلك إلى عوامل مختلفة، بما في ذلك تنوع اللهجات العربية، ومحدودية توافر النصوص العربية الرقمية. والتحدي الآخر هو تعقيد الصرف العربي وبناء الجملة، والذي يمكن أن يشكل صعوبات الخوارزميات معالجة اللغة الطبيعية. تعتبر اللغة العربية لغةً شديدة التصريف، مع نظام غني من السوابق واللواحق، وتغييرات حروف العلة الداخلية التي يمكن أن تؤثر على معنى الكلمات ووظيفتها. بالإضافة إلى ذلك، تتمتع اللغة العربية بترتيب كلمات مرن، ونظام معقد من الاتفاق النحوي. وعلى الرغم من هذه التحديات، كانت هناك جهود كبيرة لتطوير الأدوات والموارد الحاسوبية للغة العربية، بما في ذلك إنشاء مجموعة اللغة العربية، وتطوير خوارزميات معالجة اللغة الطبيعية المصممة خصيصا للغة العربية. هذه الجهود لديها القدرة على تسهيل البحث في مختلف المجالات، بما في ذلك اللغويات وتحليل وسائل التواصل الاجتماعي والترجمة الآلية.

Modern Arabic encounters many challenges concerning the use of computer-based methods for analyzing Arabic data. These methods include natural language processing, machine learning, and corpus linguistics, among others. This paper addresses the challenges, the computational attempts, and a proposed model: I-Arabic. One of the main challenges in using computational methods for Arabic is the lack of large, high-quality language resources, such as text corpora, annotated data, and lexical resources. This is due to various factors, including the diversity of Arabic dialects and the limited availability of digitized Arabic texts. Another challenge is the complexity of Arabic morphology and syntax, which can pose difficulties for natural language processing algorithms. Arabic is a highly inflected language, with a rich system of prefixes, suffixes, and internal vowel changes that can affect the meaning and function of words. Additionally, Arabic has a flexible word order and a complex system of grammatical agreement. Despite these challenges, there have been significant efforts to develop computational tools and resources for Arabic, including the creation of Arabic language corpora and the development of natural language processing algorithms specifically tailored to Arabic. These efforts have the potential to facilitate research in various fields, including linguistics, social media analysis, and machine translation.

ISSN: 2735-5861