ارسل ملاحظاتك

ارسل ملاحظاتك لنا







نظام للتدقيق الإملائي للغة العربية للشبكة العنكبوتية باستخدام معجم حاسوبي وقوانين إملائية وصوتية

العنوان بلغة أخرى: A Spell-Checking System for the Arabic Language for the World Wide Web Using a Computational Lexicon and Orthographic and Phonological Rules
المصدر: مجلة كلية الآداب
الناشر: جامعة الإسكندرية - كلية الأداب
المؤلف الرئيسي: الناجم، صلاح راشد (مؤلف)
المؤلف الرئيسي (الإنجليزية): Al-Najem, Salah
المجلد/العدد: ع110
محكمة: نعم
الدولة: مصر
التاريخ الميلادي: 2022
الشهر: يوليو
الصفحات: 1 - 24
رقم MD: 1324712
نوع المحتوى: بحوث ومقالات
اللغة: العربية
قواعد المعلومات: AraBase
مواضيع:
كلمات المؤلف المفتاحية:
علم اللغة الحاسوبي | المعالجة الحاسوبية للغة العربية | التدقيق الإملائي | علم اللغة التطبيقي | المعجم الحاسوبي | Computational Linguistics | Arabic Language Processing | Spell-Checking | Applied Linguistics | Computational Lexicon
رابط المحتوى:
صورة الغلاف QR قانون
حفظ في:
المستخلص: يقدم هذا البحث نظاما لاكتشاف وتصحيح الأخطاء الإملائية للغة العربية للشبكة العنكبوتية(Web Spell Checker) قمنا بتصميمه باستخدام نظام Web Spell Checker Engine‏. نظامنا متاح للمستخدمين على شكل خدمة ويب سحابية (Cloud Web Service) يمكن دمجها مع أي موقع أو تطبيق متاح على الشبكة العنكبوتية، كما يمكن دمجه مع تطبيقات الأجهزة الذكية وذلك من خلال واجهة لبرمجة التطبيقات (Application Programming Interface) تتيح التدقيق الإملائي لنصوص اللغة العربية المدخلة إلى مواقع وتطبيقات الشبكة العنكبوتية وتطبيقات الأجهزة الذكية. يستطيع نظامنا التعامل مع نسبة كبيرة من الكلمات التي تغطي العربية الفصحى بشكل عام والعربية الفصحى الحديثة (Modern Standard Arabic) بشكل خاص باستخدام معجم حاسوبي (Lexicon). صمم هذا المعجم باستخدام قائمة كلمات ضخمة (Word List) مفتوحة المصدر (Open Source). بنيت هذه القائمة باستخدام قاعدة بيانات معجمية (Lexical Database) مفتوحة المصدر مخصصة للتحليل الصرفي (Morphological Analysis)‏ للأسماء والأفعال العربية صممت باستخدام تقنية الآلات منتهية الحالات (Finite State Automata). تحتوي قائمة الكلمات المذكورة على الصيغ الصرفية والاشتقاقية (Inflected and Derived Forms) المحتملة لكلمات اللغة العربية الفصحى (على سبيل المثال: كتب، ويكتبان، كتبوا، فسيكتبن، كاتبة، للكاتبين، المكتوب). كما تم تزويد النظام بالقدرة على إعادة ترتيب (Re-Ranking) مقترحات التصحيح الآلي الناتجة من تطبيق خوارزمية مسافة تحرير ليفينستين (Levenshtein Edit Distance Algorithm) المستخدمة في التصحيح الحاسوبي الآلي للأخطاء الإملائية من خلال إعطاء الأولوية لإظهار مقترحات التصحيح الآلي للأخطاء الإملائية الشائعة لدى مستخدمي اللغة العربية وذلك باستخدام قوانين إملائية وصوتية سياقية (Context Sensitive Orthographic and Phonological Rules). استخدم المعجم الحاسوبي والقوانين الإملائية والصوتية السياقية المذكورة لتزويد النظام بالمعرفة اللغوية التي تمكنه من اكتشاف وتصحيح الأخطاء الإملائية في نصوص اللغة العربية الفصحى المدخلة إلى مواقع الشبكة ‎العنكبوتية.

This paper presents a system for detecting and correcting spelling errors for the Arabic language for the World Wide Web (Web Spell Checker) that we designed using the Web Spell checker Engine system. Our system is available to users in the form of a Cloud Web Service that can be integrated with any website or application available on the World Wide Web, and it can also be integrated with smart device applications through an Application Programming Interface (API) that allows spell checking of Arabic texts entered to web applications and smart device applications. Our system can handle a large percentage of words covering Standard Arabic in general and Modern Standard Arabic in particular using a computational lexicon. This lexicon is built using a huge open source word list. This list was built using an open source Lexical Database dedicated to morphological analysis of Arabic nouns and verbs, which was designed using Finite State Automata technique. The mentioned word list contains the possible inflected and derived forms of Standard Arabic words (examples: كتب، ويكتبان، كتبوا، فسيكتبن، كاتبة، للكاتبين، المكتوب). The system was also provided with the ability to re-rank the automatic correction suggestions resulting from the application of the Levenshtein Edit Distance Algorithm used in the automatic computer correction of spelling errors by giving priority to showing the automatic correction suggestions for common spelling errors among Arabic language users using context sensitive orthographic and phonological rules. The computational lexicon and the mentioned context sensitive orthographic and phonological rules are used to provide the system with linguistic knowledge that enables it to detect and correct spelling errors in Standard Arabic texts entered to web applications.