العنوان بلغة أخرى: |
Belqis: A System to Detect and Correct Audible Grammar Mistakes in Spoken Arabic |
---|---|
المصدر: | مجلة اللغويات الحاسوبية والمعالجة الآلية للغة العربية |
الناشر: | مجمع الملك سلمان العالمي للغة العربية |
المؤلف الرئيسي: | خرصي، أحمد ميلود (مؤلف) |
المؤلف الرئيسي (الإنجليزية): | Khorsi, Ahmed Mailoud |
المجلد/العدد: | مج1, ع1 |
محكمة: | نعم |
الدولة: |
السعودية |
التاريخ الميلادي: |
2024
|
التاريخ الهجري: | 1445 |
الشهر: | أبريل |
الصفحات: | 79 - 90 |
DOI: |
10.60161/2521-001-001-005 |
ISSN: |
1658-9483 |
رقم MD: | 1454840 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | العربية |
قواعد المعلومات: | Open, AraBase |
مواضيع: | |
كلمات المؤلف المفتاحية: |
المعالجة الآلية للغات الحقيقية | معالجة المحتوى العربي | حوسبة اللغة | الذكاء الاصطناعي | التصحيح الآلي للأخطاء اللغوية | NLP | Arabic Language | Diacritics | Automated Grammar Checking
|
رابط المحتوى: |
PDF (صورة)
[مفتوح]
|
المستخلص: |
في كل لغة، للكتابة والكلام قواعد تضمن الفهم الصحيح لما يقصده الكاتب والمتكلم. ورغم أن مكتبة النحو العربي قد لا يدانيها ما كتب في قواعد أي لغة أخرى، لا تزال الأبحاث في حوسبة اللغة العربية تغفل جوانب مهمة من خصوصيات اللغة العربية. على خلاف لغات أخرى، كثير من الأخطاء النحوية في اللغة العربية لا يقرأ، بل يسمع. جملة بسيطة مثل «كتب الطالب الدرس» بدون ضبط للحركات -كما هو الغالب في الكتابة العربية-. قد تنطق "كتب الطالب الدرس". مثل هذه الأخطاء لا تميز إلا بالسمع. في هذا البحث. نسلط الضوء على تصميم نظام حاسوبي لاكتشاف وتصحيح هذا النوع من الأخطاء. هذا النظام، نفذناه -بحمد الله- في منصة بلقيس التي تضم عددا من الأنظمة الحاسوبية التي تعتمد الذكاء الاصطناعي لمعالجة المحتوى العربي. نتائج التجارب أظهرت دقة تصل إلى ۹۳,۲۸% واسترجاعا وصل إلى ٩٩,٠١%. Speech as writing is bound by the language rules to ensure a common interpretation. Although Arabic grammar has been studied and documented since the eighth century, research in Arabic language processing seem to miss much of it. Unlike English, many of the grammar mistakes in Arabic are audible rather than visible. A sentence like “كتب الطالب الدرس” should be pronounced «kataba ttaAlibo ddarsa» “The student wrote the lesson”: the translation of “كتب الطالب الدرس”, might also be misinterpreted “the lesson wrote the student” if mispronounced “كتب الطالب الدرس” (kataba ttaAliba ddarso). A single diacritic switched the meaning. In this article, we show how we addressed the challenge of audible grammar mistakes. To the best of our knowledge, no approach addresses the Arabic grammar checking to the depth we do. Tests on the grammar checker show 93%+ accuracy 99% recall. |
---|---|
ISSN: |
1658-9483 |