العنوان بلغة أخرى: |
The Probabilistic Analysis of Arabic Binomials: A Corpus-Based Study |
---|---|
المصدر: | مجلة جامعة الملك عبدالعزيز - الآداب والعلوم الإنسانية |
الناشر: | جامعة الملك عبدالعزيز |
المؤلف الرئيسي: | التميمي، أفراح بنت عبدالعزيز (مؤلف) |
المؤلف الرئيسي (الإنجليزية): | Al-Tamimi, Afrah Abdul Aziz |
المجلد/العدد: | مج30, ع7 |
محكمة: | نعم |
الدولة: |
السعودية |
التاريخ الميلادي: |
2022
|
الصفحات: | 401 - 430 |
ISSN: |
1319-0989 |
رقم MD: | 1427480 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | العربية |
قواعد المعلومات: | AraBase, HumanIndex |
مواضيع: | |
كلمات المؤلف المفتاحية: |
المدونة اللغوية | العبارات الثنائية الحدين | الانحدار اللوجيستي | نموذج | قيود | التحليل الاحتمالي | الثبات | Corpus | Binomials | Logistic regression | Model | Constrains | Probabilistic analysis | Fixedness
|
رابط المحتوى: |
المستخلص: |
تشير الأبحاث العالمية القائمة على التجريب والحدس والمدونات اللغوية إلى أن ثمة عوامل تؤثر في ترتيب مستعمل اللغة لحدي العبارة الثنائية الحدين. وفي هذه الورقة حللت ۱۰۰۰ عبارة عربية ثنائية الحدين بالاعتماد على المدونة الفرعية من (مدونة الويب العربي ۲۰۱۲ آر تن تن 2012 Arabic Web 2012 (arTenTen12)) ذات النصوص العربية الفصيحة الموسومة نحويا بموسم ستانفورد والمتضمنة ٤٢٩,٩٩٠,٥٩٦ كلمة فعلية. وقد كشفت الورقة تجريبيا من خلال نموذج الانحدار اللوجيستي عن واقع خمسة من القيود الواردة في الأدبيات السابقة والمؤثرة في ترتيب حدي العبارات الثنائية الحدين. وأظهرت القيم الإحصائية والاحتمالية للنموذج تباينا في درجة أثر هذه القيود على ترتيب حدي العبارات، وتبين أن أكثرها تأثيرا هو قيد الموسومية فيما استبعد قيد الألفبائية لعدم دلالته الإحصائية. وقد تمكن النموذج بالقيود الأربعة من تفسير حوالي ٠,٤٨ من ثبات العبارات الثنائية الحدين، وأظهر أيضا قدرة على التعلم، فقدم نتائج مقبولة في مقاييس الصحة والدقة والاسترجاع. ومن المتوقع أن زيادة حجم البيانات وإضافة قيود أخرى سيسهمان في تفسير ترتيب العبارات الثنائية الحدين أكثر، وسيزيدان من دقة أداء النموذج. International research using experimental, intuition-based, and corpus-based methods indicates that there are factors can play a role in the ordering preferences of binomials. In this paper, I analysed 1000 Arabic binomials based on the sub-corpus of (Arabic Web 2012: arTenTen12) which is consisted of 429,990,596 tokens from Standard Arabic texts grammatically tagged with Stanford tagger. The paper has experimentally found through conducting a logistic regression analysis of binomials that five constraints mentioned in the previous literature affect binomial ordering. The statistical and probability values of our model showed a variation in the ranks of influence of these constrains on the binomial ordering. It was found that the most influential is markedness, while alphabetic was excluded due to statistically non-significant. The best model with the four constraints was able to explain about 0.48 of the fixedness of binomial, and it also revealed learnability and showed good results in the measures of performance. It is expected that increasing the size of the data and adding other constraints will increase contributing to the interpretation of the binomial ordering and will improve model performance. |
---|---|
ISSN: |
1319-0989 |