المصدر: | مجلة اللسانيات العربية |
---|---|
الناشر: | مجمع الملك سلمان العالمي للغة العربية |
المؤلف الرئيسي: | الثبيتي، عبدالمحسن بن عبيد (مؤلف) |
المؤلف الرئيسي (الإنجليزية): | Al-Thubaity, Abdul-Mohsen |
مؤلفين آخرين: | القحطاني، وداد بنت أحمد بن عبدالله (م. مشارك) |
المجلد/العدد: | ع16 |
محكمة: | نعم |
الدولة: |
السعودية |
التاريخ الميلادي: |
2023
|
التاريخ الهجري: | 1444 |
الشهر: | يناير |
الصفحات: | 179 - 209 |
DOI: |
10.60161/1482-000-016-008 |
ISSN: |
1658-7421 |
رقم MD: | 1365313 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | العربية |
قواعد المعلومات: | Open, AraBase |
مواضيع: | |
كلمات المؤلف المفتاحية: |
استخلاص المصطلحات | لسانيات المدونات | اللسانيات الحاسوبية | Terms Extraction | Corpus Linguistics | Computational Linguistics
|
رابط المحتوى: |
PDF (صورة)
[مفتوح]
|
المستخلص: |
تقدم هذه الورقة دراسة إحصائية وصفية لبعض القواعد الاسترشادية اللغوية والإحصائية المهمة المستخدمة في استخلاص المصطلحات من المدونات اللغوية المتخصصة. وقد اعتمدت هذه الدراسة على مدونة لغوية متخصصة موسمه بالمصطلحات في مجال اللغويات؛ لمعرفة التراكيب النحوية والصرفية الشائعة لتلك المصطلحات وخواصها الإحصائية مقارنة بمدونة لغوية عامة. حيث إن معرفة ما هو شائع من أنماط لغوية وإحصائية، يساعد في بلورة قواعد استرشاديه أكثر دقة، ويسهم في تقليل أخطاء استخلاص المصطلحات من المدونات اللغوية المتخصصة. كما أن معرفة ما هو غير شائع من التراكيب والخواص الإحصائية المتعلقة بالمصطلحات، يساعد في بناء مدونات موسمه معززة بأمثلة من الأنماط غير الشائعة، مما يسهم في بناء نماذج حاسوبية أكثر دقة لاستخلاص المصطلحات. This paper entitled “The enabling properties for term extraction from Arabic domain-specific corpora” presents a descriptive statistical study of some important linguistic and statistical heuristics used in term extraction from domain-specific corpora. This study relied on a domain-specific corpus manually tagged with linguistic terms, to know the common grammatical and morphological structures of these terms and their statistical properties compared to a general corpus. Knowing the common linguistic and statistical patterns helps in developing more accurate heuristics that contribute to reducing errors in extracting terms from domain-specific corpora. Also, knowing what is uncommon from the statistical structures and properties of terms helps in building tagged corpora enriched with examples of uncommon patterns, which contributes to building more accurate computational models for terms extraction. |
---|---|
ISSN: |
1658-7421 |