ارسل ملاحظاتك

ارسل ملاحظاتك لنا







الخواص الممكنة لاستخلاص المصطلحات اللغوية من المدونات العربية المتخصصة

المصدر: مجلة اللسانيات العربية
الناشر: مجمع الملك سلمان العالمي للغة العربية
المؤلف الرئيسي: الثبيتي، عبدالمحسن بن عبيد (مؤلف)
المؤلف الرئيسي (الإنجليزية): Al-Thubaity, Abdul-Mohsen
مؤلفين آخرين: القحطاني، وداد بنت أحمد بن عبدالله (م. مشارك)
المجلد/العدد: ع16
محكمة: نعم
الدولة: السعودية
التاريخ الميلادي: 2023
التاريخ الهجري: 1444
الشهر: يناير
الصفحات: 179 - 209
DOI: 10.60161/1482-000-016-008
ISSN: 1658-7421
رقم MD: 1365313
نوع المحتوى: بحوث ومقالات
اللغة: العربية
قواعد المعلومات: Open, AraBase
مواضيع:
كلمات المؤلف المفتاحية:
استخلاص المصطلحات | لسانيات المدونات | اللسانيات الحاسوبية | Terms Extraction | Corpus Linguistics | Computational Linguistics
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

20

حفظ في:
المستخلص: تقدم هذه الورقة دراسة إحصائية وصفية لبعض القواعد الاسترشادية اللغوية والإحصائية المهمة المستخدمة في استخلاص المصطلحات من المدونات اللغوية المتخصصة. وقد اعتمدت هذه الدراسة على مدونة لغوية متخصصة موسمه بالمصطلحات في مجال اللغويات؛ لمعرفة التراكيب النحوية والصرفية الشائعة لتلك المصطلحات وخواصها الإحصائية مقارنة بمدونة لغوية عامة. حيث إن معرفة ما هو شائع من أنماط لغوية وإحصائية، يساعد في بلورة قواعد استرشاديه أكثر دقة، ويسهم في تقليل أخطاء استخلاص المصطلحات من المدونات اللغوية المتخصصة. كما أن معرفة ما هو غير شائع من التراكيب والخواص الإحصائية المتعلقة بالمصطلحات، يساعد في بناء مدونات موسمه معززة بأمثلة من الأنماط غير الشائعة، مما يسهم في بناء نماذج حاسوبية أكثر دقة لاستخلاص المصطلحات.

This paper entitled “The enabling properties for term extraction from Arabic domain-specific corpora” presents a descriptive statistical study of some important linguistic and statistical heuristics used in term extraction from domain-specific corpora. This study relied on a domain-specific corpus manually tagged with linguistic terms, to know the common grammatical and morphological structures of these terms and their statistical properties compared to a general corpus. Knowing the common linguistic and statistical patterns helps in developing more accurate heuristics that contribute to reducing errors in extracting terms from domain-specific corpora. Also, knowing what is uncommon from the statistical structures and properties of terms helps in building tagged corpora enriched with examples of uncommon patterns, which contributes to building more accurate computational models for terms extraction.

ISSN: 1658-7421