ارسل ملاحظاتك

ارسل ملاحظاتك لنا







طريقة مقترحة لإستخلاص المصطلحات من المدونات اللغوية العربية المتخصصة

المصدر: مجلة اللسانيات العربية
الناشر: مجمع الملك سلمان العالمي للغة العربية
المؤلف الرئيسي: الثبيتي، عبدالمحسن بن عبيد (مؤلف)
المؤلف الرئيسي (الإنجليزية): Al-Thubaity, Abdul-Mohsen
مؤلفين آخرين: القحطاني، وداد بنت أحمد بن عبدالله (م. مشارك)
المجلد/العدد: ع14
محكمة: نعم
الدولة: السعودية
التاريخ الميلادي: 2022
التاريخ الهجري: 1443
الشهر: يناير
الصفحات: 35 - 56
DOI: 10.60161/1482-000-014-003
ISSN: 1658-7421
رقم MD: 1254570
نوع المحتوى: بحوث ومقالات
اللغة: العربية
قواعد المعلومات: Open, AraBase
مواضيع:
كلمات المؤلف المفتاحية:
استخلاص المصطلحات | لسانيات المدونات | اللسانيات الحاسوبية | Terms Extraction | Corpus Linguistics | Computational Linguists
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

26

حفظ في:
المستخلص: تقدم هذه الورقة بداية: عرضا للأعمال السابقة في مجال استخلاص المصطلحات من المدونات العربية المتخصصة، وقد أوضح العرض عزوفا عن العمل في هذا المجال، وأن أغلبها تركز في مجال واحد فقط. ثانيا: تقدم هذه الورقة مدونتين عربيتين متخصصتين يبلغ حجم كل منهما أكثر من مليوني كلمة، من نصوص منشورة في أوعية نشر محكمة علميا في مجالي أصول الفقه واللغويات. ثالثا: تقترح هذه الورقة طريقه بسيطة ومباشرة لاستخلاص المصطلحات المفردة والمركبة -المكونة من الأسماء فقط -من المدونات العربية المتخصصة. وقد كانت دقة استخلاص المصطلحات المفردة من مدونة أصول الفقه 81.67% وكانت دقة استخلاص المصطلحات المفردة من مدونة اللغويات 79.72%. وبالنسبة للمصطلحات المركبة المكونة من كلمتين؛ فقد كانت دقة الاستخلاص من مدونة أصول الفقه 82.43% وكانت دقة الاستخلاص من مدونة اللغويات 94.30%.

This paper entitled “A Proposed Method for Term Extraction from Domain-Specific Corpora” presents an up-to-date review of the work performed in the field of Arabic term extraction from domain-specific corpora. The analysis of these studies shows the lack of interest in this field and indicates that most of the work has focused on one domain. The paper introduces the following two domain-specific corpora that comprise more than 2 million words each and are derived from peer-reviewed publications: Principles of Islamic Jurisprudence and Linguistics. The paper proposes a simple method for extracting single-word and multiword terms that compose nouns only. For the single-word term extraction, the precision was 81.67 % and 79.72 % and for the bigram term extraction, the precision was 82.43 % and 94.30 % in both Principles of Islamic Jurisprudence and Linguistics, respectively.

ISSN: 1658-7421