ارسل ملاحظاتك

ارسل ملاحظاتك لنا







طريقة مقترحة لإستخلاص المصطلحات من المدونات اللغوية العربية المتخصصة

المصدر: مجلة اللسانيات العربية
الناشر: مجمع الملك سلمان العالمي للغة العربية
المؤلف الرئيسي: الثبيتي، عبدالمحسن بن عبيد (مؤلف)
المؤلف الرئيسي (الإنجليزية): Al-Thubaity, Abdul-Mohsen
مؤلفين آخرين: القحطاني، وداد بنت أحمد بن عبدالله (م. مشارك)
المجلد/العدد: ع14
محكمة: نعم
الدولة: السعودية
التاريخ الميلادي: 2022
التاريخ الهجري: 1443
الشهر: يناير
الصفحات: 35 - 56
DOI: 10.60161/1482-000-014-003
ISSN: 1658-7421
رقم MD: 1254570
نوع المحتوى: بحوث ومقالات
اللغة: العربية
قواعد المعلومات: Open, AraBase
مواضيع:
كلمات المؤلف المفتاحية:
استخلاص المصطلحات | لسانيات المدونات | اللسانيات الحاسوبية | Terms Extraction | Corpus Linguistics | Computational Linguists
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

26

حفظ في:
LEADER 03670nam a22002537a 4500
001 2005610
024 |3 10.60161/1482-000-014-003 
041 |a ara 
044 |b السعودية 
100 |9 505539  |a الثبيتي، عبدالمحسن بن عبيد  |e مؤلف  |g Al-Thubaity, Abdul-Mohsen 
245 |a طريقة مقترحة لإستخلاص المصطلحات من المدونات اللغوية العربية المتخصصة 
260 |b مجمع الملك سلمان العالمي للغة العربية  |c 2022  |g يناير  |m 1443 
300 |a 35 - 56 
336 |a بحوث ومقالات  |b Article 
520 |a تقدم هذه الورقة بداية: عرضا للأعمال السابقة في مجال استخلاص المصطلحات من المدونات العربية المتخصصة، وقد أوضح العرض عزوفا عن العمل في هذا المجال، وأن أغلبها تركز في مجال واحد فقط. ثانيا: تقدم هذه الورقة مدونتين عربيتين متخصصتين يبلغ حجم كل منهما أكثر من مليوني كلمة، من نصوص منشورة في أوعية نشر محكمة علميا في مجالي أصول الفقه واللغويات. ثالثا: تقترح هذه الورقة طريقه بسيطة ومباشرة لاستخلاص المصطلحات المفردة والمركبة -المكونة من الأسماء فقط -من المدونات العربية المتخصصة. وقد كانت دقة استخلاص المصطلحات المفردة من مدونة أصول الفقه 81.67% وكانت دقة استخلاص المصطلحات المفردة من مدونة اللغويات 79.72%. وبالنسبة للمصطلحات المركبة المكونة من كلمتين؛ فقد كانت دقة الاستخلاص من مدونة أصول الفقه 82.43% وكانت دقة الاستخلاص من مدونة اللغويات 94.30%.  |b This paper entitled “A Proposed Method for Term Extraction from Domain-Specific Corpora” presents an up-to-date review of the work performed in the field of Arabic term extraction from domain-specific corpora. The analysis of these studies shows the lack of interest in this field and indicates that most of the work has focused on one domain. The paper introduces the following two domain-specific corpora that comprise more than 2 million words each and are derived from peer-reviewed publications: Principles of Islamic Jurisprudence and Linguistics. The paper proposes a simple method for extracting single-word and multiword terms that compose nouns only. For the single-word term extraction, the precision was 81.67 % and 79.72 % and for the bigram term extraction, the precision was 82.43 % and 94.30 % in both Principles of Islamic Jurisprudence and Linguistics, respectively. 
653 |a المصطلحات  |a إستخلاص المصطلحات  |a المدونات العربية المتخصصة  |a مدونة أصول الفقه  |a مدونة اللغويات 
692 |a استخلاص المصطلحات  |a لسانيات المدونات  |a اللسانيات الحاسوبية  |b Terms Extraction  |b Corpus Linguistics  |b Computational Linguists 
700 |a القحطاني، وداد بنت أحمد بن عبدالله  |g Al-Qahtani, Wedad bint Ahmed bin Abdullah  |e م. مشارك  |9 156668 
773 |4 اللغة واللغويات  |6 Language & Linguistics  |c 003  |f Allisaniyat Alarabiyah  |l 014  |m ع14  |o 1482  |s مجلة اللسانيات العربية  |t Arab linguistics journal  |v 000  |x 1658-7421 
856 |u 1482-000-014-003.pdf 
930 |d y  |p y  |q n 
995 |a Open 
995 |a AraBase 
999 |c 1254570  |d 1254570