المصدر: | مجلة اللسانيات العربية |
---|---|
الناشر: | مجمع الملك سلمان العالمي للغة العربية |
المؤلف الرئيسي: | الثبيتي، عبدالمحسن بن عبيد (مؤلف) |
المؤلف الرئيسي (الإنجليزية): | Al-Thubaity, Abdul-Mohsen |
مؤلفين آخرين: | القحطاني، وداد بنت أحمد بن عبدالله (م. مشارك) |
المجلد/العدد: | ع14 |
محكمة: | نعم |
الدولة: |
السعودية |
التاريخ الميلادي: |
2022
|
التاريخ الهجري: | 1443 |
الشهر: | يناير |
الصفحات: | 35 - 56 |
DOI: |
10.60161/1482-000-014-003 |
ISSN: |
1658-7421 |
رقم MD: | 1254570 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | العربية |
قواعد المعلومات: | Open, AraBase |
مواضيع: | |
كلمات المؤلف المفتاحية: |
استخلاص المصطلحات | لسانيات المدونات | اللسانيات الحاسوبية | Terms Extraction | Corpus Linguistics | Computational Linguists
|
رابط المحتوى: |
PDF (صورة)
[مفتوح]
|
LEADER | 03670nam a22002537a 4500 | ||
---|---|---|---|
001 | 2005610 | ||
024 | |3 10.60161/1482-000-014-003 | ||
041 | |a ara | ||
044 | |b السعودية | ||
100 | |9 505539 |a الثبيتي، عبدالمحسن بن عبيد |e مؤلف |g Al-Thubaity, Abdul-Mohsen | ||
245 | |a طريقة مقترحة لإستخلاص المصطلحات من المدونات اللغوية العربية المتخصصة | ||
260 | |b مجمع الملك سلمان العالمي للغة العربية |c 2022 |g يناير |m 1443 | ||
300 | |a 35 - 56 | ||
336 | |a بحوث ومقالات |b Article | ||
520 | |a تقدم هذه الورقة بداية: عرضا للأعمال السابقة في مجال استخلاص المصطلحات من المدونات العربية المتخصصة، وقد أوضح العرض عزوفا عن العمل في هذا المجال، وأن أغلبها تركز في مجال واحد فقط. ثانيا: تقدم هذه الورقة مدونتين عربيتين متخصصتين يبلغ حجم كل منهما أكثر من مليوني كلمة، من نصوص منشورة في أوعية نشر محكمة علميا في مجالي أصول الفقه واللغويات. ثالثا: تقترح هذه الورقة طريقه بسيطة ومباشرة لاستخلاص المصطلحات المفردة والمركبة -المكونة من الأسماء فقط -من المدونات العربية المتخصصة. وقد كانت دقة استخلاص المصطلحات المفردة من مدونة أصول الفقه 81.67% وكانت دقة استخلاص المصطلحات المفردة من مدونة اللغويات 79.72%. وبالنسبة للمصطلحات المركبة المكونة من كلمتين؛ فقد كانت دقة الاستخلاص من مدونة أصول الفقه 82.43% وكانت دقة الاستخلاص من مدونة اللغويات 94.30%. |b This paper entitled “A Proposed Method for Term Extraction from Domain-Specific Corpora” presents an up-to-date review of the work performed in the field of Arabic term extraction from domain-specific corpora. The analysis of these studies shows the lack of interest in this field and indicates that most of the work has focused on one domain. The paper introduces the following two domain-specific corpora that comprise more than 2 million words each and are derived from peer-reviewed publications: Principles of Islamic Jurisprudence and Linguistics. The paper proposes a simple method for extracting single-word and multiword terms that compose nouns only. For the single-word term extraction, the precision was 81.67 % and 79.72 % and for the bigram term extraction, the precision was 82.43 % and 94.30 % in both Principles of Islamic Jurisprudence and Linguistics, respectively. | ||
653 | |a المصطلحات |a إستخلاص المصطلحات |a المدونات العربية المتخصصة |a مدونة أصول الفقه |a مدونة اللغويات | ||
692 | |a استخلاص المصطلحات |a لسانيات المدونات |a اللسانيات الحاسوبية |b Terms Extraction |b Corpus Linguistics |b Computational Linguists | ||
700 | |a القحطاني، وداد بنت أحمد بن عبدالله |g Al-Qahtani, Wedad bint Ahmed bin Abdullah |e م. مشارك |9 156668 | ||
773 | |4 اللغة واللغويات |6 Language & Linguistics |c 003 |f Allisaniyat Alarabiyah |l 014 |m ع14 |o 1482 |s مجلة اللسانيات العربية |t Arab linguistics journal |v 000 |x 1658-7421 | ||
856 | |u 1482-000-014-003.pdf | ||
930 | |d y |p y |q n | ||
995 | |a Open | ||
995 | |a AraBase | ||
999 | |c 1254570 |d 1254570 |