العنوان بلغة أخرى: |
Arabic Lexical Resources as a Corpus: Parsing, Annotation and Integration into a Unified and Comprehensive Machine-Readable Lexical Semantic Database |
---|---|
المصدر: | مجلة اللغويات الحاسوبية والمعالجة الآلية للغة العربية |
الناشر: | مجمع الملك سلمان العالمي للغة العربية |
المؤلف الرئيسي: | هواري، عبدالعاطي إبراهيم (مؤلف) |
المؤلف الرئيسي (الإنجليزية): | Hawwari, Abdelati |
المجلد/العدد: | مج1, ع2 |
محكمة: | نعم |
الدولة: |
السعودية |
التاريخ الميلادي: |
2024
|
التاريخ الهجري: | 1446 |
الشهر: | أكتوبر |
الصفحات: | 39 - 72 |
DOI: |
10.60161/2521-001-002-002 |
ISSN: |
1658-9483 |
رقم MD: | 1520226 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | العربية |
قواعد المعلومات: | AraBase, Open |
مواضيع: | |
كلمات المؤلف المفتاحية: |
معجم مقروء آلياً | معجمية عربية | اطردات معجمية دلالية | توسيم | بناء المصادر المعجمية | MRD | Arabic Lexicography | Lexical Semantic | Dictionary Parsing | Lexical Integration | Thesaurus
|
رابط المحتوى: |
PDF (صورة)
[مفتوح]
|
المستخلص: |
موضوع الدراسة وصف منهجية لسانية حاسوبية لتحليل متن المصادر المعجمية التقليدية العربية؛ لاستخلاص أنماط المعلومات المعجمية الدلالية الصريحة والضمنية في متن النص المعجمي العربي؛ ويشمل ذلك أنماط المعلومات الصرفية (الاشتقاقية والتصريفية)، والتركيبية (النحوية والإعرابية)، والمعجمية (المداخل المفردة، والمداخل المركبة، والمتصاحبات اللفظية)، والدلالية (العلاقات الدلالية، والحقول الدلالية)، والاستعمالية، والتأثيلية، وتوسيمها بالمعلومات الضرورية، واستكمال المعلومات التي يمكن استنتاجها، ثم دمج المعلومات المستخلصة، ووضع هذه المعلومات في مورد معجمي دلالي مقروء آليا، يمكن توظيفه في بناء معجم لغوي ومكنز دلالي موسعين. وتنطلق الدراسة من فرضية مؤداها أن الموارد المعجمية العربية التقليدية ثروة لغوية ولسانية تفتقر إلى الجدولة الحاسوبية، وتنقصها بعض أنماط المعلومات المعجمية الحديثة. ويمكن تحويل مادة هذه الموارد المعجمية إلى صيغة محوسبة وتوظيفها في المجال الحاسوبي من جهة، وفي تطوير أجيال من الموارد المعجمية أكثر حداثة، وأكفأ لسانيا، تحقيقا لمتطلبات المستعمل البشري، والآلة في الوقت ذاته؛ وذلك باستخلاص الأنماط الصرفية والتركيبية والدلالية والمعجمية القارة في المتن المعجمي التقليدي. This paper presents a comprehensive approach to constructing a unified Machine-Readable Dictionary (MRD) by leveraging printed Arabic lexical resources, including dictionaries, thesauri, and semantic dictionaries. These resources are invaluable for natural language processing (NLP) tasks, yet they remain underutilized due to their printed form. Our methodology involves parsing, annotating, and merging various lexical sources into a single, coherent MRD, designed for effective utilization in computational applications. The process includes syntactic and semantic parsing to capture linguistic nuances and ensure consistency across entries. We employ automated and manual annotation techniques to address discrepancies and enrich the lexical data. This unified resource not only bridges the gap between different lexical formats but also offers a powerful tool for tasks such as word-sense disambiguation, semantic analysis, and machine translation. The paper demonstrates the feasibility and value of transforming printed Arabic lexical resources into an accessible, standardized digital format for both linguistic research and practical NLP applications. |
---|---|
ISSN: |
1658-9483 |