ارسل ملاحظاتك

ارسل ملاحظاتك لنا







Towards Automatic Construction of Arabic Synonyms

العنوان بلغة أخرى: نحو بناء مكنز مترادفات للغة العربية آليا
المؤلف الرئيسي: Naser, Eman (Author)
مؤلفين آخرين: Jarrar, Mustafa (Advisor)
التاريخ الميلادي: 2015
موقع: بيرزيت
الصفحات: 1 - 69
رقم MD: 702962
نوع المحتوى: رسائل جامعية
اللغة: الإنجليزية
الدرجة العلمية: رسالة ماجستير
الجامعة: جامعة بيرزيت
الكلية: كلية الهندسة والتكنولوجيا
الدولة: فلسطين
قواعد المعلومات: Dissertations
مواضيع:
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

76

حفظ في:
المستخلص: أن النمو السريع لمصادر المعلومات المتصلة بالأنترنت من قواعد بيانات وغيرها أدى إلى حدوث ثورة في عالم البيانات. هذا أدى إلى وجود كم هائل من البيانات المخزنة في وثائق ونصوص في لغات مختلفة. حيث أصبحت من أهم القضايا التي تؤرق العالم، الأمر الذي أدى إلى زيادة الطلب على التطبيقات البرمجة اللغوية الذكية من فهم واسترجاع وترجمة وتلخيص هذه الكميات الكبيرة من النصوص والتي تتطلب دقة في معالجتها، خاصة الجانب اللغوي. تعتبر المكانز اللغوية من الأمثلة على المصادر اللغوية المهمة ومن المكونات الأساسية للعديد من التطبيقات الذكية خاصة لدعم تعدد اللغات. على الرغم من وجود العديد من المكانز الخاصة باللغة العربية، إلا أن غالبيتها غير دقيقة خاصة وان علاقة المترادفات فيها تقريبية وهي أقرب لان تكون علاقة عامة بين الكلمات. مثلا قاموس غوغل للعربية، والمرادفات للكلمة "دولة" هي (بلد، قطر، وطن، الريف، ريف). هنا الكلمات التي تحتها خط خاطئة، لأنها ليست مرادفات صحيحة. تهدف هذه الأطروحة إلى بناء مكنز للغة العربية بطريقة آلية، ومن ثم ربط مجموعات المترادفات في هذا المكنز بمقابلاتها في شبكة الدلالية للكلمات الإنجليزية (English WordNet) بمعنى آخر، نأخذ الكلمات العربية المرادفة التي تم بناءها من المكنز ومن ثم ربطها بالمترافات (English WordNet)؛ مثلا (بع......، 2ع، 1ع)=: (جن......، 2ن، 1ن). لعمل ذلك، قمنا بتطبيق خوارزمية SynsetGenerator لبناء المكنز بطريقة الية، حيث تحتاج الخوارزمية إلى مجموعة من القواميس ثنائية اللغة عربي- إنجليزي كمدخل، وتم ربط النتائج مع (English WordNet) وتقيمها باستخدام مبدأ تشابه جيب التمام (Cosine Similarity).

عناصر مشابهة