المصدر: | مجلة مجمع اللغة العربية بالقاهرة |
---|---|
الناشر: | مجمع اللغة العربية |
المؤلف الرئيسي: | عبدالغني، نعيم محمد (مؤلف) |
مؤلفين آخرين: | شكري، شادي (م. مشارك) , أشرف، عمر (م. مشارك) , جمعة، محمد (م. مشارك) , رشوان، محسن عبدالرازق (م. مشارك) |
المجلد/العدد: | ج149 |
محكمة: | نعم |
الدولة: |
مصر |
التاريخ الميلادي: |
2023
|
التاريخ الهجري: | 1444 |
الشهر: | مايو |
الصفحات: | 42 - 64 |
رقم MD: | 1391717 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | العربية |
قواعد المعلومات: | AraBase |
مواضيع: | |
كلمات المؤلف المفتاحية: |
تقييم | فهم | اللغات الطبيعية | Glue | Superglue
|
رابط المحتوى: |
المستخلص: |
مع تحقيق الذكاء الاصطناعي طفرة في معالجة اللغات الطبيعية تزداد الحاجة إلى تقييم ما تم التوصل إليه من نتائج؛ لمعرفة أوجه القصور ومعالجتها، وفي هذا الإطار كانت هناك معايير تقييم بسيطة ترتبط بمهمة واحدة وينتهي أمرها، ولكن مع تشابك المهام وتعقدها ظهرت الحاجة إلى معيار له القدرة على التعامل مع الجمل الطويلة والنصوص المتشابكة، ومن هنا ظهر معیار (GULE) الذي حدد تسعة مهام حاول تقييمها، ثم تطور الأمر بعد ذلك في معيار (SUPERGLUE) الذي يتعامل مع النصوص الأكثر تعقيدا. ورغم تفوق المعيارين السابقين في بعض المهام فإن الفجوة بينه وبين التقييم البشري لا تزال قائمة وتتسع وتضيق بحسب المهمة المستخدم فيها المعيار. |
---|