المستخلص: |
يعد التصحيح التلقائي للأسئلة المقالية أداة حيوية، لأنه يوفر الكثير من المزايا مثل الحصول على العلامة دون تحيز بشري، وجهد سريع وآمن. في الوقت الحاضر، أصبحت غالبية أنظمة التصحيح التلقائي للأسئلة تعتمد على الذكاء الاصطناعي مثل التعلم الآلي. ونتيجة لذلك، معظم أنظمة التصحيح التلقائي تعتمد حاليا على التعلم الآلي للتصحيح التلقائي للأسئلة المقالية، حيث يتم تصحيح الأسئلة اعتمادا على مجموعة من الإجابات النموذجية معدة مسبقا لاستخدامها في التدريب والتحقق من صحتها. بالنسبة لمقالات اللغة الإنجليزية، توجد مجموعة بيانات ASAP لتصنيف المقالات باستخدام التعلم الآلي ولكن لا توجد مجموعات بيانات للتصحيح التلقائي للأسئلة المقالية لتعلم الآلة. لذلك، هذه الرسالة هي محاولة لجمع وإنشاء مجموعة بيانات لتصحيح الأسئلة المقالية لتعلم الآلة. تحتوي هذه الرسالة على مجموعة البيانات المعتمدة على الأسئلة المقالية مع إجابات نموذجية متدرجة لمواضيع مختلفة ولمستويات مختلفة. تم اختبار وتقييم مجموعة البيانات التي تم جمعها باستخدام خوارزميات التصنيف الأكثر شهرة لتصحيح الأسئلة المقالية تلقائيا باللغة العربية مثل (Naive Bayes, decision tree, meta classifier). تظهر النتيجة التجريبية أن مجموعة البيانات مناسبة لخوارزميات التعلم الآلي، حيث تظهر نتائج دقة الخوارزميات على مجموعة البيانات كالتالي 79% و81% و86%.
|