ارسل ملاحظاتك

ارسل ملاحظاتك لنا







تأثيرات طول الاختبار وطريقة التصحيح ونموذج تحليل المفردة على تقديرات القدرة ومعايير التحسين للاختبارات ذات المفردات المختلطة

المصدر: مجلة الدراسات النفسية المعاصرة
الناشر: جامعة بني سويف - كلية الآداب
المؤلف الرئيسي: طنطاوي، شيرين فاروق محمد (مؤلف)
المجلد/العدد: مج4, ع1
محكمة: نعم
الدولة: مصر
التاريخ الميلادي: 2022
الشهر: مارس
الصفحات: 38 - 96
ISSN: 2357-0733
رقم MD: 1314393
نوع المحتوى: بحوث ومقالات
اللغة: العربية
قواعد المعلومات: EduSearch
مواضيع:
كلمات المؤلف المفتاحية:
طول الاختبار | طريقة التصحيح | نموذج تحليل المفردة | تقديرات القدرة | دالة معلومات الاختبار | معايير التحسين | الاختبارات ذات المفردات المختلطة | Test Length | Scoring Schema | Item Analysis Model | The Ability Estimates | Test Information Function | Optimization Criteria | Mixed Item Format Tests
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

26

حفظ في:
المستخلص: هدفت الدراسة إلى البحث في تأثيرات طول الاختبار (١٠، 20، 30 مفردة) وطريقة التصحيح (نسبة التصحيح ثنائي الاستجابة ومتعدد الاستجابة) ونموذج تحليل المفردة (باستخدام مجموعتين من النماذج لتصحيح المفردات المختلطة: المجموعة الأولى نموذج راش ثنائي الاستجابة Rasch ونموذج التقدير الجزئي متعدد الاستجابات (PCM)، والمجموعة الثانية النموذج ثنائي البارامتر ثنائي الاستجابات 2PL ونموذج الاستجابة المتدرجة متعدد الاستجابات (GRM). على تقديرات القدرة ودالة معلومات الاختبار ومعايير التحسين للاختبارات ذات المفردات المختلطة. تكونت عينة الدراسة من ٣٤٠ طالبا وطالبة بالفرقة الثالثة من كلية الآداب جامعة الفيوم الذين يدرسون مقرر الاختبارات والمقاييس النفسية. ثم تم تحليل جميع الاستجابات للمفردات للتحقق من أول افتراضات نظرية الاستجابة للمفردة وهو افتراض أحادية البعد وذلك باستخدام طريقة التحليل العاملي في برنامج SPSS وذلك بطريقة الأرجحية القصوى. تم الوصول إلى عامل واحد لكل مجموعة من المفردات. ولتحليل الاستجابات للاختبارات المختلطة تم استخدام مجموعتين من النماذج وهما المجموعة الأولى نموذج راش ثنائي الاستجابة Rasch ونموذج التقدير الجزئي متعدد الاستجابات (PCM)، والمجموعة الثانية النموذج ثنائي البارامتر ثنائي الاستجابات 2PL ونموذج الاستجابة المتدرجة متعدد الاستجابات (GRM). أشارت النتائج إلى أن كلا من طول الاختبار ونسبة المفردات التي تم تصحيحها بشكل متعدد الاستجابة كان لها تأثير كبير على كمية معلومات الاختبار الناتجة عن الاختبارات ذات المفردات المختلطة. بشكل عام، أدت الاختبارات التي تم إجراؤها على ١٠٠% من المفردات التي تم تصحيحها بشكل متعدد الاستجابات إلى الحصول على أعلى معلومات شاملة. يبدو أن هذا ينطبق بشكل خاص على الممتحنين ذوي تقديرات القدرة المنخفضة. تمت المقارنة بين المجموعتين من النماذج من حيث قيم الخطأ القياسية لتقديرات القدرة والثبات الهامشية ومؤشرات المطابقة (-2LL). وكانت الفروق بينهما واضحة في معدلات الخطأ المعيارية.

This study investigated the effects of test length, scoring schema and item analysis model on the ability estimates, test information levels and optimization criteria of mixed item format tests. SPSS software across ability estimates and standard errors of ability estimates using a 3 x 11 x 2 fixed factorial ANOVA was used to make the comparison between two sets of models (first group consists of Rasch model and Partial Credit Model, second group consists of Two Parameter Logistic Model and Graded Response Model of item analysis procedures. Effect sizes and power were reported for each procedure. Scheffe post hoc procedures were conducted on significant factors. Test information was analyzed and compared across the range of ability levels for all 66-design combinations. The results indicated that both test length and the proportion of items scored polytomously had a significant impact on the amount of test information produced by mixed item format tests. Generally, tests with 100% of the items scored polytomously produced the highest overall information. This seemed to be especially true for examinees with lower ability estimates. Optimality comparisons were made between IRT models procedures based on standard error rates for the ability estimates, marginal reliabilities and fit indices (-2LL). The only significant differences reported involved the standard error rates for both two sets procedures. This result must be viewed in light of the fact that the effect size reported was negligible.

ISSN: 2357-0733