العنوان بلغة أخرى: |
Effect of Item Difficulty and Sample Size on the Accuracy of Equating by Using Item Response Theory |
---|---|
المصدر: | مجلة الدراسات التربوية والنفسية |
الناشر: | جامعة السلطان قابوس |
المؤلف الرئيسي: | المحروق، يوسف عبدالعاطي محمد (مؤلف) |
المؤلف الرئيسي (الإنجليزية): | AlMahrouk, Yousef A. |
المجلد/العدد: | مج10, ع1 |
محكمة: | نعم |
الدولة: |
سلطنة عمان |
التاريخ الميلادي: |
2016
|
الشهر: | يناير |
الصفحات: | 182 - 199 |
DOI: |
10.12816/0026667 |
ISSN: |
2218-6506 |
رقم MD: | 730050 |
نوع المحتوى: | بحوث ومقالات |
اللغة: | العربية |
قواعد المعلومات: | EduSearch |
مواضيع: | |
كلمات المؤلف المفتاحية: |
معادلة الاختبارات | equating test | نظرية استجابة الفقرة | Item Response Theory (IRT)
|
رابط المحتوى: |
المستخلص: |
هدفت هذه الدراسة إلى معرفة أثر صعوبة الفقرة وحجم العينة في دقة معادلة درجات الاختبارات باستخدام نظرية استجابة الفقرة (IRT)، وذلك من خلال دراسة المتغيرات الآتية: حجم العينة: وقد استخدمت ثلاثة مستويات: ٢٠٠، ٦٠٠، ١٠٠٠ وهذه الأحجام للعينات تعتبر مناسبة لطرق المعادلة باستخدام تصميم المجموعات العشوائية، ومتغير مستويات الصعوبة، وله مستويان: التشابه في متوسط معدل الصعوبة للاختبار، والاختلاف في متوسط معدل الصعوبة، تم التوصل إلى نتائج دقة المعادلة في ظل استخدام المتغيرات السابقة منفردة ومجتمعة، ولمقارنة دقة المعادلة، تم توليد بيانات تجريبية باستخدام برمجية (Wingen2)، تم معادلة درجات الاختبارات باستخدام الدرجات الملاحظة في نظرية استجابة الفقرة كمعيار رئيسي للمعادلة. أظهرت النتائج أن حجم العينات الكبير يقلل من الخطأ المعياري للمعادلة ويقلل من البواقي المعيارية. كما أظهرت النتائج أن النماذج المختلفة في صعوبتها تميل قيم الخطأ المعياري وقيم RMSE إلى الانخفاض عندما تختلف مستويات الصعوبة فيها، والنماذج المتشابهة في صعوبتها تميل قيم الخطأ المعياري وقيم RMSE إلى الارتفاع عندما تتشابه مستويات الصعوبة فيها. This study explored the effect of item difficulty and sample size on the accuracy of equating by using item response theory. This study used simulation data. The equating method was evaluated using an equating criterion (SEE, RMSE). Standard error of equating between the criterion scores and equated scores, and root mean square error of equating (RMSE) were used as measures to compare the method to the criterion equating. The results indicated that the large sample size reduces the standard error of the equating and reduces residuals. The results also showed that different difficulty models tend to produce smaller standard errors and the values of RMSE. The similar difficulty models tend to produce decreasing standard errors and the values of RMSE. |
---|---|
ISSN: |
2218-6506 |