ارسل ملاحظاتك

ارسل ملاحظاتك لنا







أثر حجم العينة وطول الاختبار والتفاعل بينهما على تقدير معلمة الصعوبة والتمييز والتخمين والخطأ المعياري باستخدام نظرية استجابة الفقرة

العنوان المترجم: The Effect of Sample Size, Test Length and Interaction Between Them on Estimating the Parameter of Difficulty, Discrimination, Guessing and Standard Error Using Item Response Theory
المصدر: مجلة كلية التربية
الناشر: جامعة طنطا - كلية التربية
المؤلف الرئيسي: الشمراني، محمد موسى (مؤلف)
المؤلف الرئيسي (الإنجليزية): Alshamrani, Mohammed Mousa
المجلد/العدد: مج64, ع4
محكمة: نعم
الدولة: مصر
التاريخ الميلادي: 2016
الشهر: اكتوبر
الصفحات: 264 - 306
ISSN: 1110-1237
رقم MD: 899281
نوع المحتوى: بحوث ومقالات
اللغة: العربية
قواعد المعلومات: EduSearch
مواضيع:
كلمات المؤلف المفتاحية:
حجم العينة | طول الاختبار | معلمة الصعوبة | معلمة التمييز | معلمة التخمين | نظرية استجابة الفقرة | Sample Size | Length of the Test | Difficulty Parameter | Discrimination Parameter | Guessing Parameter | Item Response Theory
رابط المحتوى:
صورة الغلاف QR قانون

عدد مرات التحميل

146

حفظ في:
المستخلص: هدفت هذه الدراسة إلى فحص أثر حجم العينة وطول الاختبار والتفاعل بينهما على تقدير معلمة الصعوبة والتمييز والتخمين والخطأ المعياري باستخدام نظرية استجابة الفقرة، ولتحقيق أهداف الدراسة تم توليد بيانات من الاستجابات الثنائية (0.1) لعينات تحاكي عينات المجتمع الأصلي بطريقة مونتي كارلو (Monte carlo) بحجوم عينات وأطوال اختبار مختلفة وذلك باستخدام برنامج (Wengen3) بحيث يتراوح أحجام العينات من 100 إلى 1032 مفحوص، وتم استخدام ثلاث مستويات لحجم العينة وهي (200) حالة و 600، 1000 حالة، كما تم استخدام ثلاث مستويات لطول الاختبار وهي، 30 ، 40، 60 فقرة. وتوصلت نتائج الدراسة إلى وجود فروق ذات دلالة إحصائية عند تقدير متوسطات معلمة للصعوبة تعزى لاختلاف حجم العينة، كما لا يوجد فروق ذات دلالة إحصائية بين متوسطات تقدير معلمة الصعوبة تعزى لاختلاف طول الاختبار، كما لا يوجد أثر دال للتفاعل بين حجم العينة وطول الاختبار على تقدير متوسط معلمة الصعوبة. وكانت الفروق لصالح حجم العينة (200) في مقابل حجم العينة (600) و (1000) وأظهرت النتائج أن الأخطاء المعيارية تزداد عندما تقل حجم العينة. كما توصلت نتائج الدراسة إلى وجود فروق ذات دلالة إحصائية عند تقدير معلمة التمييز تعزى أيضاً إلى اختلاف أحجام العينات، وكانت الفروق لصالح حجم العينة (600) ولصالح حجم العينة (1000)، أن معلمة التمييز تزداد بازدياد حجم العينة. كما أظهرت نتائج الدراسة عدم وجود فروق ذات دلالة إحصائية بين متوسطات تقديرات معلمة التمييز تعزى إلى طول الاختبار. كما لا يوجد أثر دال للتفاعل بين حجم العينة وطول الاختبار على تقدير متوسط معلمة التمييز، أشارت النتائج إلى أن تقدير معامل التمييز يزداد بزيادة حجم العينة وكذلك بزيادة طول الاختبار على العكس من تقدير معامل الصعوبة. كما توصلت نتائج الدراسة إلى وجود فروق ذات دلالة إحصائية عند تقدير معلمة التخمين تعزى إلى حجم العينة، وكذلك إلى وجود فروق ذات دلالة إحصائية عند تقدير معلمة التخمين تعزى إلى طول الاختبار، قد كانت لصالح حجم العينة (200) وهذا يعني أن معامل التخمين يزداد كلما قل حجم العينة، كما أشارت النتائج أن قيمة معامل التخمين ترتفع كلما قل عدد مفردات الاختبار، وقدمت الدراسة مجموعة من التوصيات.

This study aimed at examining the effect of the sample size and the length of the test on the estimation of the parameters of difficulty, discrimination, guessing and standard error using the Item Response Theory. In order to fulfill the objectives of the study, data were generated from the binary responses (0.1) of sample simulating the samples of the original population using Monte Carlo’s method with different sample sizes and test lengths. Wengen3 procedure was used here such that the sample sizes are in the range of 100-1032 participants. Three sample size levels were used, namely 200, 600 and 1000 cases, along with three test length levels, namely, 30, 40 and 60 items. The findings of the study demonstrated that there were statistically significant differences in the estimation of the difficulty parameter averages that may be attributed to the differences in the sample sizes; while there were no statistically significant differences in the estimation of the difficulty parameter averages that may be attributed to the differences in the test lengths. Furthermore, there was no statistically significant effect on the estimation of the difficulty parameter averages that may be attributed to the interaction between the sample size and the length of the test. These differences were in favor of the sample size of 200 relative to those of 600 and 1000. The findings also indicated that the standard errors increase with decrease in the sample size. On the other hand, the study found statistically significant differences in the estimation of the discrimination parameter that may be attributed to the differences in the sample sizes; and the differences were in favor of the sample sizes 600 and 1000; and also that the discrimination increases with increase in the sample size. However, the findings of the study did not find any statistically significant differences in the estimation of the distinction parameter averages that may be attributed to the test lengths, while there was no statistically significant effect on the estimation of the distinction parameter averages that may be attributed to the interaction between the sample size and the length of the test. The study indicated that the estimation of the distinction parameter increases with increase in the sample size contrary to the estimation of the difficulty parameter. On the other hand, the findings demonstrated that there were statistically significant differences in the estimation of the guessing parameter that may be attributed to the differences in the sample sizes, as well as statistically significant differences in the estimation of the guessing parameter that may be attributed to the differences in the test lengths. These differences were in favor of the sample size of 200, which means that the guessing parameter increases with decrease in the sample size, and that the guessing parameter increases with decrease in the number of the test items. Finally, the study presented some recommendations.

ISSN: 1110-1237