المستخلص: |
هدفت الدراسة إلى الكشف عن اللاتغير في تقدير معالم فقرات الاختيار من متعدد عندما تطبق في سياقات مختلفة، ولتحقيق أهداف الدراسة تم الاعتماد على اختبار مكون من (113) فقرة من نوع الاختيار من متعدد في مادة الرياضيات بالإضافة إلى (١٥) فقرة مشتركة طبق على عينة تكونت من ٢٥١١ طالب وطالبة. وباستخدام البرامج المناسبة في تحليل البيانات تبين أن معايرة الفقرات ضمن الإطار الكلي للاختبار وعندما حللت لوحدها يؤدي إلى وجود استقرار في تقدير معالم الفقرات وهذه النتيجة متحققة لمعالم الفقرة الثلاثة: التمييز والصعوبة، والتخمين تبعا لاختلاف النموذج والسياق باستثناء تقدير معلمة التمييز تبعا لاختلاف النموذج فقد وجدت فروق ذات دلالة إحصائية لصالح النموذج الثلاثي مقارنة مع النموذج الثنائي. كما أظهرت قيم معامل الارتباط بين تقديرات معالم الفقرة: التمييز والصعوبة والتخمين التي تمت معايرتها بصورة مستقلة وضمن الإطار الكلي للاختبار أنها كانت عالية ودالة إحصائياً كما تبين أن قيم معاملات الارتباط كانت هي الأعلى عندما تمت معايرة الفقرات كعينة مستقلة (لوحدها) و يمكن التوصل من ذلك إلى انه يمكن الحصول علي دقة أفضل عند معايرة عينة من الفقرات بشكل مستقل مقارنة بمعايرتها ضمن الإطار الكلى للاختبار، وبناء على ذلك توصي الدراسة باستخدام عينه ممثلة من الفقرات بعدد قليل من الفقرات في الاختبارات التكيفية وإجراء المزيد من الدراسات باستخدام دالة المعلومات كما توصي باستخدام النموذج الثلاثي عند معايرة الفقرات. \
The study aims to study the Invariance of multiple-choice item parameters estimates when applied in different contexts. To achieve the goals of the study, the researcher used a test consisting of (113) items multiple-choice type in mathematics in addition to (15) common items applied on a sample of 2511 students. Using the suitable software to analyze data, the results of the analysis showed that the items calibration within all items of the test, when analyzed alone, leads to invariance in the items parameters estimate and this result achieved for the flowing items parameters: Discrimination and difficulty, and guessing depending on the different model and contexts, except estimating a discrimination parameter depending on the different model, has been found. There were significant differences in favor of the Three-parameter model compared with two-parameter model. As shown by the values the correlation coefficient between the estimates of items parameters: Discrimination and the difficulty and guessing that has been calibrated independently and within the all items of the test they were high and statistically significant as shown by the values correlation coefficients were high when it was calibrated item sample independently (alone). This value can be reached from that we get better accuracy when calibrating a sample of items independently compared within calibrating within the all items of the test. Based on the results of the study, it was recommended to use a representative sample of items with a few items in the tests of adaptive and further studies using a information function also recommends using the Three-parameter Model, when we calibrate the items and when we design and development the item banking. \
|